II AULA REMOTA DE MATEMÀTICA (2ª Unidade)
Professora: Evany de Carvalho 3° ano A
Link de videoaula sugerida: https://www.youtube.com/watch?v=451SxriwdvM
Distribuição de Frequência
Organização dos dados
Os métodos utilizados para organizar dados compreendem o
arranjo desses dados em subconjuntos que apresentem características similares. Mesma
idade (ou “faixa etária”), mesma finalidade, mesma escola, mesmo bairro, etc.
Os dados agrupados
podem ser resumidos em tabelas ou gráficos e, a partir desses, podemos obter as
estatísticas descritivas já definidas: média, mediana, desvio, etc.
Dados organizados em grupos ou categorias/classes são
usualmente designados “distribuição de frequência”.
Distribuição de frequência
Uma distribuição de
frequência é um método de se agrupar dados em classes de modo a fornecer a
quantidade (e/ou a percentagem) de dados em cada classe.
Com isso, podemos resumir e visualizar um conjunto de
dados sem precisar levar em conta os valores individuais.
Uma distribuição de
frequência (absoluta ou relativa) pode ser apresentada em tabelas ou
gráficos.
Uma distribuição de frequência agrupa os dados por classes
de ocorrência, resumindo a análise de conjunto de dados grandes.
Distribuição de frequência.
Vamos continuar estudando as notas entregues por um
professor apresentadas acima. Para estudarmos melhor a variável, construiremos
uma tabela apresentando os valores de maneira mais resumida. Com os dados
organizados em um rol, identificamos que existem repetições de muitos valores.
Essa repetição recebe o nome de frequência. Vejamos:
Tabela 16: Exemplo
Notas |
Frequência |
Notas |
Frequência |
|
Notas |
Frequência |
|
||
1,5 |
1 |
5,0 |
3 |
|
8,0 |
2 |
|
||
2,5 |
2 |
5,2 |
1 |
|
8,5 |
1 |
|
||
2,6 |
1 |
5,4 |
1 |
|
8,8 |
1 |
|
||
2,9 |
1 |
5,6 |
1 |
|
9,5 |
1 |
|
||
3,0 |
2 |
6,3 |
2 |
|
9,7 |
1 |
|
||
3,5 |
2 |
6,6 |
2 |
|
9,8 |
1 |
|
||
3,7 |
1 |
6,8 |
1 |
|
9,9 |
1 |
|
||
3,8 |
1 |
7,0 |
1 |
|
10,0 |
3 |
|
||
4,0 |
2 |
7,5 |
1 |
|
|||||
4,9 |
1 |
7,8 |
2 |
|
3,5 |
2 |
6,6 |
2 |
|
9,8 |
1 |
|
|||
3,7 |
1 |
6,8 |
1 |
|
9,9 |
1 |
|
|||
3,8 |
1 |
7,0 |
1 |
|
10,0 |
3 |
|
|||
4,0 |
2 |
7,5 |
1 |
|
Total:
40 |
|||||
4,9 |
1 |
7,8 |
2 |
|
|
|||||
Dispor os dados dessa maneira é melhor do que da forma
anterior, mas ainda é inconveniente, porque exige muito espaço. Uma alternativa
é agrupar os dados. Para desenvolver tal tarefa, é comum, em primeiro lugar,
distribuir os dados em classes ou categorias em uma tabela. Essa tabela
receberá o nome de distribuição de frequência ou tabela de frequência.
Para construir a
tabela de frequência das notas, consideraremos, por exemplo, quatro classes: da
nota 0,0 até a nota 4,9 (0,0–4,9); da nota 5,0 até a nota 6,9 (5,0–6,9); da
nota 7,0 até a nota 8,9 (7,0–8,9); por fim, da nota 9,0 até a nota 10,0 (9,0–
10,0). Agrupando os dados dessa maneira,
é comum chamá-los de dados agrupados. Vejamos:
A tabela de distribuição de frequência é uma tabela como outra qualquer, mas que apresenta o número de repetição dos
valores ao invés de repeti-los integralmente. Por exemplo, ao invés de expor 2, 2,
2 ,2 e 3, em uma tabela de
frequência colocamos 2 (4 vezes) e 3.
Notas de 40 alunos de uma disciplina |
|
Notas |
Número de estudantes (frequência) |
0,0-4,9 |
14 |
5,0-6,9 |
11 |
7,0-8,9 |
8 |
9,0-10,0 |
7 |
|
Total: 40 |
A distribuição de frequência, acima, apresenta uma
disposição mais amigável. Nela, podemos observar que 14 alunos tiraram notas
entre 0,0 e 4,9; 11 alunos, entre 5,0 e 6,9; 8 alunos, entre 7,0 e 8,9; 7 alunos,
entre 9,0 e 10,0. Identifica-se, de imediato, a maior e a menor concentração
das notas dos alunos e essa é uma informação muito interessante.
Aprofundamento: regras para a elaboração de uma distribuição
de frequência
Na construção de uma distribuição de frequência, a
determinação do número de classes e da amplitude dessas classes é sempre uma
preocupação.
No nosso exemplo anterior, as classes escolhidas não foram
de manei- ra aleatória, mas, de qualquer
forma, existem regras que podem ser observadas se quisermos maior rigor no
estudo de um evento.
Assim, Spiegel (1975, p. 45-46) sugere as seguintes regras
gerais:
1.Determinam-se o maior e o menor número de dados brutos e,
então, calcula-se a amplitude total do rol (diferença entre maior e o menor
daqueles números).
2.Divide-se a amplitude total em um número conveniente de
intervalos de classe que tenham a mesma amplitude. Nem sempre isso é possível;
nesse caso, usamos intervalos de classe de amplitudes diferentes. O número de
intervalo de classes é nor- malmente entre 5 e 20, dependendo dos dados.
3.Os intervalos de classe são escolhidos de maneira que seus
pontos médios coincidam com dados realmente observados. Isso tende a diminuir
erros.
4.Determina-se o número de observações que caem dentro de
cada intervalo de classe, isto é, calculam-se as frequências de classe.
Seguindo as regras gerais acima, que alterações teríamos no nosso exercício das
notas?
Bem, primeiro, vamos calcular a diferença entre o maior e o
menor número: 10,0 – 1,5 = 8,5. Isso significa que entre a maior nota e a menor
nota há uma distância de 8,5. Essa é a amplitude total, isto é, os valores
variam, no máximo, 8,5. De outra forma, a distância do menor valor para o maior
valor é de 8,5. OK!
Agora, na segunda etapa das regras acima, vamos escolher o
número de intervalos de classe. Vamos tentar o menor número sugerido:
5.Se quero 5 classes e minha amplitude total é 8,5, basta
dividir a amplitude total pelo número de classes escolhido para determinar os
intervalos de classe. Assim,
Intervalo de classes = amplitude total = 8,5 = 1,7 = 2
total de classes 5
Definições
1) Dados Brutos:
Conjunto de dados que ainda não foram numericamente organizados, obtidos após a crítica dos valores.
2) Rol: É um arranjo
dos dados brutos em ordem crescente.
3) Amplitude Total
(AT): É a diferença entre o maior e o menor valor observado.
4) Frequência (fi): É
o número de observações que se encontra presente em uma classe ou intervalo
especifico.
AT = Maior valor – Menor valor
5) Frequência
percentual (fi%): Representa o percentual de um certo valor na amostra.
fi%=(fi /n)x100
6) Frequência
acumulada (fai): É a soma das frequências simples das classes ou dos valores
anteriores.
fai = f1 + f2 + ... + fi
7) Frequência
percentual acumulada (fai%): É a soma das frequências relativas percentual das
classes ou dos valores anteriores.
fai%= f1% + f2% + ... + fi% fai%= (fai /n)x100
Dados brutos e rol
Na unidade anterior, trabalhamos com exposição de dados.
Mas, infelizmente, os dados, raramente, apresentam-se organizados. Por exemplo,
vamos supor que um professor entregue as notas de seus alunos, conforme a
Tabela 14, abaixo:
Tabela 14: Exemplo de tabela
primitiva
Notas de 40 alunos de uma disciplina |
|||||||||
8,0 |
5,0 |
3,0 |
3,5 |
4,0 |
10,0 |
5,6 |
3,0 |
2,5 |
1,5 |
9,5 |
7,5 |
6,3 |
6,6 |
7,8 |
4,0 |
2,5 |
5,0 |
7,0 |
8,0 |
10,0 |
9,8 |
9,7 |
3,5 |
3,8 |
5,0 |
3,7 |
4,9 |
5,4 |
6,8 |
6,3 |
7,8 |
8,5 |
6,6 |
9,9 |
10,0 |
2,6 |
2,9 |
5,2 |
8,8 |
Observe que, nesta tabela, as notas não estão numericamente
organizadas. Este tipo de tabela denomina-se tabela primitiva (CRESPO, 1995, p.
54). Partindo desta tabela, é difícil identificar o comportamento das notas,
isto é: onde se concentram? Qual a maior? Qual a menor? Quantos alunos estão
abaixo ou acima de uma determinada nota?
Esses dados estão, de fato, desorganizados e, por isso,
vamos organizá-los. A maneira mais simples é realizando uma ordenação(crescente
ou decrescente). Após essa ordenação dos dados, a tabela recebe o nome de rol.
Veja como fica:
Tabela 15: Exemplo de rol
Notas de 40 alunos de uma disciplina |
|||||||||
1,5 |
2,9 |
3,5 |
4,0 |
5,0 |
6,3 |
6,8 |
7,8 |
8,8 |
9,9 |
2,5 |
3,0 |
3,7 |
4,9 |
5,2 |
6,3 |
7,0 |
8,0 |
9,5 |
10,0 |
2,5 |
3,0 |
3,8 |
5,0 |
5,4 |
6,6 |
7,5 |
8,0 |
9,7 |
10,0 |
2,6 |
3,5 |
4,0 |
5,0 |
5,6 |
6,6 |
7,8 |
8,5 |
9,8 |
10,0 |
De fato, com os dados
assim organizados, podemos saber, com facilidade, qual a menor nota (1,5) e
qual a maior (10,0). E, também, podemos encontrar a amplitude de variação, isto
é, a diferença entre o maior valor e o menor valor: 10,0 – 1,5 = 8,5. Além
dessas informações, com um pequeno esforço, podemos ainda identificar que as
notas se concentram em dois valores (5,0 e 10,0) e que 6,0 é o valor que divide
as notas. Convém destacar que os dados são úteis, apenas, se conseguirmos
transformá-los em informação. Mais à frente, discutiremos essas medidas.
Enfim,
Dados brutos são aqueles
que não foram numericamente organizados e rol é um arranjo de dados numéricos brutos
em ordem: crescente ou decrescente. Em um rol, a diferença entre o maior e o
menor número chama-se amplitude total. (SPIEGEL, 1975, p. 43).