Dados e Distribuição
Imagine que você seja um professor ensinando uma introdução ao curso de psicologia. No final do semestre, todos os 100 alunos concluem um exame final com 100 questões de múltipla escolha. As pontuações que seus alunos receberam são as seguintes:
Observando os dados, você pode dizer que a pontuação mais alta que um aluno recebeu foi 100% e a pontuação mais baixa foi 60%. O que você pode não saber apenas olhando para a tabela é que os dados são normalmente distribuídos.
O que é distribuição normal?
Uma distribuição normal é uma curva de distribuição de frequência em forma de sino. A maioria dos valores de dados em uma distribuição normal tende a se agrupar em torno da média. Quanto mais longe um ponto de dados está da média, menos provável é que ocorra. Existem muitas coisas, como inteligência, altura e pressão arterial, que seguem naturalmente uma distribuição normal. Por exemplo, se você pegasse a altura de cem mulheres de 22 anos e criasse um histograma plotando a altura no eixo x, e a frequência com que cada uma das alturas ocorria no eixo y, você obteria um distribuição normal.
Características da distribuição normal
Aqui, vemos as quatro características de uma distribuição normal. As distribuições normais são simétricas , unimodais e assintóticas , e a média , mediana e moda são todas iguais.
Uma distribuição normal é perfeitamente simétrica em torno de seu centro. Ou seja, o lado direito do centro é uma imagem espelhada do lado esquerdo. Também existe apenas um modo, ou pico, em uma distribuição normal. As distribuições normais são contínuas e têm caudas assintóticas, o que significa que elas se aproximam, mas nunca tocam o eixo x. O centro de uma distribuição normal está localizado em seu pico, e 50% dos dados estão acima da média, enquanto 50% estão abaixo. Conclui-se que a média, mediana e moda são todos iguais em uma distribuição normal.
Percentis
Agora, olhe para a linha que diz desvios padrão (DP) . Você pode ver que 34,13% dos dados estão entre 0 SD e 1 SD. Visto que uma distribuição normal é perfeitamente simétrica, segue-se que 34,13% dos dados estão entre -1 DP e 0 DP. Se você continuar a somar as porcentagens, verá que em ambos os lados:
- Aproximadamente 68% dos dados estão dentro de 1 DP da média
- Aproximadamente 95% dos dados estão dentro de 2 DP da média
- Aproximadamente 99,7% dos dados estão dentro de 3 DP da média
Isso é conhecido como regra empírica .
Você pode localizar a média no gráfico usando a linha de porcentagem cumulativa? A média está na marca de 50%. Isso indica que 50% dos dados estão abaixo da média. A linha de ‘porcentagem cumulativa’ se refere à porcentagem de dados que fica à esquerda do valor.
Exemplo
Vejamos um histograma usando as notas do exame final dos 100 alunos. É perfeitamente simétrico no centro. Metade dos alunos pontuou abaixo de 80% e a outra metade acima, então 80% é a mediana. Não por coincidência, 80% é a pontuação de maior ocorrência; 20 alunos em 100 acertaram 80%.
Se você olhar para o histograma, também verá que a pontuação média é de 80%. Portanto, a média, a mediana e o modo são todos iguais. Há apenas um pico no gráfico, então os dados são unimodais. Também podemos ver que as extremidades finais dos gráficos chegam muito perto de zero, mas nunca o alcançam.
Um desvio padrão é igual a 10 e a média é 80%. Usando a regra empírica, podemos assumir que:
- Aproximadamente 68% dos dados estão entre 70% e 90%
- Aproximadamente 95% dos dados estão entre 60% e 100%
- Aproximadamente 99,7% dos dados estão entre 50% e 100%. Sabemos que você não pode pontuar mais do que 100% em um exame, caso contrário, seria 110%
Resumo da lição
A distribuição normal é uma distribuição de frequência em forma de sino. As distribuições normais são simétricas, unimodais e assintóticas, e a média, mediana e moda são todas iguais. Distribuições normais também seguem a regra empírica. Isso significa que cerca de 68% dos dados estão dentro de 1 DP da média, 95% dos dados estão dentro de 2 DP da média e 99,7% dos dados estão dentro de 3 DP da média.
Resultados de Aprendizagem
Depois de terminar, você deverá ser capaz de:
- Lembre-se de qual é a distribuição normal de dados
- Liste as características da distribuição normal
- Explique o que a regra empírica significa