Matemática

Variabilidade nas estatísticas: definição e medidas

O que é uma variabilidade?

Imagine que você está ministrando um curso de psicologia e deseja examinar o desempenho de seus alunos nos exames de meio e final. As notas de seus alunos são as seguintes:

dados do aluno

Observe que há treze alunos na classe e as notas do meio e final são listadas para cada aluno. Observe que há apenas um aluno que recebeu a mesma nota tanto no exame intermediário quanto no final. Agora você deseja saber se as pontuações dos alunos em cada exame são semelhantes entre si ou se as pontuações estão distribuídas. Isso é chamado de variabilidade.

A variabilidade se refere a quão espalhado é um grupo de dados. Em outras palavras, a variabilidade mede o quanto suas pontuações diferem umas das outras. A variabilidade também é conhecida como dispersão ou propagação. Conjuntos de dados com valores semelhantes apresentam pouca variabilidade, enquanto conjuntos de dados com valores espalhados apresentam alta variabilidade.


O conjunto de dados B é mais amplo e mais espalhado do que o conjunto de dados A. Isso indica que o conjunto de dados B tem mais variabilidade.
exemplo de variabilidade

Medidas de Variabilidade

O intervalo é a medida mais simples de variabilidade. Você pega o menor número e o subtrai do maior número para calcular o intervalo. Isso mostra a disseminação de nossos dados. O intervalo é sensível a outliers , ou valores que são significativamente maiores ou menores do que o resto do conjunto de dados, e não deve ser usado quando outliers estão presentes.

Vamos calcular a faixa para as notas do exame de meio de semestre. As notas intermediárias listadas em ordem numérica são mostradas aqui. Como a faixa é igual à nota mais alta do meio de semestre menos a nota mais baixa do meio do semestre, podemos facilmente encontrar a faixa para este conjunto de dados. Conectando 100 para nossa nota intermediária mais alta e 52 para nossa classe intermediária mais baixa, descobrimos que a faixa é igual a 100 menos 52 ou 48.

  • Intervalo = nota intermediária mais alta menos nota intermediária mais baixa
  • Faixa = 100 – 52 = 48

Medidas de Variabilidade: IQR

Então, que medida de variabilidade podemos usar ao trabalhar com conjuntos de dados que contêm outliers? Uma solução é usar o intervalo interquartil (IQR) . O IQR, ou meio-cinquenta, é o intervalo para meio-cinquenta por cento dos dados. O IQR considera apenas os valores médios, por isso não é afetado pelos outliers.

  • IQR = Q3 -Q1

Para calcular o IQR, use as seguintes etapas:

1) Liste os dados em ordem numérica. Listar os dados em ordem numérica é necessário para encontrar o intervalo e a mediana.

2) Encontre a mediana. Em um conjunto de dados ímpares, a mediana é o valor médio que divide os dados pela metade. Por exemplo, em um conjunto de 13 dados, a mediana é o número na sétima posição. Em um conjunto de dados pares, a mediana é a média dos dois valores intermediários. Para este conjunto de dados, a mediana é 85.

3) Coloque colchetes ao redor dos números acima e abaixo da mediana, mas não em torno da mediana. Os colchetes separarão a mediana de Q1 e Q3. Portanto, para as notas intermediárias, nossos dados agora serão assim.

4) Localize os quartis. Para as notas intermediárias, Q1 é 52, 55, 71, 75, 81, 83. E Q3 é 89, 90, 90, 99, 100, 100.

5) Encontre a mediana dos dados em Q1. Temos um número par de pontos de dados no primeiro trimestre, então nossa mediana será a média dos dois números do meio. Em outras palavras, somamos 71 a 75 e dividimos a soma por 2. A mediana é 73. E esse é nosso valor Q1.

6) Encontre a mediana dos dados em Q3. Para encontrar a mediana, repita o que foi feito para Q1, mas com os valores em Q3. Podemos descobrir que Q3 é 94,5.

7) Encontre o intervalo interquartil usando a fórmula IQR = Q3 – Q1. Conectando 73 para Q1 e 94,5 para Q3, descobriremos que IQR = 94,5 – 73 = 21,5. Portanto, o intervalo interquartil para este conjunto de dados é 21,5.

Medidas de Variabilidade: Variância

A variância é uma medida de quão próximas as pontuações no conjunto de dados estão da média. A variação é usada principalmente para calcular o desvio padrão e outras estatísticas. Existem quatro etapas para calcular a variação. Vamos usar as notas do exame de meio de semestre novamente, mas desta vez vamos calcular a variação.

Dê uma outra olhada em nossos dados intermediários.

1) Encontre a média do conjunto de dados. Para encontrar a média, some para obter a soma de todos os números no conjunto de dados. Divida a soma por 13. A média das notas do exame de meio de semestre é 82,31.

2) Subtraia a média de cada valor no conjunto de dados. Para fazer isso, subtraia 82,31 de cada número no conjunto de dados. Por exemplo, a pontuação do aluno é 71 e 71 menos 82,31 é 11,31 negativo. Continue subtraindo 82,31 de cada número no conjunto de dados.

3) Agora eleve ao quadrado cada um dos valores para que você tenha todos os valores positivos. Por exemplo, a diferença que obtivemos antes foi negativa 11,31. Esse número ao quadrado nos dá 127,86. Continue a elevar ao quadrado cada valor e, em seguida, some os valores quadrados. A soma dos valores quadrados é 2922,77.

4) Finalmente, divida a soma dos quadrados pelo número total de valores no conjunto para encontrar a variância. Este conjunto de dados tem 13 números, então divida a soma das diferenças quadradas por 13. A variância é 2922,77 dividido por 13, ou 224,83.

variabilidade de médio prazo

Medida de Variabilidade: Desvio Padrão

A raiz quadrada da variância é conhecida como desvio padrão . Assim como a variância, o desvio padrão mede a proximidade das pontuações no conjunto de dados da média. No entanto, o desvio padrão é medido exatamente na mesma unidade do conjunto de dados. Vamos encontrar o desvio padrão das notas do exame de meio de semestre.

  • Desvio padrão = raiz quadrada da variância

Com as notas do exame de meio de semestre, a variação foi de 224,83. A raiz quadrada de 224,83 = 14,99.

  • Desvio padrão = raiz quadrada de 224,83 = 14,99

Encontrando Variabilidade: Interpretando os Dados

Vamos praticar o cálculo do intervalo, IQR, variância e desvio padrão usando as notas do exame final no gráfico.

Ao encontrar o intervalo , lembre-se de primeiro listar os dados em ordem numérica. Em seguida, subtraímos o menor valor do maior valor. O intervalo é o maior número no conjunto de dados subtraído do menor, que é 100 – 69 ou 31.

Para encontrar o IQR , primeiro temos que encontrar a mediana e localizar Q1 e Q3. Para o conjunto de dados mostrado, 88 é a mediana. Em seguida, separe os quartis com colchetes. Depois de determinar Q1 e Q3, encontre as medianas desses quartis que serão nossos valores para Q1 e Q3. Em cada quartil, procure os dois números do meio, pois cada quartil possui um conjunto de dados par. Devemos descobrir que Q1 = 79 e Q3 = 98. Agora podemos inserir Q1 e Q3 na fórmula. Se subtrairmos a mediana para Q3 de Q1, teremos 98 – 79, ou 19 para o IQR.

Para encontrar a variação , comece encontrando a média para as notas do exame final e, em seguida, subtraia a média de cada valor no conjunto de dados. Em seguida, eleve ao quadrado cada valor e encontre a soma dos quadrados. Para encontrar a variância, divida a soma dos quadrados por 13. A variância para este conjunto de dados é 103,51.

variabilidade final

Para encontrar o desvio padrão , tudo o que precisamos fazer é calcular a raiz quadrada da variância. Como sabemos que a variância é 103,51, podemos calcular rapidamente o desvio padrão como sendo 10,17.

As notas intermediárias em comparação com as notas finais são assim: a variância de médio prazo é 224,83, a faixa é 48 e 14,99 é o desvio padrão. Para as notas finais, a variação é 103,51, 31 é o intervalo e 10,17 é o desvio padrão.

Portanto, depois de analisar as notas dos alunos, pode-se determinar que as notas intermediárias têm uma variação, intervalo e desvio padrão maiores do que as notas finais. Podemos concluir que as notas intermediárias apresentam mais variabilidade do que as notas finais. Também podemos concluir que as notas do exame final são mais semelhantes entre si do que as notas do meio do semestre.

Como as medidas de variabilidade são uma forma de estatística descritiva , elas só podem ser usadas para descrever os dados em nosso estudo. Eles não podem ser usados ​​para tirar conclusões ou fazer inferências que vão além de nosso conjunto de dados.

Resumo da lição

A variabilidade se refere a quão espalhado é um grupo de dados. As medidas comuns de variabilidade são o intervalo, IQR, variância e desvio padrão . Conjuntos de dados com valores semelhantes têm pouca variabilidade, enquanto conjuntos de dados com valores espalhados têm alta variabilidade. Ao trabalhar para encontrar a variabilidade, você também precisará encontrar a média e a mediana . As medidas de variabilidade são estatísticas descritivas que só podem ser usadas para descrever os dados em um determinado conjunto de dados ou estudo.

Pontos para lembrar

termos de variabilidade
  • Faixa : a medida mais simples de variabilidade; menor número subtraído do maior número para calcular o intervalo
  • Outliers : valores significativamente maiores ou menores do que o resto do conjunto de dados
  • IQR : considera apenas valores médios; não afetado pelos outliers
  • Variância : medida de quão próximas as pontuações no conjunto de dados estão da média
  • Desvio padrão : a raiz quadrada da variância
  • Estatística descritiva : só pode ser usada para descrever os dados em estudo
  • Média : a média do total em um conjunto de dados
  • Mediana : o valor médio de um conjunto de dados

Resultados de Aprendizagem

Conforme a lição sobre variabilidade estatística termina, você pode achar fácil:

  • Responda à pergunta: ‘O que é uma variabilidade?’
  • Determine como encontrar alcance e IQRs
  • Resolva para média e média
  • Identifique um desvio padrão