O que é desvio padrão?
O desvio padrão é a medida de quão próximos todos os dados no conjunto de dados cercam a média. O desvio padrão ajuda a identificar uma distribuição normal de dados, comparando a distância da média da variância de cada ponto de dados com a média. Uma distribuição normal de dados é representada quando a maioria dos dados é encontrada perto da média do conjunto.
Variância
Para calcular o desvio padrão, primeiro você precisa encontrar a variância. A variância de um conjunto de dados é a média de cada distância do quadrado médio.
Vejamos um exemplo de conjunto de dados e calculemos a variância. Na competição anual de pesca, havia 10 competidores que pescavam peixes. Cada participante pesou sua captura total e registrou seus pesos. Havia 10 competidores, e o peso total de seus peixes era 23 libras., 37 libras., 82 libras., 49 libras., 56 libras., 70 libras., 63 libras., 72 libras., 63 libras. e 45 libras.
O primeiro passo para calcular a variância é encontrar a média do conjunto de dados. Para calcular a média, vamos adicionar 23 + 37 + 82 + 49 + 56 + 70 + 63 + 72 + 63 + 45, que é igual a 560. Em seguida, dividir 560 ÷ 10 = 56. O peso médio dos peixes capturados foi de 56 lbs .
A próxima etapa para calcular a variância é subtrair a média de cada valor. A melhor maneira de configurar isso é em uma tabela. Olhando para a tabela, você pode adicionar uma coluna para a média para tornar a subtração mais fácil. Para obter esses totais, iremos subtrair:
- 23 – 56 = -33
- 37 – 56 = -19
- 82 – 56 = 26
- 49 – 56 = -7
- 56 – 56 = 0
- 70 – 56 = 14
- 63 – 56 = 7
- 72 – 56 = 16
- 63 – 56 = 7
- 45 – 56 = -11
A seguir, pegaremos cada uma dessas diferenças e as corrigiremos. Então, vamos calcular:
- -33 ^ 2 = 1.089
- -19 ^ 2 = 361
- 26 ^ 2 = 676
- -7 ^ 2 = 49
- 0 ^ 2 = 0
- 14 ^ 2 = 196
- 7 ^ 2 = 49
- 16 ^ 2 = 256
- 7 ^ 2 = 49
- -11 ^ 2 = 121
Finalmente, para calcular a variância, calcularemos a média de cada um desses totais quadrados. Para fazer isso, adicione 1.089 + 361 + 676 + 49 + 0 + 196 + 49 + 256 + 49 + 121 = 2.846. Em seguida, pegue o total, 2.846, e divida pelos 10 pontos de dados . 2.846 ÷ 10 = 284,6, então a variância desse conjunto de dados é 284,6.
Como Calcular o Desvio Padrão
Calcular o desvio padrão é simples, uma vez que encontramos a variância. Para encontrar o desvio padrão, vamos simplesmente calcular a raiz quadrada da variância. No exemplo anterior, nossa variação foi de 284,6. A raiz quadrada de 284,6 é 16,9 quando arredondada para a décima casa. O desvio padrão para o peso total dos peixes capturados foi de 16,9 libras.
Etapas para Encontrar o Desvio Padrão
Como você pode ver, encontrar o desvio padrão não é muito difícil. Há uma série de etapas específicas que devem ser realizadas para:
- Encontre a média de seu conjunto de dados.
- Subtraia a média de cada um dos pontos de dados.
- Pegue cada uma das diferenças e elimine-as.
- Encontre a variância , que é a média das diferenças quadradas.
- Calcule a raiz quadrada da variância, que é o desvio padrão.
Exemplo Parte 1
Vamos usar essas etapas específicas para trabalhar com outro exemplo. O proprietário de um café local queria fazer uma pesquisa para ver quantas xícaras de café cada visitante comprava em uma semana. Ele decidiu perguntar aos próximos 6 clientes que entraram na loja quantas xícaras de café eles haviam comprado. O primeiro cliente comprou 7 xícaras de café, o segundo cliente comprou 12 xícaras de café, o terceiro cliente comprou 6 xícaras de café, o quarto cliente comprou 4 xícaras de café, o quinto cliente comprou 7 xícaras de café, e o sexto cliente comprou 8 xícaras de café. O proprietário deseja saber quantos dos clientes compraram com pelo menos um desvio padrão do número médio de xícaras compradas.
Lembre-se de que a maneira mais fácil de calcular o desvio padrão é usar uma tabela. Você pode ver todas as informações facilmente configuradas em uma tabela.
O primeiro passo é calcular a média de nossos dados. Somando o número de xícaras adquiridas por cada um dos diferentes clientes, podemos ver que foram 44 xícaras de café vendidas aos seis clientes. Para encontrar a média, pegaremos 44 xícaras e dividiremos por 6 clientes, totalizando 7,3 xícaras de café por cliente. 44 ÷ 6 = 7,3. Portanto, a média do nosso conjunto de dados é 7,3 xícaras de café compradas por cliente. Portanto, vamos adicionar essas informações à nossa tabela. Como você pode ver, precisamos adicionar uma coluna apenas com nossa média para cada linha.
A segunda etapa é agora subtrair a média do número de xícaras compradas por cada cliente:
- 7 – 7,3 = -0,3
- 12 – 7,3 = 4,7
- 6 – 7,3 = -1,3
- 4 – 7,3 = -3,3
- 7 – 7,3 = -0,3
- 8 – 7,3 = 0,7
Registre esses valores em sua tabela.
A terceira etapa é corrigir cada uma das diferenças:
- -0,3 ^ 2 = 0,09
- 4,7 ^ 2 = 22,09
- -1,3 ^ 2 = 1,69
- -3,3 ^ 2 = 10,89
- -0,3 ^ 2 = 0,09
- 0,7 ^ 2 = 0,49
Registre esses valores em sua tabela.
A próxima etapa é calcular a variação. Para fazer isso, calcularemos a média dessas diferenças quadradas. Primeiro, adicionaremos essas diferenças quadradas: 0,09 + 22,09 + 1,69 + 10,89 + 0,09 + 0,49 = 35,34. Então pegamos 35,34 e dividimos por 6, que é igual a 5,89. A variação desse conjunto de dados é 5,89.
A última etapa para calcular o desvio padrão é encontrar a raiz quadrada da variância. A raiz quadrada de 5,89 é 2,4 para a casa décima mais próxima. Portanto, o desvio padrão das xícaras de café compradas é 2,4.
O que o desvio padrão pode me dizer sobre meus dados?
O desvio padrão pode nos ajudar a determinar se nossos dados são uma distribuição normal. Em uma distribuição normal, a maioria dos seus dados ficará dentro de um desvio padrão de sua média. Para calcular esse intervalo, você adicionará e subtrairá o desvio padrão da média.
No primeiro exemplo, o peso médio dos peixes capturados era de 56 libras. O desvio padrão foi de 16,9. Portanto, para encontrar o intervalo de onde estará a maioria das informações, adicionaremos e subtrairemos o desvio padrão da média: 56 + 16,9 = 72,9 e 56 – 16,9 = 39,1. Isso nos diz que a maioria dos dados para este conjunto estará entre 72,9 e 39,1, o que representa um desvio padrão da média.
Vamos examinar os dados do problema novamente e ver se a maioria dos dados está dentro de um desvio padrão. Olhando para a reta numérica , você pode ver que qualquer número que caia entre 39,1 e 72,9 estaria dentro de um desvio padrão de nossa média.
Vamos comparar os pesos totais dos peixes para ver quais valores estão dentro de um desvio padrão. O primeiro participante pegou 23 libras. de peixes, que não estaria dentro de um desvio padrão. O segundo participante pegou 37 libras. de peixes, que também não cairia dentro de um desvio padrão. O terceiro participante pegou 82, que é maior que 72,9, o que significa que não está dentro de um desvio padrão. No entanto, o restante de nossos pesos (49 lbs., 56 lbs., 70 lbs., 63 lbs., 72 lbs., 63 lbs. E 45 lbs.) Todos caem entre os valores 39,1 e 72,9, fazendo-os dentro de um desvio padrão .
Para encontrar o intervalo de dois desvios padrão, você deve adicionar e subtrair o desvio padrão do intervalo. Para calcular o intervalo de dois desvios padrão, você tomaria 39,1 – 16,9 = 22,2 e 72,9 + 16,9 = 89,8. O intervalo para dois desvios padrão seria de 22,2 a 89,8. Você pode ver isso facilmente nesta linha numérica.
Exemplo Parte 2
Vamos examinar o segundo exemplo e ver qual intervalo representaria um desvio padrão de nossa média. No segundo exemplo, o dono de nossa cafeteria queria encontrar o número médio de xícaras de café compradas por cada cliente em uma semana. O número médio de xícaras vendidas com base na pesquisa foi de 7,3. Os proprietários também encontraram um desvio padrão de 2,4.
Para encontrar o intervalo de um desvio padrão, adicionaremos e subtrairemos o desvio padrão à média: 7,3 + 2,4 = 9,7 e 7,3 – 2,4 = 4,9. Portanto, o intervalo de um desvio padrão de dados é de 4,9 a 9,7.
Podemos ver que todos os pontos de dados, exceto 12 xícaras de café e 4 xícaras de café, estão dentro de um desvio padrão. Para calcular o intervalo de dois desvios padrão, adicionaríamos / subtrairíamos o desvio padrão ao nosso intervalo existente: 9,7 + 2,4 = 12,1 e 4,9 – 2,4 = 2,5. Portanto, o intervalo para dois desvios padrão é de 12,1 a 2,5.
Resumo da lição
Mesmo que o desvio padrão possa parecer difícil, agora você deve ter as ferramentas para calcular o desvio padrão para qualquer conjunto de dados. Lembre-se de que o desvio padrão é a medida de quão próximos todos os dados no conjunto de dados cercam a média. Seguindo essas cinco etapas, você pode calcular facilmente o desvio padrão de qualquer conjunto de dados:
- Encontre a média de seu conjunto de dados.
- Subtraia a média de cada um dos pontos de dados.
- Pegue cada uma das diferenças e elimine-as.
- Encontre a variância , que é a média das diferenças quadradas.
- Calcule a raiz quadrada da variância, que é o desvio padrão.
Para verificar se um número está dentro de um desvio padrão de sua média, você precisará adicionar e subtrair o desvio padrão da média. Isso lhe dará um intervalo específico.
Resultado de aprendizagem
Ao assistir a esta lição, os alunos ficarão confiantes em sua capacidade de usar as etapas para encontrar o desvio padrão de qualquer conjunto de dados.