O que é um Z-Score?
Imagine que você esteja lidando com um conjunto de dados com um desvio padrão de 2. Lembre-se de que o desvio padrão é simplesmente uma medida de quão dispersa uma coleção de dados está em relação à média. Obviamente, muitos dos seus dados serão a média mais ou menos 2. Ainda mais estarão a dois desvios-padrão da média, então a média mais ou menos 4. Essa notação funciona muito bem quando o desvio padrão é sucinto. Afinal, 2 é um conceito muito fácil de entender.
Mas e se o seu desvio padrão fosse uma casa decimal muito pequena, como costuma acontecer na engenharia? Ou um número menos simples, como 593, como poderia ser em uma votação. Não seria bom ter uma unidade que mede o valor de algo em termos de desvios-padrão da média? Felizmente, temos exatamente essa ferramenta: o z-score. O z-score é uma medida de distância da média em termos de quantos desvios padrão ele é removido da média.
Revisão do Desvio Padrão
Mas espere, como você encontra o desvio padrão? Provavelmente, você já se lembra, mas se não o fizer, revisaremos isso rapidamente. Primeiro, pegue a média de todos os valores do conjunto. Em seguida, subtraia a média de cada valor e eleve ao quadrado cada diferença. Encontre a média da soma dessas diferenças e, em seguida, calcule a raiz quadrada desse número.
Por exemplo, digamos que você queira saber o desvio padrão da população das seguintes pontuações de teste: 98, 90, 86, 83 e 70. Primeiro, pegue a média, que resulta em 85,4. Em seguida, subtraia de cada pontuação. Você obtém os seguintes valores: 12,6, 4,6, 0,6, -2,4 e -15,4. Quadrado cada um deles, resultando em 158,76, 21,16, 0,36, 5,76 e 237,16. Some tudo isso e encontre a média deles, que acaba sendo 84,64. Em seguida, tire a raiz quadrada, que é 9,2.
Por que usar Z-Scores?
De longe, a maior vantagem de um z-score é sua brevidade. Quando digo para incluir todos os valores entre os escores z de -2 e 2, você sabe que quero incluir 95% dos valores. Isso porque dentro de dois desvios-padrão em cada lado da média estão 95% dos dados em um conjunto.
Seria muito fácil fazer isso com valores quando o desvio padrão é um número altamente regular, como 2, mas você poderia imaginar fazer isso quando o desvio padrão é 0,00487? Ou quando for 1.381? Você poderia pegar uma calculadora e descobrir que dois desvios padrão de 0,00487 são 0,00974 e os dois de 1.381 são 2.762. No entanto, isso introduz uma grande quantidade de erros potenciais. Os escores Z limitam esses erros, fornecendo uma resposta concisa. Com os escores z, você pode se preocupar com outras coisas, sem ter certeza de que 0,00974 é exatamente o dobro de 0,00487.
Como calcular um Z-Score
Como calcular o escore z é simplesmente encontrar algo em termos de desvio padrão, é uma fórmula relativamente simples. Primeiro, subtraia a média do valor em questão. Em seguida, divida a resposta pelo desvio padrão. Se você tem um valor em questão de 55, uma média de 30 e um desvio padrão de 20, você pegaria 55 e subtrairia 30. Isso deixa 25. Divida 25 pelo desvio padrão de 20 e você terminaria com 1,25. 1,25 é a pontuação z desse ponto de dados.
Às vezes, esse número pode sair negativo. Isso é bom; números negativos significam apenas que o z-score em questão é menor que a média. Em uma curva de distribuição normal, isso significa que está à esquerda do ponto alto da curva. Da mesma forma, os números positivos estão sempre à direita da curva.
Exemplos
Pode parecer que a matemática para esse tipo de coisa é bem simples, mas vamos fazer algumas perguntas para ter certeza de que a entendemos. Faremos um com um escore z positivo e outro com um escore z negativo.
Primeiro, digamos que você esteja tentando encontrar a pontuação z para a coleção de livros de um aluno. De acordo com seus dados, a coleção média de livros é 50, enquanto o desvio padrão é 10. O aluno em questão possui uma coleção de 75 livros. Qual é a primeira coisa que fazemos? Primeiro, subtraia a média do valor em questão. 75 menos 50 é 25. Em seguida, divida essa quantidade pelo desvio padrão. 25 dividido por 10 é 2,5. Isso significa que este aluno tem uma coleção de livros excepcionalmente grande.
Mas e seu colega de quarto? Digamos que a média permaneça igual em 50, enquanto o desvio padrão permanece igual em 10. No entanto, este aluno tem apenas 15 livros. Obviamente, é um número pequeno, mas qual é seu z-score? Primeiro, subtraia a média da quantidade. Isso significa 15 menos 50 ou -35. Divida -35 por 10 e você obtém -3,5. Esse é o z-score deste aluno. É estatisticamente interessante porque -3,5 é um número de desvios padrão da média. Talvez seu orientador acadêmico devesse conversar com ele?
Resumo da lição
Nesta lição, aprendemos como encontrar a pontuação z de um ponto de dados. O z-score é uma medida de distância da média em termos de desvios padrão. Lembre-se de que um desvio padrão é apenas uma medida de quão dispersa está uma coleção de dados.
Para encontrar a pontuação z, subtraia a média da quantidade em questão e, em seguida, divida pelo desvio padrão de todo o conjunto. Lembre-se de que os escores z negativos estão à esquerda da curva, enquanto os escores z positivos estão à direita.
Visão geral do desvio padrão
Desvio padrão | uma medida de quão dispersa uma coleção de dados está da média |
Z-score | uma medida de distância da média em termos de quantos desvios padrão ela é removida da média |
Encontrando o desvio padrão | pegue a média de todos os valores do conjunto; subtraia a média de cada valor e eleve ao quadrado cada diferença; encontre a média da soma dessas diferenças; então tire a raiz quadrada desse número |
Calculando Z-score | subtraia a média do valor em questão; divida a resposta pelo desvio padrão |
Resultados de Aprendizagem
Quando você chegar à conclusão da lição, mostre sua capacidade de:
- Defina o desvio padrão
- Resolva o desvio padrão
- Entenda a vantagem de usar z-scores
- Encontre a pontuação z, mostrando exemplos