Coeficiente de correlação de Pearson
O coeficiente de correlação de Pearson é uma fórmula estatística muito útil que mede a força entre variáveis e relacionamentos. No campo das estatísticas, essa fórmula é freqüentemente chamada de teste R de Pearson . Ao conduzir um teste estatístico entre duas variáveis, é uma boa ideia conduzir um valor de coeficiente de correlação de Pearson para determinar o quão forte é a relação entre essas duas variáveis.
Fórmula
Para determinar o quão forte é a relação entre duas variáveis, uma fórmula deve ser seguida para produzir o que é referido como o valor do coeficiente . O valor do coeficiente pode variar entre -1,00 e 1,00. Se o valor do coeficiente estiver na faixa negativa, isso significa que a relação entre as variáveis está negativamente correlacionada ou, conforme um valor aumenta, o outro diminui. Se o valor estiver na faixa positiva, isso significa que a relação entre as variáveis está positivamente correlacionada ou ambos os valores aumentam ou diminuem juntos. Vejamos a fórmula para conduzir o valor do coeficiente de correlação de Pearson.
Etapa um: Faça um gráfico com seus dados para duas variáveis, rotulando as variáveis ( x ) e ( y ), e adicione mais três colunas rotuladas ( xy ), ( x ^ 2) e ( y ^ 2). Um gráfico de dados simples pode ter a seguinte aparência:
Pessoa | Idade ( x ) | Pontuação ( y ) | ( xy ) | ( x ^ 2) | ( y ^ 2) |
---|---|---|---|---|---|
1 | |||||
2 | |||||
3 |
Mais dados seriam necessários, mas apenas três amostras são mostradas para fins de exemplo.
Etapa dois: complete o gráfico usando a multiplicação básica dos valores das variáveis.
Pessoa | Idade ( x ) | Pontuação ( y ) | ( xy ) | ( x ^ 2) | ( y ^ 2) |
---|---|---|---|---|---|
1 | 20 | 30 | 600 | 400 | 900 |
2 | 24 | 20 | 480 | 576 | 400 |
3 | 17 | 27 | 459 | 289 | 729 |
Etapa três: depois de multiplicar todos os valores para completar o gráfico, some todas as colunas de cima para baixo.
Pessoa | Idade ( x ) | Pontuação ( y ) | ( xy ) | ( x ^ 2) | ( y ^ 2) |
---|---|---|---|---|---|
1 | 20 | 30 | 600 | 400 | 900 |
2 | 24 | 20 | 480 | 576 | 400 |
3 | 17 | 27 | 459 | 289 | 729 |
Total | 61 | 77 | 1539 | 1265 | 2029 |
Etapa quatro: use esta fórmula para encontrar o valor do coeficiente de correlação de Pearson.
Etapa cinco: Depois de completar a fórmula acima, inserindo todos os valores corretos, o resultado é o valor do coeficiente! Se o valor for um número negativo, então há uma correlação negativa da força do relacionamento, e se o valor for um número positivo, então há uma correlação positiva da força do relacionamento. Nota: Os exemplos acima mostram apenas dados para três pessoas, mas o tamanho de amostra ideal para calcular um coeficiente de correlação de Pearson deve ser superior a dez pessoas.
Exemplos
Digamos que você esteja analisando a relação entre a idade de seus participantes e o nível de renda relatado. Você está curioso para saber se existe uma relação positiva ou negativa entre a idade de alguém e seu nível de renda. Depois de conduzir o teste, o valor do coeficiente de correlação de Pearson é +0,20. Portanto, você teria uma correlação ligeiramente positiva entre as duas variáveis, de modo que a força da relação também é positiva e considerada forte. Você pode concluir com segurança que há uma forte relação e correlação positiva entre a idade e a renda de uma pessoa. Em outras palavras, conforme as pessoas envelhecem, sua renda tende a aumentar também.
Talvez você esteja interessado em aprender mais sobre a força do relacionamento do índice de ansiedade de seus participantes e o número de horas que trabalham por semana. Depois de realizar o teste, o valor do coeficiente de correlação de Pearson é -0,08. Portanto, você teria uma correlação negativa entre as duas variáveis e a força da relação seria fraca. Você pode concluir com segurança que há uma relação fraca e correlação negativa entre o índice de ansiedade de uma pessoa e quantas horas por semana ela relatou trabalhar. Portanto, aqueles que pontuaram alto em ansiedade tenderiam a relatar menos horas de trabalho por semana, enquanto aqueles que tiveram pontuação mais baixa em ansiedade tenderiam a relatar mais horas de trabalho a cada semana.
Significado
Uma discussão sobre o coeficiente de correlação de Pearson não estaria completa se não falássemos sobre significância estatística . Na realização de testes estatísticos, a significância estatística deve estar presente para estabelecer uma probabilidade dos resultados sem erro.
O símbolo estatístico de significância é denotado como p . O p significa probabilidade . No campo das ciências sociais, o valor associado a p é geralmente definido para representar 0,05 ou menos. O que isto significa? Definir um valor p em 0,05 ou inferior significa que há menos chance de erro. Este sistema de relatório de erros (probabilidade) estabelece significância estatística e precisão entre os resultados dos testes estatísticos.
Se o valor p resultar em 0,04, haverá uma chance ainda menor de erro nos resultados. Quanto menor o valor p , mais precisa é a significância estatística e menor a chance de erro. Idealmente, você deseja que seus testes estatísticos resultem em um valor p tão pequeno quanto possível. Você deve encontrar a significância estatística para continuar avançando conduzindo o coeficiente de correlação de Pearson.
Resumo da lição
O coeficiente de correlação de Pearson , frequentemente referido como o teste R de Pearson , é uma fórmula estatística que mede a força entre variáveis e relacionamentos. Para determinar o quão forte é a relação entre duas variáveis, você precisa encontrar o valor do coeficiente , que pode variar entre -1,00 e 1,00. Se o valor do coeficiente estiver na faixa negativa, isso significa que a relação entre as variáveis está negativamente correlacionada – conforme um valor aumenta, o outro diminui. Se o valor estiver na faixa positiva, isso significa que a relação entre as variáveis está positivamente correlacionada ou ambos os valores aumentam ou diminuem juntos.
A fórmula para conduzir o valor do coeficiente de correlação de Pearson segue estas etapas:
- Faça um gráfico com seus dados para duas variáveis, rotulando as variáveis ( x ) e ( y ), e adicione mais três colunas rotuladas ( xy ), ( x ^ 2) e ( y ^ 2).
- Complete o gráfico usando a multiplicação básica dos valores das variáveis.
- Depois de multiplicar todos os valores para completar o gráfico, some todas as colunas de cima para baixo.
- Use esta fórmula para encontrar o valor do coeficiente de correlação de Pearson.
- Depois de completar a fórmula acima inserindo todos os valores corretos, o resultado é o valor do seu coeficiente!
Resultados de Aprendizagem
Quando terminar, você deverá ser capaz de:
- Indique a finalidade do coeficiente de correlação de Pearson
- Lembre-se de outro nome para o coeficiente de correlação de Pearson
- Explicar como determinar se duas variáveis estão negativamente ou positivamente correlacionadas
- Indique a fórmula do coeficiente de correlação de Pearson
- Descreva a significância estatística e o que significam os valores p