Matemática

Coeficiente de Correlação de Pearson: Fórmula, Exemplo e Significância

Coeficiente de correlação de Pearson

O coeficiente de correlação de Pearson é uma fórmula estatística muito útil que mede a força entre variáveis ​​e relacionamentos. No campo das estatísticas, essa fórmula é freqüentemente chamada de teste R de Pearson . Ao conduzir um teste estatístico entre duas variáveis, é uma boa ideia conduzir um valor de coeficiente de correlação de Pearson para determinar o quão forte é a relação entre essas duas variáveis.

Fórmula

Para determinar o quão forte é a relação entre duas variáveis, uma fórmula deve ser seguida para produzir o que é referido como o valor do coeficiente . O valor do coeficiente pode variar entre -1,00 e 1,00. Se o valor do coeficiente estiver na faixa negativa, isso significa que a relação entre as variáveis ​​está negativamente correlacionada ou, conforme um valor aumenta, o outro diminui. Se o valor estiver na faixa positiva, isso significa que a relação entre as variáveis ​​está positivamente correlacionada ou ambos os valores aumentam ou diminuem juntos. Vejamos a fórmula para conduzir o valor do coeficiente de correlação de Pearson.

Etapa um: Faça um gráfico com seus dados para duas variáveis, rotulando as variáveis ​​( x ) e ( y ), e adicione mais três colunas rotuladas ( xy ), ( x ^ 2) e ( y ^ 2). Um gráfico de dados simples pode ter a seguinte aparência:

Pessoa Idade ( x ) Pontuação ( y ) ( xy ) ( x ^ 2) ( y ^ 2)
1
2
3

Mais dados seriam necessários, mas apenas três amostras são mostradas para fins de exemplo.

Etapa dois: complete o gráfico usando a multiplicação básica dos valores das variáveis.

Pessoa Idade ( x ) Pontuação ( y ) ( xy ) ( x ^ 2) ( y ^ 2)
1 20 30 600 400 900
2 24 20 480 576 400
3 17 27 459 289 729

Etapa três: depois de multiplicar todos os valores para completar o gráfico, some todas as colunas de cima para baixo.

Pessoa Idade ( x ) Pontuação ( y ) ( xy ) ( x ^ 2) ( y ^ 2)
1 20 30 600 400 900
2 24 20 480 576 400
3 17 27 459 289 729
Total 61 77 1539 1265 2029

Etapa quatro: use esta fórmula para encontrar o valor do coeficiente de correlação de Pearson.


Fórmula do coeficiente de correlação de Pearson
Correlação de Pearson

Etapa cinco: Depois de completar a fórmula acima, inserindo todos os valores corretos, o resultado é o valor do coeficiente! Se o valor for um número negativo, então há uma correlação negativa da força do relacionamento, e se o valor for um número positivo, então há uma correlação positiva da força do relacionamento. Nota: Os exemplos acima mostram apenas dados para três pessoas, mas o tamanho de amostra ideal para calcular um coeficiente de correlação de Pearson deve ser superior a dez pessoas.

Exemplos

Digamos que você esteja analisando a relação entre a idade de seus participantes e o nível de renda relatado. Você está curioso para saber se existe uma relação positiva ou negativa entre a idade de alguém e seu nível de renda. Depois de conduzir o teste, o valor do coeficiente de correlação de Pearson é +0,20. Portanto, você teria uma correlação ligeiramente positiva entre as duas variáveis, de modo que a força da relação também é positiva e considerada forte. Você pode concluir com segurança que há uma forte relação e correlação positiva entre a idade e a renda de uma pessoa. Em outras palavras, conforme as pessoas envelhecem, sua renda tende a aumentar também.

Talvez você esteja interessado em aprender mais sobre a força do relacionamento do índice de ansiedade de seus participantes e o número de horas que trabalham por semana. Depois de realizar o teste, o valor do coeficiente de correlação de Pearson é -0,08. Portanto, você teria uma correlação negativa entre as duas variáveis ​​e a força da relação seria fraca. Você pode concluir com segurança que há uma relação fraca e correlação negativa entre o índice de ansiedade de uma pessoa e quantas horas por semana ela relatou trabalhar. Portanto, aqueles que pontuaram alto em ansiedade tenderiam a relatar menos horas de trabalho por semana, enquanto aqueles que tiveram pontuação mais baixa em ansiedade tenderiam a relatar mais horas de trabalho a cada semana.

Significado

Uma discussão sobre o coeficiente de correlação de Pearson não estaria completa se não falássemos sobre significância estatística . Na realização de testes estatísticos, a significância estatística deve estar presente para estabelecer uma probabilidade dos resultados sem erro.

O símbolo estatístico de significância é denotado como p . O p significa probabilidade . No campo das ciências sociais, o valor associado a p é geralmente definido para representar 0,05 ou menos. O que isto significa? Definir um valor p em 0,05 ou inferior significa que há menos chance de erro. Este sistema de relatório de erros (probabilidade) estabelece significância estatística e precisão entre os resultados dos testes estatísticos.

Se o valor p resultar em 0,04, haverá uma chance ainda menor de erro nos resultados. Quanto menor o valor p , mais precisa é a significância estatística e menor a chance de erro. Idealmente, você deseja que seus testes estatísticos resultem em um valor p tão pequeno quanto possível. Você deve encontrar a significância estatística para continuar avançando conduzindo o coeficiente de correlação de Pearson.

Resumo da lição

O coeficiente de correlação de Pearson , frequentemente referido como o teste R de Pearson , é uma fórmula estatística que mede a força entre variáveis ​​e relacionamentos. Para determinar o quão forte é a relação entre duas variáveis, você precisa encontrar o valor do coeficiente , que pode variar entre -1,00 e 1,00. Se o valor do coeficiente estiver na faixa negativa, isso significa que a relação entre as variáveis ​​está negativamente correlacionada – conforme um valor aumenta, o outro diminui. Se o valor estiver na faixa positiva, isso significa que a relação entre as variáveis ​​está positivamente correlacionada ou ambos os valores aumentam ou diminuem juntos.

A fórmula para conduzir o valor do coeficiente de correlação de Pearson segue estas etapas:

  1. Faça um gráfico com seus dados para duas variáveis, rotulando as variáveis ​​( x ) e ( y ), e adicione mais três colunas rotuladas ( xy ), ( x ^ 2) e ( y ^ 2).
  2. Complete o gráfico usando a multiplicação básica dos valores das variáveis.
  3. Depois de multiplicar todos os valores para completar o gráfico, some todas as colunas de cima para baixo.
  4. Use esta fórmula para encontrar o valor do coeficiente de correlação de Pearson.
  5. Depois de completar a fórmula acima inserindo todos os valores corretos, o resultado é o valor do seu coeficiente!

Resultados de Aprendizagem

Quando terminar, você deverá ser capaz de:

  • Indique a finalidade do coeficiente de correlação de Pearson
  • Lembre-se de outro nome para o coeficiente de correlação de Pearson
  • Explicar como determinar se duas variáveis ​​estão negativamente ou positivamente correlacionadas
  • Indique a fórmula do coeficiente de correlação de Pearson
  • Descreva a significância estatística e o que significam os valores p