Biología

O coeficiente de correlação: definição, fórmula e exemplo

Decodificando o Coeficiente de Correlação

Rachel está conduzindo pesquisas para sua aula de psicologia. Ela está observando os padrões de frequência dos alunos nas aulas de educação geral do primeiro ano. Ela registrou o número de faltas entre cinco alunos, o número de aulas que eles estão assistindo, a média de faltas por classe, o total de faltas em todas as classes e o número médio de trabalhos dados em cada classe. Seu professor quer que ela encontre uma correlação entre essas variáveis ​​usando o coeficiente de correlação. Rachel dá uma olhada na equação:

Pearson R

Uau, esta é uma equação intimidante! Rachael não tem ideia de por onde quer começar com esse problema. Não se preocupe! Nesta lição, você aprenderá sobre o coeficiente de correlação e como usá-lo para encontrar correlações na pesquisa de Rachael.

Definindo Coeficiente de Correlação

Você provavelmente sabe que uma correlação é o relacionamento entre dois conjuntos de variáveis ​​usados ​​para descrever ou prever informações. Portanto, o coeficiente de correlação é o grau em que a mudança em um conjunto de variáveis ​​está relacionada. Isso significa que estamos tentando descobrir se as duas variáveis ​​têm alguma correlação, quão forte é a correlação e se a correlação é positiva ou negativa. Confira nossas outras lições para obter mais informações sobre correlações positivas e negativas!

Para encontrar a correlação exata entre as variáveis, você precisará usar a equação do coeficiente de correlação. Quando resolvida, a equação do coeficiente de correlação fornecerá um número entre -1 e 1. Quanto mais próximo o número estiver de um positivo, mais forte será a correlação positiva. Quanto mais próximo o número estiver de um negativo, mais forte será a correlação negativa. E quanto mais próximo o número estiver de zero, mais fraca será a correlação. Zero significa que não há correlação entre as variáveis. Vamos quebrar essa equação para que seja mais fácil de entender.

Usando Coeficiente de Correlação, Numerador

Acima está a equação do coeficiente de correlação, também conhecida como Pearson r. Vamos dividir cada parte da equação para torná-la mais gerenciável. Lembre-se de que os dados que Rachael coletou estão na forma de duas variáveis: x e y . É importante lembrar disso à medida que usamos a equação do coeficiente de correlação.

Por enquanto, vamos nos concentrar apenas na parte superior desta equação. A primeira coisa que você vê nesta equação é n , o que significa o número de pares ordenados. Vejamos os dados que Rachel coletou:

numerador

Lembre-se de que Rachel coletou dados sobre cinco pessoas. Nesta tabela, observe que há cinco pares ordenados. Portanto, on para este conjunto de dados é 5.

Em segundo lugar, o símbolo E que você vê nesta equação significa soma. Isso significa que você precisará adicionar todos os números que seguem a soma. Vamos dar uma olhada na próxima parte da equação antes de entrarmos mais na soma. A terceira parte desta equação é xy . Isso significa que você precisará multiplicar cada valor de x e cada valor de y juntos no conjunto de dados. Vamos dar uma olhada em nossos dados para entender melhor esse conceito:

numerador 2

Eu adicionei uma coluna à mesa de Rachel e a rotulei de xy . Agora posso multiplicar cada valor x com cada valor y em cada linha para criar um novo valor para esta coluna. Para a linha um, obtenho o valor 8, porque x é 4 ey é 2 para esse par ordenado. Agora, observe que adicionei uma linha abaixo dos valores na parte inferior da tabela com o símbolo de soma. Precisamos somar todos os valores em cada coluna para obter a soma de cada valor. Para a primeira coluna, a soma de x , adicionei 4 + 4 + 6 + 5 + 4 = 23. Fiz o mesmo processo para as outras colunas desta tabela.

Ok, vamos voltar à nossa equação. Agora, o quarto e o quinto itens nesta equação devem fazer um pouco mais de sentido. O quarto item aqui é a soma dos valores x , que é o valor no qual estávamos trabalhando no conjunto de dados de Rachel. O quinto item é a soma dos valores de y , que seria 9, o valor da segunda coluna de nossa tabela. Agora vamos dar uma olhada em como os valores ficariam em nossa equação.

numerador com números conectados

Você pode ver cada um dos itens da equação, substituídos pelos valores correspondentes de nossa tabela. O numerador, ou topo, de nossa equação é assim: 5 (44) – (23) (9). OK! Eu acho que isso é possível! Usando a ordem das operações, podemos resolver esta equação e determinar que o número superior no coeficiente de correlação é 13.

Agora, vamos dar uma olhada na parte inferior desta equação!

Usando coeficiente de correlação, denominador

Quando focamos apenas na parte inferior da equação, você provavelmente começará a ver alguns itens semelhantes nesta parte da equação como vimos no topo. Primeiro, on , mais uma vez, representa o número de pares ordenados, que no caso de Rachel é 5.

Em segundo lugar, o próximo item nesta equação é a soma dos valores de x ^ 2. Então, dê uma olhada em nossa tabela:

tabela denominadora

Observe que adicionei uma quarta e uma quinta colunas à tabela de Rachel. Desta vez, temos x ^ 2 ey ^ 2. Para obter os x valores -squared, você terá que tomar o valor de x e quadrado-lo na mesma linha. Por exemplo, o primeiro valor x na primeira linha, primeira coluna é 4, então nosso valor x ^ 2 seria 16. Teríamos o mesmo valor para a linha 2. Linha 3, primeira coluna é 6, então nosso x- quadrado o valor seria 36 e assim por diante.

Você fará a mesma coisa para os valores de y ^ 2. O valor da primeira linha e da segunda coluna para y é 2, portanto, o valor de y ^ 2 seria 4. Observe na última linha, eu calculei a soma para os valores de x quadrados adicionando 16 + 16 + 36 + 25 + 16 = 109. O valor de soma para y- quadrado é 4 + 1 + 9 + 4 + 1 = 19.

Os próximos itens do Pearson r exigem que você tenha um conhecimento sólido da ordem das operações. O terceiro item é a soma dos valores x , ao quadrado. Que, como você verá em um momento, é diferente da soma dos valores de x ^ 2. Os parênteses entre ax e os dois fazem uma grande diferença!

O quarto item é o número de pares ordenados e o quinto item é a soma dos valores de y ^ 2. Por último, o sexto item é a soma dos valores y , ao quadrado. Vamos usar os valores que encontramos em nossa tabela e aplicá-los a esta equação.

Inseri os valores de nossa tabela nesta parte da equação. Agora, temos uma equação que diz: a raiz quadrada de ((5 * 109) – (23 ^ 2)) ((5 * 19) – (9 ^ 2)).

Vamos seguir um passo de cada vez para resolver! A primeira coisa que farei nesta equação é multiplicar 5 por 109, o que me dá 545. Depois ao quadrado 23, que me dá 529. Em seguida, multiplique 5 e 19, que me dá 95. Em seguida, encontre o quadrado de 9 , que é 81. Em seguida, subtraia 529 de 545, que é 16. Agora, subtraia 81 de 95, que é 14. Finalmente, multiplique 16 por 14, que é 224, e tire a raiz quadrada. Nosso número para o denominador desta equação é aproximadamente 14,97.

Agora, podemos resolver o último desta equação pegando o primeiro número, 13, e dividindo-o pelo nosso segundo número, 14,97. 13 / 14,97 é aproximadamente 0,88. Isso nos diz que, de acordo com as informações recolhidas por Rachael, existe uma forte correlação positiva entre o número de aulas que um aluno frequenta e o número médio de faltas por aula.

Resumo da lição

A equação do coeficiente de correlação pode ser uma equação intimidante até que você a decifre. Uma correlação é a relação entre dois conjuntos de variáveis ​​usados ​​para descrever ou prever informações, e o coeficiente de correlação é o grau em que a mudança em um conjunto de variáveis ​​está relacionada.

Lembre-se de que, quando resolvida, a equação do coeficiente de correlação fornecerá um número entre -1 e 1. Quanto mais próximo o número estiver de um positivo, mais forte será a correlação positiva. Quanto mais próximo o número estiver de um negativo, mais forte será a correlação negativa. E quanto mais próximo o número estiver de zero, mais fraca será a correlação. Zero significa que não há correlação entre as variáveis.

Antes de tentar resolver esta equação novamente, primeiro crie uma tabela com todos os valores que você precisa, incluindo x , y , x * y , x ^ 2, y ^ 2 e as somas de cada um. Em seguida, trabalhe a parte superior e inferior das equações separadamente para se manter organizado e não se sobrecarregar. Lembre-se de que o n representa o número de pares ordenados e o E está pedindo a soma dos valores. Mantenha-se organizado com a ordem das operações: há uma diferença entre os valores ao quadrado de xe a soma de x ^ 2. Agora, pratique o que sabe sobre esta equação com um pequeno teste!

Resultados de Aprendizagem

Aproveite a oportunidade para realizar essas tarefas assim que a lição terminar:

  • Definir correlação e coeficiente de correlação
  • Interprete a equação do coeficiente de correlação
  • Trabalhe as partes superior e inferior (numerador e denominador) da equação do coeficiente de correlação
  • Reconhecer a importância da ordem das operações