Correlação vs. Causalidade
Brandy trabalha em uma loja de roupas. Enquanto ela está reabastecendo as prateleiras, ela percebe que os suéteres sumiram completamente. Ela vai até a área de estoque da loja e encontra as caixas de suéteres. Nesse ínterim, ela recebe uma ligação: outro de seus colegas de trabalho está ligando dizendo que está doente. Essa é a terceira pessoa esta semana! Enquanto ela reabastece os suéteres, Brandy tem uma ideia. As vendas de suéteres estão fazendo com que seus colegas de trabalho fiquem doentes? Brandy se depara com um problema comum, correlação versus causalidade.
Nesta lição, você aprenderá sobre correlação e causalidade, as diferenças entre as duas e quando saber se algo é uma correlação ou causalidade.
Primeiro, correlação e causalidade precisam de uma variável independente e dependente. Uma variável independente é uma condição ou dado em um experimento que pode ser controlado ou alterado. Uma variável dependente é uma condição ou parte dos dados em um experimento que é controlada ou influenciada por um fator externo, na maioria das vezes a variável independente.
Se houver uma correlação, então às vezes podemos assumir que a variável dependente muda apenas porque as variáveis independentes mudam. É aqui que ocorre o debate entre correlação e causalidade. No entanto, há uma diferença entre causa e efeito (causalidade) e relacionamento (correlação). Às vezes, essas áreas podem ser confusas e confusas durante a análise de dados.
Definindo Correlação
Você provavelmente sabe que uma correlação é o relacionamento entre dois conjuntos de variáveis usados para descrever ou prever informações. Há uma ênfase aqui no relacionamento. Às vezes, podemos usar a correlação para encontrar causalidade, mas nem sempre. Lembre-se de que a correlação pode ser positiva ou negativa.
O gráfico 1 é chamado de correlação positiva , onde as variáveis dependentes e as variáveis independentes em um conjunto de dados aumentam ou diminuem juntas.
Isso significa que há uma relação positiva entre o número de suéteres vendidos na loja da Brandy e a frequência de doenças que ocorrem com os colegas de trabalho da Brandy.
Se os números tiverem uma inclinação para baixo, como a linha no Gráfico 2, então você tem um conjunto de dados com uma correlação negativa , onde as variáveis dependentes e independentes em um conjunto de dados aumentam ou diminuem em oposição uma à outra.
Isso significa que se as variáveis independentes diminuíssem, a variável dependente aumentaria e vice-versa. Neste exemplo, Brandy nota que quanto mais shorts são vendidos, menos doenças existem, mas mais tempo de férias seus colegas de trabalho usam.
Portanto, a questão é: a venda de shorts ou suéteres causa doenças ou férias? Você deve ter adivinhado que não é a roupa que está causando essa mudança; essas coisas são apenas correlacionadas, mas não causa e efeito.
Definindo Causalidade
A causa , também conhecida como causa e efeito, é quando um evento ou ação observada parece ter causado um segundo evento ou ação. Por exemplo, comprei um edredom de cama novo e coloquei-o na máquina de lavar para ser limpo. Depois de limpar o edredom, minha máquina de lavar parou de funcionar. Posso supor que a primeira ação, lavar o edredom, causou a segunda ação, máquina de lavar quebrada.
Brandy decide reorganizar o estoque em seu andar. Ela coloca a roupa e os calçados esportivos em um local de destaque na loja, coloca a roupa de banho ao lado da caixa registradora e muda o traje de negócios para um local menos visível. Nas semanas seguintes, ela nota uma mudança em seus funcionários. Eles são mais ativos, comem mais saudáveis e fazem caminhadas nas pausas. A roupa esportiva em um local de destaque pode fazer com que os funcionários tenham motivação para serem mais saudáveis? Ela tenta um experimento, trocando a roupa atlética pela roupa profissional. Nas semanas seguintes, Brandy não nota uma mudança no comportamento dos funcionários. Ela pergunta a eles o que os fez repentinamente querer malhar e viver um estilo de vida mais saudável. Foi o desgaste atlético? Não, eles dizem a ela.
Identificando Correlação ou Causação
Infelizmente, não existe uma forma comprovada e verdadeira de identificar a causa. Podemos encontrar muitas correlações na pesquisa, mas a causalidade geralmente requer um experimento separado. Por exemplo, Brandy não sabia se o desgaste atlético era a causa ou apenas uma correlação até que reorganizou o inventário uma segunda vez. No entanto, você pode identificar instâncias de causa provável. Vejamos alguns exemplos.
Brandy percebeu que está tendo problemas para manter certos tamanhos de estoque de calçados. Nos tamanhos seis e sete, ela frequentemente fica sem sapatos de salto alto para as mulheres. Nos tamanhos oito e nove, ela frequentemente fica sem calçados esportivos para mulheres. Brandy percebe isso e se pergunta se ter um determinado tamanho de pé torna a pessoa mais atlética. Dadas as informações, essa é uma causa provável? Pause o vídeo aqui se precisar revisar as informações e pensar sobre sua resposta.
Então, o que você acha? O tamanho do pé de uma pessoa é uma causa de sua habilidade atlética? Não; dadas as informações, só podemos dizer que se trata de uma correlação, especialmente porque os tamanhos em ambos os tipos de calçados são tamanhos comuns de pés femininos.
Ok, vamos tentar outro. Brandy está tendo problemas para vender uma camisa nova no estoque da loja. Ela percebe que as pessoas que compram a camisa a retiram da prateleira e muitos a devolvem em poucos dias. Ela também percebe que a camisa costuma estar pendurada na prateleira de descarte do provador. Brandy levanta a hipótese de que algo está acontecendo quando os clientes experimentam a camisa. Mais tarde, ela pede a alguns funcionários que experimentem a camisa; todos relatam que a camisa tem um forro que coça e eles não gostam. Brandy acredita que esse é o motivo da falta de vendas da camisa. Dadas as informações, essa é uma causa provável? Pause o vídeo aqui se precisar revisar as informações e pensar sobre sua resposta.
Então, o que você acha? O forro áspero é a causa provável das vendas ruins? Dadas as informações, isso provavelmente é verdade. Existe uma correlação entre as vendas baixas da camisa e a frequência com que ela é encontrada na prateleira de descarte. Mas essa informação por si só não é suficiente para determinar a causa. Brandy teve que dar um passo adiante para reunir mais informações.
Resumo da lição
Você encontrará correlação e causalidade na vida cotidiana, como aprendemos com as experiências de Brandy. Uma correlação é o relacionamento entre dois conjuntos de variáveis usadas para descrever ou prever informações. Uma correlação pode ser positiva ou negativa. Uma correlação positiva ocorre quando as variáveis dependentes e independentes em um conjunto de dados aumentam ou diminuem juntas. Uma correlação negativa ocorre onde as variáveis dependentes e variáveis independentes em um conjunto de dados aumentam ou diminuem em oposição uma à outra.
Às vezes, quando há uma correlação, você pode pensar que encontrou uma causa. A causa , também conhecida como causa e efeito, é quando um evento ou ação observada parece ter causado um segundo evento ou ação. Lembra quando Brandy estava reorganizando as roupas no departamento? Ela achava que as roupas esportivas eram provavelmente a causa das rotinas de condicionamento físico de sua funcionária, mas acabou sendo a exibição do maiô. Falando nisso … Acho melhor ir para a academia.
Resultados de Aprendizagem
Depois de terminar esta lição, você será capaz de:
- Definir correlação e causalidade
- Diferencie entre correlações positivas e negativas
- Explique por que é difícil determinar a causa