Pares correspondentes de teste de hipóteses
O que é um par? São algumas coisas que estão de alguma forma associadas: um par de meias, um par de crianças, um par de maçãs. O que é uma correspondência? É algo que se assemelha a outra coisa de uma forma ou de outra. Uma chave corresponde a uma fechadura. Um par de calças combina com alguns sapatos.
Nas estatísticas, as amostras emparelhadas ou combinadas são termos sinônimos para duas amostras dependentes, aquelas em que o valor dos dados de cada amostra é coletado da mesma fonte. Ou seja, eles dependem um do outro de alguma forma. Esta lição aborda um exemplo de teste de hipótese de pares correspondentes.
O que são dados pareados?
Antes de prosseguir. Deixe-me dar um exemplo claro real de dados emparelhados, ou amostras correspondentes, e dependência no mundo das estatísticas.
Digamos que queremos saber mais sobre a frequência cardíaca média de 20 pacientes após terem passado por um protocolo de tratamento que consiste em tomar medicamentos. Esses 20 pacientes têm sua freqüência cardíaca registrada antes (amostra um) e depois (amostra dois) de concluírem a terapia. Embora obtenhamos duas amostras em tal cenário, o valor dos dados em cada amostra tem um valor de dados correspondente pertencente à mesma pessoa na outra amostra. É por isso que são amostras dependentes ou combinadas.
Em outras palavras, se ambos os valores de dados correspondentes vêm da mesma fonte, as amostras são consideradas emparelhadas ou combinadas. Em nosso exemplo, cada pessoa tem dois valores de dados e, como vêm da mesma fonte, são dados emparelhados.
A Equação Importante
Para descobrir se há uma diferença significativa entre os pares combinados, precisamos saber a seguinte equação.
Como é realmente uma mistura de símbolos estranhos, vamos definir o que todos eles significam antes de usar um exemplo para melhor entendê-los.
Nossa estatística de teste é t . d é a média das diferenças emparelhadas em nossa amostra. mu d é a média das diferenças emparelhadas para toda a população. s d é o desvio padrão das diferenças emparelhadas na amostra, e n refere-se ao número total de amostras diferenças emparelhadas.
Exemplo
Agora estamos prontos para o rock and roll! Vamos usar o seguinte exemplo: Uma empresa envia seus funcionários a um psicólogo para ver se ele consegue aumentar o número de vendas. A tabela a seguir mostra os números de vendas (em milhares de dólares) para os funcionários no período de um mês antes e depois das sessões com o psicólogo.
Funcionário 1 | Funcionário 2 | Funcionário 3 | Funcionário 4 | Funcionário 5 | Funcionário 6 | |
---|---|---|---|---|---|---|
Antes | 10 | 8 | 15 | 38 | 60 | 90 |
Depois de | 14 | 9 | 16 | 42 | 80 | 83 |
d | -4 | -1 | -1 | -4 | -20 | 7 |
Embora você possa ter que calcular isso sozinho em um teste usando seu conhecimento de outras lições, para acelerar as coisas, calcularei os seguintes valores para você:
- d = -3,833
- s d = 8,886
- n = 6 (já que temos seis funcionários)
Usando um nível de significância de um por cento (0,01), podemos chegar à conclusão de que os números médios de vendas mensais para todos os vendedores aumentam depois que eles recebem treinamento do psicólogo? Suponha que a população em questão tenha uma distribuição normal.
Primeiras coisas primeiro. Vamos descobrir quais são nossas hipóteses. A hipótese nula é simplesmente que mu d = 0, implicando que as vendas mensais médias não aumentam, e a hipótese alternativa é que mu d <0, implicando que as vendas mensais médias aumentam. Este último é assim porque estamos subtraindo a segunda amostra, aquela com valores médios de vendas mensais aumentados, da primeira amostra, que tem valores menores, e assim esperamos um valor menor que 0 se o psicólogo fez uma diferença real. Uma vez que assumimos que a hipótese nula é verdadeira, isso significa que mu d em nossa equação é 0 e, portanto, irrelevante.
Em seguida, basta conectar e chug os números que dei antes, a fim de chegar a uma resposta de t = -1,057. Uma vez que a hipótese alternativa afirma que mu d <0, isso implica que temos um teste de cauda esquerda.
Em seguida, determinamos os graus de liberdade em nosso cenário, onde df = n – 1 = 6 – 1 = 5. Usando uma tabela protegida por direitos autorais na parte de trás de seu livro de estatísticas, o nível de significância e os graus de liberdade, você descubra que o valor crítico é igual a -3,365.
Isso significa que nossa resposta de -1,057 não cai na região de rejeição e falhamos em rejeitar a hipótese nula. Nosso psicólogo não parece ter feito nenhuma diferença significativa nos números de vendas dos funcionários da empresa!
Resumo da lição
Então, aí está, um exemplo de teste de hipótese de pares combinados. Amostras emparelhadas ou combinadas são termos sinônimos para duas amostras dependentes. Em outras palavras, se ambos os valores de dados correspondentes vêm da mesma fonte, as amostras são consideradas emparelhadas ou combinadas. Em nosso exemplo, cada pessoa tem dois valores de dados e, como vêm da mesma fonte, são dados emparelhados.
Examinamos um exemplo disso usando a seguinte equação. Você deve ser capaz de realizar cálculos simples usando esta equação sozinho.