Significância estatística: definição, níveis e regiões críticas

Definição

Houve um grande rebuliço há alguns anos que acusou as vacinas de causar autismo. (As vacinas são uma forma fraca de infecção administrada às pessoas para evitar que contraiam a infecção total. O autismo é um distúrbio generalizado do desenvolvimento que se caracteriza por dificuldades de socialização e comunicação e acredita-se que afete mais de 1 em 100 pessoas.) É claro que isso é ridículo, já que se descobriu que a estrutura do cérebro das pessoas com autismo é diferente da de outras pessoas. Nenhum tiro simples poderia alterar o cérebro de uma pessoa assim. No entanto, algumas pessoas ainda não sabiam disso e surtaram.

Meu motivo para trazer isso à tona é para mostrar como a compreensão dos testes de significância, junto com seus testes estatísticos, é necessária. Estatisticamente significativo significa que a relação nos resultados não ocorreu por acaso. A maioria dos pesquisadores trabalha com amostras , definidas como uma seção da população. Uma população é definida como a coleção completa a ser estudada. Como um pesquisador não está olhando para todos, existe a possibilidade de que eles colham, por acidente, uma amostra que os levará a conclusões errôneas. Para evitar isso, quase todos os testes estatísticos procuram significância estatística.

Usando nosso exemplo de autismo e vacina, depois que vários testes foram conduzidos, os pesquisadores descobriram que não havia relação. Eles puderam fazer essa afirmação com confiança porque seus resultados foram estatisticamente significativos, apesar de usarem uma amostra. Portanto, embora não tenham testado todas as pessoas que receberam a vacina, os pesquisadores não encontraram nenhuma relação entre aqueles que receberam a vacina e aqueles que foram diagnosticados com autismo.

P-Value

Ao executar um teste estatístico, você calculará um valor p , que é definido como o valor do nível de significância. Este valor será representado por um decimal, em qualquer lugar entre 1,0 e abaixo de 0,01. Este valor irá informá-lo sobre a probabilidade de a hipótese nula , ou a previsão de que não há relacionamento, ser verdadeira.

O nível comumente aceito do valor p para que a relação seja estatisticamente significativa é 0,05. Isso significa que 1 em 20 vezes seus resultados serão positivos, apesar de não haver uma relação real. Em nosso exemplo do autismo, haverá alguns estudos que encontrarão conexões significativas entre o autismo e as vacinas. Isso significa que 1 em 20 vezes os resultados serão positivos com base na probabilidade pura e não porque existe uma relação estatística.

De onde vem esse 0,05? Qual é o valor p ? É derivado da observação da curva do sino e do exame da força do relacionamento e da probabilidade de não haver relacionamento. De volta ao nosso exemplo de autismo / vacina – se eu fosse criar alguns dos valores- p , eles poderiam ser 0,03, 0,001 e 0,5. Listei três, e todos eles são inventados. Os dois primeiros, 0,03 e 0,001, seriam estatisticamente significativos. O 0,5 não seria estatisticamente significativo.

Regiões Críticas

A significância estatística vem da curva do sino. Em um teste estatístico, você está procurando ver se há uma relação entre os números. Essa relação pode ser na forma de pontuações semelhantes, como uma correlação, ou diferentes, como um teste- t . Ao testar a significância, você está testando seus dados para ver se seu valor cai na região crítica , definida como o valor estatístico que permitirá rejeitar a hipótese nula.

Isso significa que, ao realizar um teste estatístico, você obterá um valor p . Se o número cair na área das regiões críticas, sua relação é estatisticamente significativa e você pode rejeitar a hipótese nula. Isso ocorre porque, nas regiões críticas, você está testando para ver se a relação entre suas pontuações é forte o suficiente. Se a relação for fraca, então sua pontuação cairá na área de hipótese nula e não será estatisticamente significativa.

As regiões críticas constituem os 5% principais, ou 0,05, das respostas possíveis. Se a relação for fraca, é provável que qualquer resultado obtido seja o resultado de um erro de coleta. Se a relação for forte, então você pode dizer com alguma segurança que mesmo que haja um erro de coleta, os resultados ainda estão nos informando que existe uma relação. Por que .05 foi escolhido? Porque em 1 em 20 vezes, os resultados estarão errados e fornecerão um tipo específico de erro que foi considerado aceitável. Vamos agora explorar esses erros.

Erro

E se você terminar com um resultado que é estatisticamente significativo no papel, mas na verdade não é? Isso pode ser devido a um erro de amostragem ou um acaso nos números. E se você não encontrar resultados, mas realmente houver?

Um erro de tipo I é dito que ocorrem quando uma hipótese nula é rejeitada incorretamente. Se você se lembra, uma hipótese nula afirma que não há relacionamento. Portanto, se você rejeitou incorretamente uma hipótese nula, está efetivamente dizendo: ‘Sim, existe um relacionamento’, quando na verdade não existe. Um erro do tipo I é visto como muito mais prejudicial e perigoso do que o outro tipo de erro em que entraremos. Isso ocorre porque os cientistas geralmente tomam decisões e trabalham sob o pressuposto de que tudo está certo. É como pisar em uma ponte, mas a ponte não está realmente lá.

Um erro do tipo II é dito que ocorrem quando um investigador falhar para rejeição da hipótese nula. Isso se traduz em um pesquisador não encontrar um relacionamento quando um realmente existe. Isso é como não querer descer do penhasco porque você acha que não há nada lá, quando na verdade há. Um erro do tipo II não é visto como tão grave quanto um erro do tipo I porque os pesquisadores eventualmente podem encontrá-lo em seus testes.

Resumo da lição

Estatisticamente significativo significa que a relação nos resultados não ocorreu por acaso. Como os pesquisadores trabalham com amostras , definidas como seções da população, e não com populações , definidas como a coleção completa a ser estudada, existe a chance de erro amostral.

Para garantir que isso não aconteça, um valor p , definido como o valor do nível de significância, é calculado para garantir que a hipótese nula , ou a previsão de que não há relacionamento, seja corretamente rejeitada. Isso normalmente é definido em 0,05. Baseia-se nas regiões críticas , definidas como o valor estatístico que permitirá rejeitar a hipótese nula.

No entanto, há alguma chance de que a hipótese nula não seja rejeitada corretamente. Um erro de tipo I é dito que ocorrem quando uma hipótese nula é rejeitada incorretamente. Um erro de tipo II é dito que ocorrem quando uma hipótese nula incorretamente não é rejeitada.

Resultado de aprendizagem

Depois de assistir a esta lição, você será capaz de definir estatisticamente significativo e explicar como os pesquisadores evitam erros de amostragem.