Biología

O objetivo dos modelos estatísticos

Objetivo da Estatística

Benjamin está trabalhando em um projeto para sua aula de agricultura. Ele encontrou pesquisas que mostram que, sob as condições certas, as plantas crescem em uma quantidade consistente todos os dias. Benjamin quer testar essas informações e ver se consegue prever a altura de suas plantas depois de 10 dias.

Benjamin precisa entender os modelos estatísticos e o propósito das estatísticas antes de poder analisar adequadamente essas informações. Nesta lição, discutiremos o propósito da estatística e como você pode usar modelos estatísticos para atingir esse propósito.

Primeiro, vamos discutir o propósito das estatísticas. O objetivo das estatísticas é descrever e prever informações. Isso pode ser dividido em estatísticas descritivas e estatísticas inferenciais. Às vezes, coletamos dados na tentativa de descrever as características de uma população. Por exemplo, Benjamin pode coletar dados sobre as cores das flores de certos tipos de plantas. Com o tempo, ele pode ter informações suficientes para dizer que a planta produz uma flor branca 56% das vezes, uma flor roxa 34% das vezes e uma flor azul 10% das vezes. Este é um exemplo de como Benjamin usou estatísticas para descrever a planta.

A estatística também é usada para prever informações. Benjamin pode usar as mesmas informações que coletou para prever a cor da flor que a planta produziria. Se Benjamin tem uma planta que ainda não produziu uma flor, ele pode dizer que é mais provável que produza uma flor branca e menos provável que produza uma flor azul.

Agora que você entende que o propósito da estatística é descrever e / ou prever, vamos discutir o papel que o modelo estatístico desempenha nesse propósito.

Um modelo estatístico é uma combinação de inferências baseadas em dados coletados e compreensão da população usada para prever informações de uma forma idealizada. Isso significa que um modelo estatístico pode ser uma equação ou representação visual de informações com base em pesquisas já coletadas ao longo do tempo. Observe que a definição menciona as palavras 'forma idealizada'. Isso significa que sempre há exceções às regras.

Por exemplo, digamos que Benjamin regue suas plantas por 10 dias com a quantidade correta de água nas condições corretas. No entanto, e se alguém acidentalmente derrubar uma das plantas? Ou se um animal entrar na estufa e começar a se alimentar da planta? Esses são exemplos extremos, mas geralmente condições inesperadas podem interferir na coleta de dados.

Agora vamos falar sobre os tipos de modelos estatísticos e como eles são usados.

Tipos de modelos estatísticos

Antes de entender os tipos de modelos estatísticos, você deve primeiro entender o motivo da existência desses modelos. Os modelos estatísticos existem porque procuramos uma relação entre duas, ou às vezes mais, variáveis. Por exemplo, no caso de Benjamin, existem duas variáveis: o número de dias que as plantas crescem e a altura das plantas. Já sabemos que quanto mais dias as plantas crescem, mais altas elas ficam. Claro, há a questão do estado das plantas, a quantidade de água, a quantidade de luz, etc. Essas são todas as outras variáveis ​​que podem afetar o experimento. Mas, por enquanto, vamos limitar essas duas variáveis, apenas para manter as coisas simples. A relação entre a altura das plantas e o número de dias que as plantas crescem é conhecida como uma correlação, que é a relação entre duas variáveis ​​ou conjuntos de dados. Um teste de correlação é um tipo de modelo estatístico.

Essencialmente, todos os modelos estatísticos existem para encontrar inferências entre diferentes tipos de variáveis ​​e, como existem diferentes tipos de variáveis, existem diferentes tipos de modelos estatísticos. Por exemplo, digamos que Benjamin estava coletando informações sobre os diferentes tipos de plantas que crescem em sua região. Ele estaria coletando dados que seriam agrupados em categorias, o que é conhecido como dados categóricos. Nesse experimento, Benjamin teria que usar um modelo estatístico diferente para analisar seus dados do que aquele que usou para encontrar uma correlação entre a altura das plantas e o número de dias que passaram crescendo.

Alguns dos tipos de modelos ou testes estatísticos incluem regressão, análise de variância, análise de covariância e qui-quadrado. Esses são apenas alguns exemplos de modelos estatísticos; existem muitas maneiras diferentes de analisar os dados, dependendo das variáveis. Discutiremos muitos desses modelos em profundidade em lições futuras.

Agora vamos falar mais sobre os tipos de variáveis ​​envolvidas em diferentes modelos estatísticos.

Tipos de Variáveis

Benjamin tem feito experiências com suas plantas. Ele adicionou um tipo diferente de fertilizante, diferentes quantidades de água e diferentes quantidades de umidade e luz solar para algumas das plantas. Agora, uma das plantas começou a florescer apenas flores azuis, o que é muito raro. Infelizmente, Benjamin não tem certeza de qual das mudanças ou combinação de mudanças fez com que a planta desabrochasse flores azuis. Para compreender esse fenômeno, Benjamin precisa entender dois tipos de variáveis: respostas e explicativas.

Uma variável de resposta é a variável observada ou variável em questão. No caso de Benjamin, as flores azuis seriam a variável de resposta. Isso é semelhante a uma variável dependente , que é uma condição ou parte dos dados em um experimento que é controlada ou influenciada por um fator externo, geralmente a variável independente. No entanto, às vezes os dados podem ser coletados sem fazer um experimento e, nesses casos, ainda há uma variável de resposta.

Ao analisar dados, frequentemente perguntamos: 'O que está causando a variável de resposta?' Benjamin tem feito a mesma pergunta: 'O que está causando as flores azuis?' Para responder à sua pergunta, você precisará entender as variáveis ​​explicativas.

Uma variável explicativa é uma variável ou conjunto de variáveis ​​que podem influenciar a variável de resposta. No caso de Benjamin, isso se refere a todas as coisas que ele fez às plantas, como regar, adicionar fertilizante e alterar a umidade e a luz do sol. Todos esses fatores podem ter influenciado a aparência da flor azul.

Isso é semelhante a uma variável independente , que é uma condição ou parte dos dados em um experimento que pode ser controlada ou alterada. A diferença entre variáveis ​​explicativas e variáveis ​​independentes é que as variáveis ​​explicativas nem sempre podem ser controladas ou alteradas. Por exemplo, se Benjamin não tem controle sobre a umidade em sua estufa, então a umidade não é uma variável independente que Benjamin pode controlar, mas ainda pode ser um fator na aparência da flor azul.

As variáveis ​​são coletadas na forma de dados, que podem ser categóricos ou quantitativos. Cada tipo de dados categóricos pode ser ordinal ou nominal, e cada tipo de dados quantitativos pode ser discreto ou contínuo. Os dados nominais são dados categóricos que atribuem valores numéricos como um atributo a um objeto, animal, pessoa ou qualquer outro não-número. Eles são usados ​​para identificar apenas os objetos; eles não podem ser manipulados como números. Dados ordinais são dados que podem ser solicitados e classificados, mas não medidos, como níveis de realização, prêmios, classificações e colocações.

Dados discretos são dados que não podem ser divididos. É distinto e só pode ocorrer em determinados valores. Por exemplo, você só pode ter uma pessoa inteira, não a metade ou um quarto de uma pessoa, ao coletar dados. Dados contínuos são dados que podem ser divididos infinitamente; ele não tem nenhuma distinção de valor, como tempo, altura e peso.

Como você pode ver, os vários tipos de dados se prestam a muitas combinações de variáveis ​​explicativas e de resposta, e é por isso que temos diferentes modelos estatísticos para analisar esses dados.

Resumo da lição

O objetivo das estatísticas é descrever e prever informações. Isso pode ser dividido em estatísticas descritivas e estatísticas inferenciais, o que significa apenas que às vezes coletamos dados na tentativa de descrever as características de uma população e às vezes coletamos dados e os analisamos para prever informações. Para ambos os propósitos, temos que usar um modelo estatístico.

Um modelo estatístico é uma combinação de inferências baseadas em dados coletados e compreensão da população usada para prever informações de uma forma idealizada. Existem diferentes tipos de modelos estatísticos conhecidos como testes que podem ser usados ​​para analisar dados.

Essencialmente, todos os modelos estatísticos existem para encontrar inferências entre diferentes tipos de variáveis ​​e, como existem diferentes tipos de variáveis, existem diferentes tipos de modelos estatísticos. Alguns dos tipos de modelos ou testes estatísticos incluem regressão, análise de variância, análise de covariância e qui-quadrado.

Existem muitas maneiras diferentes de usar os modelos para analisar dados, dependendo dos tipos de variáveis. Uma variável de resposta é a variável observada ou variável em questão. No experimento de Benjamin, as flores azuis foram a variável de resposta. Isso é semelhante a uma variável dependente , que é uma condição ou parte dos dados em um experimento que é controlada ou influenciada por um fator externo, geralmente a variável independente.

Uma variável explicativa é uma variável ou conjunto de variáveis ​​que podem influenciar a variável de resposta. No caso de Benjamin, isso se refere a todas as coisas que ele fez às plantas, como regar, adicionar fertilizante e alterar a umidade e a luz do sol. Todos esses fatores podem ter influenciado a aparência da flor azul. Isso é semelhante a uma variável independente , que é uma condição ou parte dos dados em um experimento que pode ser controlada ou alterada.

Lembre-se de que as variáveis ​​são coletadas na forma de dados, que podem ser categóricos ou quantitativos. Cada tipo de dados categóricos pode ser ordinal ou nominal , e cada tipo de dados quantitativos pode ser discreto ou contínuo . Isso pode resultar na necessidade de muitos tipos diferentes de modelos estatísticos para analisar cada combinação de dados adequadamente.

Se você está se perguntando sobre os diferentes tipos de modelos estatísticos ou confuso com algum desses conceitos apresentados nesta lição, não se preocupe! Continue, e falaremos sobre todos esses conceitos com mais detalhes em outras lições.

Resultados de Aprendizagem

Depois de concluir esta lição, você será capaz de:

  • Identificar a finalidade das estatísticas e modelos estatísticos
  • Liste diferentes tipos de modelos estatísticos
  • Defina as características da variável de resposta e variável explicativa
  • Compare variáveis ​​explicativas e variáveis ​​independentes
  • Descreva dados categóricos e quantitativos
  • Diferencie entre dados ordinais e nominais
  • Distinguir as diferenças entre dados discretos e contínuos
Artículos relacionados