Biología

Análise estatística com dados categóricos

O que são dados categóricos?

Quando você responde a uma pesquisa ou preenche formulários de inscrição em vários lugares, você encontra dados categóricos. Então, o que exatamente são dados categóricos ? É o tipo de informação que pode ser categorizada. Por exemplo, sua raça, sexo e ocupação são todos tipos diferentes de dados categóricos. Sua resposta para raça pode ser categorizada em grupos como asiático, caucasiano, etc. Para ocupação, sua resposta pode ser categorizada em grupos como professor, aluno, artista, etc.

Dados como porcentagem

Com esse tipo de dados, parte do processo de análise envolve a mudança de seus dados em porcentagens. Vamos trabalhar em um cenário de exemplo para ver como funciona o processo de análise. Nosso cenário é que acabamos de entrevistar um grupo de 100 pessoas sobre a cor natural do cabelo. Depois de analisar todos os dados, descobrimos que 30 pessoas tinham cabelos castanhos, 20 pessoas tinham cabelos loiros, 40 pessoas tinham cabelos pretos e 10 pessoas tinham cabelos ruivos. Observe como fomos capazes de agrupar as pessoas em nossa pesquisa em apenas alguns grupos. Para cada pessoa que respondeu de determinada maneira, adicionamos 1 para esse grupo. Agora que temos essas informações, precisamos analisá-las e apresentá-las de forma que sejam fáceis de entender e usar. Ter apenas nossos números não faz muito por nós. Mas, se mudarmos os números para porcentagens,

Para transformar nossos números em porcentagens, pegamos o número de cada grupo e o dividimos pelo número total de dados e, em seguida, convertemos esse decimal em uma porcentagem multiplicando por 100. Para nosso cabelo castanho, dividimos 30 por 100 para obter 0,3. 0,3 multiplicado por 100 é 30%. Para cabelos loiros, obtemos 20%. Para cabelos pretos, 40%, e para ruivos, 10%.

Tabela de dados

Agora que temos nossas porcentagens, precisamos encontrar uma maneira de apresentá-la a outras pessoas para que faça mais sentido. Uma maneira de apresentá-lo é com uma tabela de dados , que é uma forma de organizar as informações em linhas e colunas. Iremos apresentá-lo com uma linha de título e nossas informações em duas colunas. A linha do título indicará para que serve cada coluna. A primeira coluna é para ‘Cor do cabelo’ e a segunda coluna é para ‘Resultado’. Escrevemos nossos grupos na coluna Coloração do cabelo e nossas respectivas porcentagens na coluna seguinte.

Cor de cabelo Resultado
Castanho 30%
Loiras 20%
Preto 40%
Vermelho 10%

Podemos dar uma olhada em nossa mesa pronta e obter rapidamente as informações de que precisamos. Podemos olhar para ele e ver facilmente que 40% da nossa população tem cabelos pretos. Podemos usar essas informações para fins comerciais, se quisermos comercializar acessórios de cabelo para pessoas. Se sabemos que a maioria da nossa população tem cabelo preto, então produziremos mais acessórios que combinem com o cabelo preto.

Gráfico de Barras

Outra forma de apresentarmos nossas informações, o que facilitará a análise, é com o uso de um gráfico de barras , um gráfico que mostra nossos dados por meio de barras. A maneira como criamos um gráfico de barras é escrevendo nossos vários grupos no eixo x, e então desenhamos barras de várias alturas para corresponder ao número de pessoas em cada grupo. Nosso primeiro grupo que escrevemos é o Brown, e nosso bar tem uma altura de 30 porque é esse o número de pessoas neste grupo. Fazemos o mesmo com o resto dos grupos. Blonde tem uma altura de barra de 20, Black tem uma altura de barra de 40 e Red tem uma altura de barra de 10. Podemos facilmente olhar para este gráfico de barras abaixo e ver qual grupo é mais popular e qual grupo é a minoria.


Exemplo de um gráfico de barras com dados de cor de cabelo
exemplo de gráfico de barras com dados de cor de cabelo

Em meu gráfico de barras, decidi manter os números em vez de usar porcentagens. Por quê? Porque em um gráfico de barras, é fácil ver qual barra é mais alta que a outra. No entanto, em forma de tabela, é mais fácil entender as informações se forem apresentadas em porcentagens. Você também pode usar as porcentagens para as alturas das barras em seu gráfico de barras. Você pode usar o que achar que transmitirá as informações da melhor maneira. Você pode representar graficamente os dois para comparar e, em seguida, escolher o que for mais fácil de ler.

Resumo da lição

Em revisão, dados categóricos são dados que podem ser categorizados em grupos. Os exemplos incluem gênero, ocupação e raça. As duas maneiras de analisar essas informações são com o uso de uma tabela de dados , informações apresentadas em linhas e colunas, ou um gráfico de barras , um gráfico com barras de várias alturas. Para uma tabela de dados, embora você possa relatar seus dados usando os números de cada grupo, na maioria das vezes faz mais sentido relatar os grupos usando suas porcentagens. Para o gráfico de barras, você pode representá-lo usando as porcentagens ou os números de cada grupo. Você escolhe aquele que faz mais sentido para sua situação. Faça um gráfico de ambos para ver qual é mais fácil de ler e entender.

Resultados de Aprendizagem

Conclua esta lição para que você possa:

  • Forneça exemplos de dados categóricos
  • Analise dados categóricos usando uma tabela de dados e um gráfico de barras
  • Saiba quando usar porcentagens e quando usar números ao avaliar dados categóricos