Matemática

Tendência central: Dot Plots, Histogramas e Box Plots

O que é tendência central?

A tendência central é definida como o valor típico de um conjunto de dados. Existem três maneiras principais de medir a tendência central: média, mediana e moda.

A média é a média de todos os dados. Para encontrar a média, some todos os valores e, a seguir, divida pelo número de valores. A mediana é o valor que fica exatamente no meio de uma lista de dados, depois de organizada em ordem numérica. O modo é o número que ocorre com mais frequência no conjunto de dados. Embora essas medidas de tendência central sejam muito úteis, às vezes não é suficiente apenas saber a média, mediana ou moda. Às vezes, você precisa representar os dados graficamente para ver quaisquer padrões subjacentes.

Gráficos de pontos de tendência central

Uma das maneiras mais simples de representar um conjunto de dados graficamente é um gráfico de pontos. Os gráficos de pontos são gráficos que mostram o número de vezes que cada ponto de dados ocorre pela colocação de pontos. Por exemplo, se um professor quisesse saber quantos livros seus alunos leram no mês passado, ele poderia coletar os dados, organizá-los em uma tabela como a da sua tela abaixo e, em seguida, fazer um gráfico de pontos como o mostrado na tela abaixo este. Neste gráfico de pontos, cada ponto representa um aluno.


Dados coletados por um professor sobre o número de livros lidos em um mês pelos alunos
Tabela de dados


Este gráfico de pontos representa quantos livros foram lidos pelos alunos em uma classe durante um mês.
Cada ponto representa um aluno.
plot plot

Os gráficos de pontos são realmente bons para identificar o modo de um conjunto de dados, que neste caso são sete e nove. Isso significa que mais alunos leram sete ou nove livros durante o último mês do que qualquer outro número de livros.

A mediana pode ser encontrada localizando o ponto que está exatamente no meio. Aqui, a mediana é 4,5 livros porque há 50 pontos no total, e o ponto 25 está em quatro livros e o ponto 26 está em 5 livros.

Para encontrar a média, você precisa calcular uma média ponderada. Multiplique cada número de livros pelo número de alunos acima dele. Em seguida, some tudo isso e divida pelo número total de alunos (50) para encontrar a média.

Média = ((0 x 3) + (1 x 3) + (2 x 7) + (3 x 6) + (4 x 6) + (5 x 3) + (6 x 4) + (7 x 8) + (8 x 2) + (9 x 8)) / 50 = 4,8 livros

Histogramas de tendência central

Um histograma mostra a frequência com que um determinado valor ocorre usando um gráfico de barras. Os histogramas são usados ​​para visualizar a distribuição dos dados.

Para fazer um histograma:

  1. Decida quantos grupos deseja ter e separe os dados em grupos.
  2. No eixo x , rotule o valor de cada grupo e, no eixo y , rotule o número de pontos de dados em cada grupo (a frequência).
  3. Desenhe uma barra com a altura da frequência de cada grupo.

Um histograma de nossos dados de exemplo é mostrado na tela abaixo. Este histograma tem um tamanho de grupo de 1 livro, portanto, existem 10 grupos diferentes.

exemplo de histograma

A partir de um histograma, você pode ver rapidamente como os dados são distribuídos e isso ajuda a decidir como analisar os dados posteriormente. Neste histograma, não há um padrão claro nos dados, mas em muitos casos, haverá.

Gráficos de caixa de tendência central

Os box plots , também conhecidos como box-and-whisker plots, mostram apenas um resumo dos dados, incluindo a mediana e os valores mínimo e máximo. Eles são usados ​​para comparar rapidamente diferentes conjuntos de dados entre si.

Para fazer um box plot:

  1. Primeiro encontre a mediana dos dados e desenhe uma linha nesse ponto.
  2. Em seguida, divida os dados em quatro quartis. Com os dados organizados em ordem sequencial, os 25% mais baixos estariam no primeiro quartil ou menos, os segundos 25% no segundo quartil, os terceiros 25% no terceiro quartil e os 25% mais altos no quarto, ou superior, quartil.
  3. Desenhe linhas no gráfico mostrando as localizações dos quartil inferior e superior e desenhe uma caixa envolvendo estes e a mediana. Esta caixa conterá os 50% intermediários dos dados, uma região conhecida como intervalo interquartil .
  4. Finalmente, adicione barras à esquerda e à direita da caixa para mostrar os valores máximo e mínimo dos dados no conjunto.

O gráfico de caixa na tela mostra nossos dados de exemplo originais em azul. No gráfico de caixa, você pode ver claramente a mediana do conjunto de dados, o intervalo interquartil e os valores extremos máximo e mínimo. Os gráficos de caixa também podem fornecer informações sobre a quantidade de dispersão nos dados. Se a caixa for muito pequena, você sabe que a maioria dos valores está perto da mediana, mas se for grande, os dados são mais dispersos.


Este gráfico de caixa compara o número de livros lidos por duas classes diferentes de alunos (a classe A é a original).
exemplo de box plot

Uma grande vantagem dos gráficos de caixa é que eles podem permitir que você compare diferentes conjuntos de dados rapidamente. Se o professor quisesse comparar os livros lidos por mais de uma classe (Classe A e Classe B), ele poderia mostrar isso no mesmo gráfico de caixa e comparar os dados.

Resumo da lição

Vamos revisar o que aprendemos. A tendência central é definida como o valor típico de um conjunto de dados. Existem três maneiras de caracterizar a tendência central. A média é a média de todos os dados. A mediana é o valor que está exatamente no meio de uma lista de dados que está em ordem numérica. O modo é o número que ocorre com mais frequência no conjunto de dados.

Gráficos de pontos, histogramas e gráficos de caixa são formas gráficas comuns de representar conjuntos de dados. Um gráfico de pontos representa os dados colocando um ponto para cada ponto de dados. Um histograma agrupa os dados em intervalos e, a seguir, plota a frequência com que os dados ocorrem em cada intervalo. Um gráfico de caixa é usado para comparar vários grupos de dados e mostra a mediana, o intervalo interquartil e os valores máximo e mínimo dos dados. Lembre-se de que o intervalo interquartil é o meio de 50% dos dados. Cada um desses métodos gráficos tem suas vantagens e desvantagens. Caberá a você decidir o que se encaixa mais eficazmente em cada situação ao usá-los.