Biología

Máximos, mínimos e outliers em um conjunto de dados

Encontrando Máximos, Mínimos e Outliers

Bob, da Bob’s Used Cars, está analisando as vendas de carros no ano passado. Ele deseja criar uma venda promocional durante o mês de menor vendas de carros. Ele também quer ver se há algum outro mês que se destaque nas vendas.

Uma boa maneira de Bob analisar seus dados de vendas de carros é identificar o mínimo, o máximo e os valores discrepantes no conjunto de dados. Dê uma olhada no conjunto de dados que Bob reuniu para o ano de vendas de carros. Este é o conjunto de dados com o qual trabalharemos para encontrar o máximo, o mínimo e o outlier.

O valor máximo no conjunto de dados é o maior valor matemático no conjunto de dados. O valor mínimo no conjunto de dados é o menor valor matemático do conjunto de dados. Um valor atípico é um valor muito maior ou menor do que os outros valores em um conjunto de dados ou um valor que está fora do conjunto de dados fornecido.

Primeiro, precisamos ordenar os dados do menor para o maior valor, como este:

10, 19, 20, 21, 22, 22, 23, 24, 24, 25, 26, 26.

O valor mínimo é 10 neste conjunto de dados, pois é o menor número. O valor máximo é 26, pois é o maior número. Agora dê uma olhada nos valores mínimo e máximo. Você perceberá que, com o valor máximo, temos dois 26s e, em seguida, os números diminuem em 1, até 25, 24, 23 e assim por diante. Portanto, o valor máximo não é um outlier, porque o número 26 não é significativamente maior do que os outros números próximos a ele no conjunto de dados.

No entanto, você pode notar que com o valor mínimo, o conjunto de dados salta de 10 para 19. Há uma diferença de 9 entre os dois valores, que é maior do que qualquer outra diferença nos números no conjunto de dados. Portanto, podemos identificar 10 como o valor mínimo e como o outlier.

É importante observar aqui que seu valor discrepante sempre será seu valor mínimo ou máximo; você não pode ter um outlier que está no meio do conjunto de dados.

Exemplo de prática

Bob deseja analisar os dados de sua equipe de vendas. Ele deseja enviar seu vendedor mais baixo para treinamento e dar um bônus ao seu melhor vendedor. Bob também deseja ver se há algum vendedor com desempenho significativamente inferior. Primeiro, vamos ordenar esses dados do menor para o maior: 50, 52, 53, 67, 80.

Ok, então os valores mínimo e máximo devem ser bem fáceis de identificar. Nosso valor máximo aqui é 80 e nosso valor mínimo é 50. Bob decide enviar Jim para um treinamento de vendas e dá um bônus a Sally, porque não quer dar o bônus a si mesmo.

Temos um valor discrepante neste conjunto de dados, que é 80. 80 está longe do próximo número, 67, enquanto 50, 52 e 53 estão relativamente próximos. Portanto, podemos dizer que Bob não tem nenhum funcionário com desempenho significativamente inferior.

Resumo da lição

Bob usou os valores máximo e mínimo para analisar seus dados de vendas. O valor máximo no conjunto de dados é o maior valor matemático no conjunto de dados. O valor mínimo no conjunto de dados é o menor valor matemático do conjunto de dados.

Os valores mínimo e máximo também podem ser outliers. Um valor atípico é um valor muito maior ou menor do que os outros valores em um conjunto de dados ou um valor que está fora do conjunto de dados fornecido. Lembre-se de que um outlier sempre será o valor mínimo e / ou máximo.

Nos exemplos que vimos, o primeiro conjunto de dados tinha um valor atípico de 10 – que era o valor mínimo – e o segundo conjunto de dados tinha um valor atípico de 80, que era o valor máximo. Você também pode ter um conjunto de dados com dois valores discrepantes, os valores mínimo e máximo.

Resultado de aprendizagem

No final desta lição, você deve ser capaz de identificar os valores máximo, mínimo e outlier de um conjunto de dados para análise.