Regressão Linear Simples
Hannah é uma cientista que estuda a administração do tempo e as habilidades de estudo de estudantes universitários. Ela conduz um experimento em uma faculdade local com 50 alunos. Ela pede a cada aluno para controlar o tempo gasto nas redes sociais, o tempo gasto estudando, o tempo gasto dormindo e o tempo gasto trabalhando ao longo de um semestre. Ela também pede que os alunos registrem seu GPA final do semestre.
Nesta lição, você aprenderá sobre a regressão linear simples e como encontrar uma linha de regressão usando uma calculadora gráfica. Uma linha de regressão é uma linha reta que tenta prever a relação entre dois pontos, também conhecida como linha de tendência ou linha de melhor ajuste. A regressão linear simples é uma previsão quando uma variável ( y ) é dependente de uma segunda variável ( x ) com base na equação de regressão de um determinado conjunto de dados. Veremos como Hannah usa regressão linear simples para ajudar a interpretar seus dados.
Gráficos de dispersão e regressão
Depois que todos os 50 alunos entregam seus dados, Hannah cria um gráfico de dispersão , que é um gráfico de pares ordenados que mostra uma relação entre dois conjuntos de dados. Para seu primeiro gráfico de dispersão, Hannah usa duas variáveis: tempo gasto em redes sociais e quantidade de sono. Para simplificar suas informações, vamos olhar o tempo médio por semana que cada aluno passa dormindo e nas redes sociais. Dê uma olhada no gráfico de dispersão:
![]() |
Como estamos usando duas variáveis, podemos chamar isso de dados bivariados. Dados bivariados são dois conjuntos de variáveis que podem mudar e são comparados para encontrar relacionamentos. Os dados bivariados são mais frequentemente exibidos visualmente usando um gráfico de dispersão.
Você pode notar que esses dados têm vários pontos que criam uma espécie de padrão. Muitos dos pontos aumentam no valor x à medida que diminuem no valor y . Este é um relacionamento entre os dois conjuntos de dados conhecido como correlação . Uma correlação é o relacionamento entre dois conjuntos de variáveis usadas para descrever ou prever informações.
Uma linha de regressão é uma forma de prever essas informações e encontrar uma correlação nos dados. Existem duas maneiras de encontrar a linha de regressão de um conjunto de dados. A primeira maneira é encontrar a linha de regressão usando uma régua, e a segunda maneira é usar uma calculadora gráfica. Vamos falar brevemente sobre como encontrar uma linha de regressão manualmente antes de usar uma calculadora.
Encontrar a linha de regressão manualmente
Para encontrar uma linha de regressão manualmente, siga estas etapas:
- Desenhe uma linha que esteja mais próxima do máximo de pontos possível.
- Escolha dois pontos e calcule a inclinação.
- Escreva a equação da reta.
Vamos usar o gráfico de dispersão acima para praticar a localização da linha de regressão usando uma régua.
Primeiro, use a régua para encontrar um lugar que esteja mais próximo do maior número possível de pontos. Às vezes, você pode encontrar dois pontos para usar.
Em segundo lugar, escolha dois pontos que você acha que estariam na linha de regressão. Você pode usar pontos que estão na linha ou pode criar novos pontos. Use esses pontos e conecte-os à seguinte equação:
![]() |
Se você não está familiarizado com o uso desta equação, verifique nossas aulas de álgebra!
Terceiro, agora você tem a inclinação de sua linha. Você pode criar uma equação com base nessas informações. Encontre o intercepto y estendendo a linha até o eixo y .
Use a equação inclinação-interceptação para criar a equação para sua linha como esta:
-
y = mx + b
y = -1 x + 66
Usando uma calculadora gráfica
Agora que você sabe como encontrar uma linha de regressão manualmente, vamos falar sobre como encontrar uma linha de regressão usando uma calculadora. Cada calculadora é um pouco diferente. No entanto, você deve conseguir usar praticamente qualquer calculadora gráfica usando estas etapas:
- Configure a calculadora para o modo Estatística.
- Insira os dados (1º conjunto em L1, 2º conjunto em L2).
- Ajuste as configurações para um gráfico de dispersão e, a seguir, represente graficamente os pontos.
- Configure a calculadora para linha de regressão.
Usaremos os dados que Hannah coletou sobre a quantidade de sono e a quantidade de trabalho que os alunos fizeram durante o semestre:
![]() |
Esses dados são uma média semanal para cada aluno. Para economizar tempo, estou usando apenas 20 alunos, em vez dos 50 originais. Neste exemplo, estou usando uma calculadora gráfica TI-83.
Primeiro, configure sua calculadora para estatísticas pressionando o botão Stat. Isso o levará a uma tela com as opções de Editar, Calc e Testes. Selecione a opção Editar pressionando enter. O L1 é as coordenadas x , e o L2 é para as coordenadas y . Insira cada uma das coordenadas usando o teclado numérico e pressionando ‘Enter’ quando terminar de inserir cada coordenada. Após pressionar o botão Enter, a calculadora irá levá-lo para a próxima linha para a segunda coordenada. Você também pode usar os botões de seta para mover entre L1 e L2.
A seguir, ajuste as configurações da calculadora para exibir um gráfico de dispersão. Para fazer isso, aperte o segundo botão e então aperte Statplot. Você deverá ver esta tela:
![]() |
Pressione Enter para ir para a próxima tela, que se parece com isto:
![]() |
Certifique-se de que suas configurações correspondem às minhas movendo o cursor com os botões de seta e selecionando cada item com o botão Enter. Os itens selecionados terão um fundo preto e texto claro.
Você também vai querer ter certeza de que pode ver todos os seus pontos. Eu ajustei os valores em cada campo usando as teclas de seta, o botão Enter e o teclado numérico. Pressione a tecla Gráfico para ver os pontos traçados no gráfico. Agora você está pronto para encontrar a equação de sua linha de regressão.
Primeiro, pressione o botão STAT novamente. Desta vez, use as teclas de seta para mover para a opção CALC na parte superior da tela. Usando as teclas de seta, mova o cursor para baixo até o item número quatro denominado LinReg ( ax + b ). Pressione o botão Enter.
A calculadora mostrará o mesmo LinReg ( ax + b ) na parte superior da tela. Pressione Enter uma segunda vez para calcular a linha de regressão.
- a = 1,3
- b = 40,6
Portanto, a equação para a linha de regressão é y = 1,3 x + 40,6. Meu gráfico ficaria assim:
![]() |
Problemas de prática
Agora, Hannah quer comparar a quantidade de tempo que um aluno passa estudando com a quantidade de tempo que o aluno passa dormindo. Você pode encontrar a linha de regressão e sua equação a partir deste conjunto de dados? Pause o vídeo aqui para trabalhar neste problema.
Tempo de sono (horas) | Tempo de estudo (horas) |
---|---|
70 | 6 |
64 | 4 |
60 | 7 |
57 | 8 |
56 | 6 |
54 | 10 |
52 | 12 |
50 | 10 |
49 | 11 |
47 | 9 |
47 | 8 |
46 | 4 |
50 | 6 |
45 | 7 |
42 | 10 |
40 | 8 |
38 | 9 |
35 | 10 |
49 | 5 |
49 | 4 |
A equação para a linha de regressão neste gráfico é y = -0,0989 x + 12,643. Se você arredondou os números aqui, não há problema para esse problema.
Não se esqueça de pressionar ‘enter’ quando vir o LinReg ( ax + b ) na sua calculadora. Não vai mostrar-lhe os valores para a e b , se você não pressione enter, que a calculadora para encontrar essas variáveis.
Ok, tente isso. Hannah agora quer comparar o tempo que um aluno passa estudando com seu GPA. Você pode encontrar a linha de regressão e sua equação a partir deste conjunto de dados? Fique à vontade para pausar o vídeo aqui enquanto você trabalha.
Tempo de estudo (horas) | GPA (Semestre) |
---|---|
6 | 2,6 |
4 | 2,2 |
7 | 2,9 |
8 | 3,4 |
3 | 3,5 |
10 | 4 |
12 | 4 |
10 | 3,8 |
11 | 3,6 |
9 | 4 |
8 | 3,7 |
4 | 4 |
6 | 2,4 |
7 | 3,5 |
10 | 3,2 |
8 | 3,3 |
9 | 3,9 |
10 | 3,7 |
5 | 2,6 |
4 | 2,3 |
A equação para a linha de regressão neste gráfico é y = 0,1683 x + 2,0343. Se você arredondou os números aqui, não há problema para esse problema. Se você não obteve a resposta correta aqui, fique à vontade para voltar no vídeo e seguir as etapas novamente comigo.
Resumo da lição
Em resumo, uma linha de regressão , também conhecida como linha de tendência ou linha de melhor ajuste, é uma linha reta que tenta prever a relação entre dois pontos. A regressão linear simples é uma previsão quando uma variável ( y ) é dependente de uma segunda variável ( x ) com base na equação de regressão de um determinado conjunto de dados.
Cada calculadora é um pouco diferente. No entanto, você deve conseguir usar praticamente qualquer calculadora gráfica usando estas etapas:
- Configure a calculadora para o modo Estatística.
- Insira os dados (1º conjunto em L1, 2º conjunto em L2).
- Ajuste as configurações para um gráfico de dispersão e represente graficamente os pontos.
- Configure a calculadora para linha de regressão.
Finalmente, se você receber algum erro ou as informações não parecerem corretas, verifique primeiro os pontos inseridos e, em seguida, revise as configurações na calculadora.
Resultados de Aprendizagem
Assista a esta vídeo-aula e veja como você pode:
- Fornece definições para ‘linha de regressão’ e ‘regressão linear simples’
- Crie um gráfico de dispersão
- Apresente um método passo a passo para usar uma calculadora gráfica
- Encontre a linha de regressão de um conjunto de dados usando uma régua e uma calculadora gráfica