Introdução

Objetivo

O modelo

\[ \begin{aligned} y = \beta_0 + \beta_{1}x + \varepsilon \end{aligned} \]

em que:
\(y\)= é a variável dependente
\(\beta_0\)= é o coeficiente linear ou intercepto da reta de regressão
\(\beta_1\)= é o coeficiente angular ou inclinação (declive) da reta de regressão
\(x\)= é a variável independente
\(\varepsilon\)= é o erro aleatório referente a variabilidade em \(y\) quem não pode ser explicada pela variável \(x\).

Possíveis retas de regressão linear simples

plot of chunk unnamed-chunk-1

Entendendo o comportamento de \(\beta_0\) e \(\beta_1\)

Ajuste da regressão

##    restaurante estudantes vendas_trimestrais
## 1            1          2                 58
## 2            2          6                105
## 3            3          8                 88
## 4            4          8                118
## 5            5         12                117
## 6            6         16                137
## 7            7         20                157
## 8            8         20                169
## 9            9         22                149
## 10          10         26                202

plot of chunk unnamed-chunk-3

Método dos mínimos quadrados

\[ \sum \varepsilon^2 = \sum(y - \beta_0 - \beta_1x)^2 \]

\[ a = \bar{y} - b \bar{x} \]

e

\[ b = \frac{\sum xy - \frac{\sum x \sum y}{n}}{\sum x^2 - \frac{(\sum x)^2}{n}} \]

Exemplo

#-------------------- opção 1 - na unha!-------------------
sumxy = sum(estudantes*vendas_trimestrais)
sumxsumy = sum(estudantes)*sum(vendas_trimestrais)
n = length(estudantes)

sumx2 = sum(estudantes^2)
sumx = sum(estudantes)

# Portanto, b é igual:

b = (sumxy - sumxsumy/n)/(sumx2 - (sumx)^2/n)
b
## [1] 5
# Calculando a, tem-se:
ybarra = mean(vendas_trimestrais)
xbarra = mean(estudantes)

a = ybarra - b*xbarra
a
## [1] 60

\[ \hat{y} = 60 + 5x \]