Este é o modelo mais simples para descrever a relação entre uma
variável explanatória e uma variável resposta . O modelo faz a
seguintes suposições, em ordem decrescente de importância:
- o valor médio da variável resposta é uma funçãi linear de
,
- a variância da variável resposta é constante (ou seja, a
mesma para todos os valores de ),
- a variação aleatória da variável resposta para qualquer
valor fixo de segue uma distribuição Normal, e estes termos
de erro são independentes.
Em termos algébricos, seja para
os
valores observados da variável explanatória e da variável resposta
para os sujeitos.
O modelo de regressão linear é
onde representa desvios independentes
aleatórios da relação linear entre e e (para satisfazer nossas
três suposições acima)
Note que e são parâmetros da população, e eles
são frequentemente conhecidos como coeficientes. Em particular,
é denominado coeficiente, ou efeito, de .
Os dados abaixo parecem satisfazer todas as três suposições:
Um exemplo construído de dados que não satisfazem nenhuma das
suposições é mostrado abaixo:
Silvia E Shimakura
2006-08-30