Verificação da suposição de normalidade

Desejamos verificar a partir de uma amostra se a variável estudada pode ser adequadamente descrita por uma distribuição normal.

Em primeiro lugar, é importante observar se a distribuição dos dados (histograma, ramo-e-folhas ou gráfico de pontos) apresenta-se razoavelmente simétrica.

Em segundo lugar, lembramos que para uma distribuição normal com média $\mu$ e desvio padrão $\sigma$, os intervalos $(\mu-\sigma;\mu+\sigma)$, $(\mu-2\sigma;\mu+2\sigma)$ e $(\mu-3\sigma;\mu+3\sigma)$ compreendem respectivamente 68,3%, 95,4% e 99,7% da distribuição.

Assim, com base nos dados amostrais podemos estimar $\mu$ usando a média amostral $\bar{x}$ e $\sigma$ usando o desvio padrão amostral $s$; e então verificar a proporção de observações nos intervalos $(\bar{x}-s;\bar{x}+s)$, $(\bar{x}-2s;\bar{x}+2s)$ e $(\bar{x}-3s;\bar{x}+3s)$.

Se a distribuição normal é a adequada para descrever estes dados então as proporções observadas devem estar próximas das probabilidades teóricas 0,683, 0,954 e 0,997.

Existem outras formas mais complexas para se verificar normalidade de dados mas não serão descritos neste curso.

Exemplo: pág 103 da apostila.

Silvia Shimakura 2005-11-08