Teorema Central do Limite

Uma razão para a distribuição Normal ser considerada tão importante é porque qualquer que seja a distribuição da variável de interesse para grande amostras, a distribuição das médias amostrais serão aproximadamente normalmente distribuídas, e tenderão a uma distribuição normal à medida que o tamanho de amostra crescer. Então podemos ter uma variável original com uma distribuição muito diferente da Normal (pode até mesmo ser discreta), mas se tomarmos várias amostras grandes desta distribuição, e então fizermos um histograma das médias amostrais, a forma se parecerá como uma curva Normal.

\fbox{\begin{tabular}{c} A distribuição da média amostral $\bar{X}$ é
aproxima...
...\\
Normal com média $\mu$ e desvio padrão $\sigma / \sqrt{n}$.
\end{tabular}}
Aqui $\mu$ e $\sigma$ são a média e o desvio padrão populacionais das medidas individuais $X$, e $n$ é o tamanho amostral. Denota-se

\begin{displaymath}\bar{X} \sim N(\mu,\sigma/\sqrt{n}).\end{displaymath}

A aproximação para a normal melhora à medida que o tamanho amostral cresce. Este resultado é conhecido como o Teorema Central do Limite e é notável porque permite-nos conduzir alguns procedimentos de inferência sem qualquer conhecimento da distribuição da população.


Exemplo simulado: Podemos ilustrar o Teorema Central do Limite por um exemplo simulado. O diagrama na Figura 35 sumariza os resultados de um experimento no qual foi utilizado um computador para gerar 2000 observações de duas distribuições bem diferentes (linha superior). Nós então geramos uma amostra de tamanho 2 de cada distribuição e calculamos a média. Este procedimento foi repetido 1999 vezes e a segunda linha mostra os histogramas das médias resultantes das amostras de tamanho dois. Isto foi repetido com média amostrais onde as amostras são de tamanhos 5 (terceira linha) e 10 (quarta linha).

Note como a forma da distribuição muda à medida que se muda de uma linha para a próxima, e como as duas distribuições em cada linha tornam-se mais similares nas suas formas à medida que o tamanho das amostras aumenta. Ainda mais, cada distribuição parece mais e mais com uma distribuição Normal. Não é necessário uma amostra de tamanho muito grande para ver uma forma Normal.

As média populacionais para as duas distribuições são 5 e 3 respectivamente. Note como, quanto maior o tamanho de amostra mais perto as médias amostrais tendem a estar da média populacional.

Figura 35: Teorema Central do Limite
\begin{figure}\centerline{\psfig{figure=figuras/clt.ps,width=14cm}}\end{figure}

Exemplo:
Suponha que para crianças nascidas com peso abaixo de 750g, o nível de bilirrubina sérico tem distribuição Normal com média 8,5mg/dl e desvio-padrão 3,5 mg/dl.

  1. Calcule a probabilidade de que a média amostral $\bar{X}$, para uma amostra de 16 crianças:
    1. seja menor do que 8 mg/dl
    2. esteja entre 7,5 e 9,5 mg/dl
  2. Encontre um intervalo simétrico em torno da média que contenha 95% dos valores de $\bar{X}$.

shimakur 2009-04-16