22 Ilustrando propriedades de estimadores

22.1 Consistência

Um estimador é consistente quando seu valor se aproxima do verdadeiro valor do parâmetro à medida que aumenta-se o tamanho da amostra. Vejamos como podemos ilustrar este resultado usando simulação. A idéia básica é a seguite:

escolher uma distribuição e seus parâmetros,
definir o estimador,
definir uma sequência crescente de valores de tamanho de amostras,
obter uma amostra de cada tamanho,
calcular a estatística para cada amostra,
fazer um gráfico dos valores das estimativas contra o tamanho de amostra, indicando neste gráfico o valor verdadeiro do parâmetro.

22.1.1 Média da distribuição normal

Seguindo os passos acima vamos:

tomar a distribuição Normal de média 10 e variância 4,
definir o estimador $\bar{X}=\sum_{i=1}^n \frac{x_i}{n}$ ,
escolhemos os tamanhos de amostra $n=2, 5, 10, 15, 20,\ldots, 1000, 1010, 1020, \ldots, 5000$ ,
fazemos os cálculos e produzimos um gráfico como mostrado na com os comandos a seguir.

> ns <- c(2, seq(5, 1000, by=5), seq(1010, 5000, by=10))
> estim <- numeric(length(ns))
> for (i in 1:length(ns)){
>   amostra <- rnorm(ns[i], 10, 4)
>   estim[i] <- mean(amostra)
> }
> plot(ns, estim)
> abline(h=10)

**Figura** : Médias de amostras de diferentes tamanhos.
$\begin{figure}\centerline{\includegraphics[width=0.6\textwidth]{figuras/prop01.ps}}\end{figure}$

22.2 Momentos das distribuições amostrais de estimadores

Para inferência estatística é necessário conhecer a distribuição amostral dos estimadores. Em alguns casos estas distribuições são derivadas analiticamente. Isto se aplica a diversos resultados vistos em um curso de Inferência Estatística. Por exemplo o resultado visto na sessão

: se $Y_1, Y_2, \ldots Y_n \sim {\rm N}(\mu,\sigma^2)$ então $\bar{y} \sim {\rm N}(\mu,\sigma^2/n)$ . Resultados como estes podem ser ilustrados computacionalmente como visto na Sessão

Além disto este procedimento permite investigar distribuições amostrais que são complicadas ou não podem ser obtidas analiticamente.

Vamos ver um exemplo: considere uma v.a. com distribuição normal $N(\mu, \sigma^2)$ e seja um parâmetro de interesse $\theta=\mu / \sigma^2$ . Para obter por simulação a esperança e variância do estimador $T=\bar{Y}/S^2$ onde $\bar{Y}$ é a média e a variância de uma amostra seguimos os passos:

escolher uma distribuição e seus parâmetros, no caso vamos escolher uma ,
definir um tamanho de amostra, no caso escolhemos ,
obter por simulação um número de amostras, vamos usar ,
calcular a estatística de interesse para cada amostra,
usar as amostras para obter as estimativas $\hat{E}[T]$ e $\hat{{\rm Var}}[T]$ .

Vamos ver agora comandos do R.

> amostras <- matrix(rnorm(20*1000, mean=180, sd=8), nc=1000)
> Tvals <- apply(amostras, 2, function(x) {mean(x)/var(x)})
> ET <- mean(Tvals)
> ET
[1] 3.134504
> VarT <- var(Tvals)
> VarT
[1] 1.179528

Nestes comandos primeiro obtemos 1000 amostras de tamanho 20 que armazenamos em uma matriz de dimensão $20 \times 1000$ , onde cada coluna é uma amostra. A seguir usamos a função apply para calcular a quantidade desejada que definimos com function(x) {mean(x)/var(x)}. No caso anterior foi obtido $\hat{E}[T] \approx 3.13$ e $\hat{{\rm Var}}[T] \approx 1.18$ .

Se voce rodar os comandos acima deverá obter resultados um pouco diferentes (mas não muito!) pois nossas amostras da distribuição normal não são as mesmas.

Ilustre a consistência do estimador $\hat{\lambda} = 1/\bar{X}$ de uma distribuição exponencial $f(x)=\lambda \exp\{-\lambda x\}$ .
No exemplo dos momentos das distribuições de estimadores visto em () ilustramos a obtenção dos momentos para um tamanho fixo de amostra . Repita o procedimento para vários tamanho de amostra e faça um gráfico mostrando o comportamento de $\hat{E}[T]$ e $\hat{{\rm Var}}[T]$ em função de .
Estime por simulação a esperança e variância do estimador $\hat{\lambda} = \bar{X}$ de uma distribuição de Poisson de parâmetro $\lambda$ para um tamanho de amostra . Compare com os valores obtidos analiticamente. Mostre em um gráfico como os valores de $\hat{E}[\hat{\lambda}]$ e $\hat{{\rm Var}}[\hat{\lambda}]$ variam em função de .
Crie um exemplo para ilustrar a não tendenciosidade de estimadores. Sugestão: compare os estimadores $S^2 = \sum_{i=1}^{n} (X_1 - \bar{X})^2/(n-1)$ e $\hat{\sigma}^2 = \sum_{i=1}^{n} (X_1 - \bar{X})^2/n$ do parâmetro de variância $\sigma^2$ de uma distribuição normal.
Crie um exemplo para comparar a variância de dois estimadores. Por exemplo compare por simulação as variâncias dos estimadores $T_1 = \bar{X}$ e $T_2 = (X_{[1]} + X_{[n]})/2$ do parâmetro $\mu$ de uma distribuição ${\rm N}(\mu, \sigma^2)$ , onde $X_{[1]}$ e $X_{[n]}$ são os valores mínimo e máximo da amostra, respectivamente.