Subsections


22 Ilustrando propriedades de estimadores

22.1 Consistência

Um estimador é consistente quando seu valor se aproxima do verdadeiro valor do parâmetro à medida que aumenta-se o tamanho da amostra. Vejamos como podemos ilustrar este resultado usando simulação. A idéia básica é a seguite:
  1. escolher uma distribuição e seus parâmetros,
  2. definir o estimador,
  3. definir uma sequência crescente de valores de tamanho de amostras,
  4. obter uma amostra de cada tamanho,
  5. calcular a estatística para cada amostra,
  6. fazer um gráfico dos valores das estimativas contra o tamanho de amostra, indicando neste gráfico o valor verdadeiro do parâmetro.

22.1.1 Média da distribuição normal

Seguindo os passos acima vamos:
  1. tomar a distribuição Normal de média 10 e variância 4,
  2. definir o estimador $\bar{X}=\sum_{i=1}^n \frac{x_i}{n}$,
  3. escolhemos os tamanhos de amostra $n=2, 5, 10, 15, 20,\ldots, 1000, 1010, 1020, \ldots, 5000$,
  4. fazemos os cálculos e produzimos um gráfico como mostrado na [*] com os comandos a seguir.

> ns <- c(2, seq(5, 1000, by=5), seq(1010, 5000, by=10))
> estim <- numeric(length(ns))
> for (i in 1:length(ns)){
>   amostra <- rnorm(ns[i], 10, 4)
>   estim[i] <- mean(amostra)
> }
> plot(ns, estim)
> abline(h=10)

Figura : Médias de amostras de diferentes tamanhos.
\begin{figure}\centerline{\includegraphics[width=0.6\textwidth]{figuras/prop01.ps}}\end{figure}


22.2 Momentos das distribuições amostrais de estimadores

Para inferência estatística é necessário conhecer a distribuição amostral dos estimadores. Em alguns casos estas distribuições são derivadas analiticamente. Isto se aplica a diversos resultados vistos em um curso de Inferência Estatística. Por exemplo o resultado visto na sessão [*]: se $Y_1, Y_2, \ldots Y_n \sim {\rm N}(\mu,\sigma^2)$ então $\bar{y} \sim {\rm N}(\mu,\sigma^2/n)$. Resultados como estes podem ser ilustrados computacionalmente como visto na Sessão [*].

Além disto este procedimento permite investigar distribuições amostrais que são complicadas ou não podem ser obtidas analiticamente.

Vamos ver um exemplo: considere $Y$ uma v.a. com distribuição normal $N(\mu, \sigma^2)$ e seja um parâmetro de interesse $\theta=\mu / \sigma^2$. Para obter por simulação a esperança e variância do estimador $T=\bar{Y}/S^2$ onde $\bar{Y}$ é a média e $S^2$ a variância de uma amostra seguimos os passos:

  1. escolher uma distribuição e seus parâmetros, no caso vamos escolher uma $N(180, 64)$,
  2. definir um tamanho de amostra, no caso escolhemos $n=20$,
  3. obter por simulação um número $N$ de amostras, vamos usar $N=1000$,
  4. calcular a estatística de interesse para cada amostra,
  5. usar as amostras para obter as estimativas $\hat{E}[T]$ e $\hat{{\rm Var}}[T]$.

Vamos ver agora comandos do R.

> amostras <- matrix(rnorm(20*1000, mean=180, sd=8), nc=1000)
> Tvals <- apply(amostras, 2, function(x) {mean(x)/var(x)})
> ET <- mean(Tvals)
> ET
[1] 3.134504
> VarT <- var(Tvals)
> VarT
[1] 1.179528

Nestes comandos primeiro obtemos 1000 amostras de tamanho 20 que armazenamos em uma matriz de dimensão $20 \times 1000$, onde cada coluna é uma amostra. A seguir usamos a função apply para calcular a quantidade desejada que definimos com function(x) {mean(x)/var(x)}. No caso anterior foi obtido $\hat{E}[T] \approx 3.13$ e $\hat{{\rm Var}}[T] \approx 1.18$.

Se voce rodar os comandos acima deverá obter resultados um pouco diferentes (mas não muito!) pois nossas amostras da distribuição normal não são as mesmas.

22.3 Não-tendenciosidade

Fica como exercício.

22.4 Variância mínima

Fica como exercício.

22.5 Exercícios

  1. Ilustre a consistência do estimador $\hat{\lambda} = 1/\bar{X}$ de uma distribuição exponencial $f(x)=\lambda \exp\{-\lambda x\}$.
  2. No exemplo dos momentos das distribuições de estimadores visto em ([*]) ilustramos a obtenção dos momentos para um tamanho fixo de amostra $n=20$. Repita o procedimento para vários tamanho de amostra e faça um gráfico mostrando o comportamento de $\hat{E}[T]$ e $\hat{{\rm Var}}[T]$ em função de $n$.
  3. Estime por simulação a esperança e variância do estimador $\hat{\lambda} = \bar{X}$ de uma distribuição de Poisson de parâmetro $\lambda$ para um tamanho de amostra $n=30$. Compare com os valores obtidos analiticamente. Mostre em um gráfico como os valores de $\hat{E}[\hat{\lambda}]$ e $\hat{{\rm Var}}[\hat{\lambda}]$ variam em função de $n$.
  4. Crie um exemplo para ilustrar a não tendenciosidade de estimadores. Sugestão: compare os estimadores $S^2 = \sum_{i=1}^{n} (X_1 - \bar{X})^2/(n-1)$ e $\hat{\sigma}^2 = \sum_{i=1}^{n} (X_1 - \bar{X})^2/n$ do parâmetro de variância $\sigma^2$ de uma distribuição normal.
  5. Crie um exemplo para comparar a variância de dois estimadores. Por exemplo compare por simulação as variâncias dos estimadores $T_1 = \bar{X}$ e $T_2 = (X_{[1]} + X_{[n]})/2$ do parâmetro $\mu$ de uma distribuição ${\rm N}(\mu, \sigma^2)$, onde $X_{[1]}$ e $X_{[n]}$ são os valores mínimo e máximo da amostra, respectivamente.
Paulo Justiniano Ribeiro Jr