Subsections


5 Ilustrando propriedades de estimadores

5.1 Consistência

Um estimador é consistente quando seu valor se aproxima do verdadeiro valor do parâmetro à medida que aumenta-se o tamanho da amostra. Vejamos como podemos ilustrar este resultado usando simulação. A idéia básica é a seguite:
  1. escolher uma distribuição e seus parâmetros,
  2. definir o estimador,
  3. definir uma sequência crescente de valores de tamanho de amostras,
  4. obter uma amostra de cada tamanho,
  5. calcular a estatística para cada amostra,
  6. fazer um gráfico dos valores das estimativas contra o tamanho de amostra, indicando neste gráfico o valor verdadeiro do parâmetro.

5.1.1 Média da distribuição normal

Seguindo os passos acima vamos:
  1. tomar a distribuição Normal de média 10 e variância 4,
  2. definir o estimador $ \bar{x}=\sum_{i=1}^n \frac{x_i}{n}$,
  3. escolhemos os tamanhos de amostra $ n=2, 5, 10, 15, 20,\ldots, 1000, 1010, 1020, \ldots, 5000$,
  4. fazemos os cálculos e produzimos um gráfico com os comandos abaixo.

> ns <- c(2, seq(5, 1000, by=5), seq(1010, 5000, by=10))
> estim <- numeric(length(ns))
> for (i in 1:length(ns)){
>   amostra <- rnorm(ns[i], 10, 4)
>   estim[i] <- mean(amostra)
> }
> plot(ns, estim)
> abline(h=10)

Figura 9: Médias de amostras de diferentes tamanhos.
\includegraphics[width=0.6\textwidth]{figuras/prop01.ps}


5.2 Momentos das distribuições amostrais de estimadores

Para inferência estatística é necessário conhecer a distribuição amostral dos estimadores. Em alguns casos estas distribuições são derivadas analiticamente. Isto se aplica a diversos resultados vistos no curso de Inferência I. Por exemplo o resultado visto na Sessãosimulacao 3: se $ Y_1, Y_2, \ldots Y_n \sim {\rm N}(\mu,\sigma^2)$ então $ \bar{y} \sim {\rm N}(\mu,\sigma^2/n)$. Resultados como estes podem ser ilustrados computacionalmente como visto na Sessãosimulacao 3.

Além disto este procedimento permite investigar distribuições amostrais que não podem ser obtidas analiticamente. Vamos ver um exemplo: considere $ X$ uma v.a. com distribuição normal $ N(\mu, \sigma^2)$ e seja um parâmetro de interesse $ \theta=\mu / \sigma^2$. Obter a esperança e variância de um estimador de $ T=\bar{X}/S^2$ onde $ \bar{X}$ é a média e $ S^2$ a variância de uma amostra.

  1. escolher uma distribuição e seus parâmetros, no caso vamos escolher uma $ N(180, 64)$,
  2. definir um tamanho de amostra, no caso escolhemos $ n=20$,
  3. obter por simulação um número $ N$ de amostras, vamos usar $ N=1000$,
  4. calcular a estatística de interesse para cada amostra,
  5. obter as estimativas $ \hat{E}[T]$ e $ \hat{{\rm Var}}[T]$ usando as amostras.

Vamos ver agora comandos do .

> amostras <- matrix(rnorm(20*1000, mean=180, sd=8), nc=1000)
> Tvals <- apply(amostras, 2, function(x) {mean(x)/var(x)})
> ET <- mean(Tvals)
> ET
[1] 3.134504
> VarT <- var(Tvals)
> VarT
[1] 1.179528

Nestes comandos primeiro obtemos 1000 amostras de tamanho 20 que armazenamos em uma matrix de dimensão $ 20 \times 1000$, onde cada coluna é uma amostra. A seguir usamos a função apply para calcular a quantidade desejada que definimos com function(x) {mean(x)/var(x)}. No meu caso acima obtive $ \hat{E}[T] \approx 3.13$ e $ \hat{{\rm Var}}[T] \approx 1.18$. Se voce rodar os comandos acima deverá obter resultados um pouco diferentes (mas não muito!) pois nossas amostras da distribuição normal não são as mesmas.

5.3 Não-tendenciosidade

Fica como exercício, ver abaixo.

5.4 Variância mínima

Fica como exercício, ver abaixo.

5.5 Exercícios

  1. Ilustre a consistência do estimador $ \hat{\lambda} = 1/\bar{X}$ de uma distribuição exponencial $ f(x)=\lambda \exp\{-\lambda x\}$.
  2. No exemplo dos momentos das distribuições de estimadores visto em (5.2) ilustramos a obtenção dos momentos para um tamanho fixo de amostra $ n=20$. Repita o procedimento para vários tamanho de amostra e faça um gráfico mostrando o comportamento de $ \hat{E}[T]$ e $ \hat{{\rm Var}}[T]$ em função de $ n$.
  3. Estime por simulação a esperança e variância do estimador $ \hat{\lambda} = \bar{X}$ de uma distribuição de Poisson de parâmetro $ \lambda $ para um tamanho de amostra $ n=30$. Compara com os valores obtidos analiticamente. Mostre em um gráfico como os valores de $ \hat{E}[\lambda]$ e $ \hat{{\rm Var}}[\lambda]$ variam em função de $ n$.
  4. Crie um exemplo para ilustrar a não tendenciosidade de estimadores. Sugestão: compare os estimadores $ S^2 = \sum_{i=1}^{n} (x_1 - \bar{x})^2/(n-1)$ e $ \sigma^2 = \sum_{i=1}^{n} (x_1 - \bar{x})^2/n$ do parâmetro de variância $ \sigma^2$ de uma distribuição normal.
  5. Crie um exemplo para comparar a variância de dois estimadores. Por exemplo compare por simulação as variâncias dos estimadores $ T_1 = \bar{X}$ e $ T_2 = (X_1 + X_n)/2$ do parâmetro $ \mu $ de uma distribuição $ {\rm N}(\mu, \sigma^2)$, onde $ X_1$ e $ X_n$ são os valores mínimo e máximo da amostra, respectivamente.
Paulo Justiniano & Paulo Ricardo