19 Ilustrando propriedades de estimadores

19.1 Consistência

Um estimador é consistente quando seu valor se aproxima do verdadeiro valor do parâmetro à medida que aumenta-se o tamanho da amostra. Vejamos como podemos ilustrar este resultado usando simulação. A idéia básica é a seguite:

1.
escolher uma distribuição e seus parâmetros,
2.
definir o estimador,
3.
definir uma sequência crescente de valores de tamanho de amostras,
4.
obter uma amostra de cada tamanho,
5.
calcular a estatística para cada amostra,
6.
fazer um gráfico dos valores das estimativas contra o tamanho de amostra, indicando neste gráfico o valor verdadeiro do parâmetro.

19.1.1 Média da distribuição normal

Seguindo os passos acima vamos:

1.
tomar a distribuição Normal de média 10 e variância 4,
2.
definir o estimador X = i=1nxi
n,
3.
escolhemos os tamanhos de amostra n = 2, 5, 10, 15, 20,, 1000, 1010, 1020,, 5000,
4.
fazemos os cálculos e produzimos um gráfico como mostrado na 47 com os comandos a seguir.

  > ns <- c(2, seq(5, 1000, by = 5), seq(1010, 5000, by = 10))
  > estim <- numeric(length(ns))
  > for (i in 1:length(ns)) {
  +     amostra <- rnorm(ns[i], 10, 4)
  +     estim[i] <- mean(amostra)
  + }
  > plot(ns, estim)
  > abline(h = 10)


PIC

Figura 47: Médias de amostras de diferentes tamanhos.


19.2 Momentos das distribuições amostrais de estimadores

Para inferência estatística é necessário conhecer a distribuição amostral dos estimadores. Em alguns casos estas distribuições são derivadas analiticamente. Isto se aplica a diversos resultados vistos em um curso de Inferência Estatística. Por exemplo o resultado visto na sessão 28: se Y 1,Y 2,Y n ~ N(μ,σ2) então y ~ N(μ,σ2∕n). Resultados como estes podem ser ilustrados computacionalmente como visto na Sessão 28.

Além disto este procedimento permite investigar distribuições amostrais que são complicadas ou não podem ser obtidas analiticamente.

Vamos ver um exemplo: considere Y uma v.a. com distribuição normal N(μ,σ2) e seja um parâmetro de interesse θ = μ∕σ2. Para obter por simulação a esperança e variância do estimador T = Y ∕S2 onde Y é a média e S2 a variância de uma amostra seguimos os passos:

1.
escolher uma distribuição e seus parâmetros, no caso vamos escolher uma N(180, 64),
2.
definir um tamanho de amostra, no caso escolhemos n = 20,
3.
obter por simulação um número N de amostras, vamos usar N = 1000,
4.
calcular a estatística de interesse para cada amostra,
5.
usar as amostras para obter as estimativas Ê[T] e  ˆ
V ar[T].

Vamos ver agora comandos do R.

  > amostras <- matrix(rnorm(20 * 1000, mean = 180, sd = 8), nc = 1000)
  > Tvals <- apply(amostras, 2, function(x) {
  +     mean(x)/var(x)
  + })
  > ET <- mean(Tvals)
  > ET

  [1] 3.209218

  > VarT <- var(Tvals)
  > VarT

  [1] 1.327251

Nestes comandos primeiro obtemos 1000 amostras de tamanho 20 que armazenamos em uma matriz de dimensão 20 × 1000, onde cada coluna é uma amostra. A seguir usamos a função apply para calcular a quantidade desejada que definimos com function(x) {mean(x)/var(x)}. No caso anterior foi obtido Ê[T] 3.21 e V ˆar[T] 1.33.

Se voce rodar os comandos acima deverá obter resultados um pouco diferentes (mas não muito!) pois nossas amostras da distribuição normal não são as mesmas. Para obter as masmas amostras teríamos que usar a mesma semente para geração de números aleatórios.

19.3 Não-tendenciosidade

Fica como exercício.

19.4 Variância mínima

Fica como exercício.

19.5 Exercícios

1.
Ilustre a consistência do estimador ˆ
λ = 1X de uma distribuição exponencial f(x) = λ exp{-λx}.
2.
No exemplo dos momentos das distribuições de estimadores visto em (19.2) ilustramos a obtenção dos momentos para um tamanho fixo de amostra n = 20. Repita o procedimento para vários tamanho de amostra e faça um gráfico mostrando o comportamento de Ê[T] e Vˆar[T] em função de n.
3.
Estime por simulação a esperança e variância do estimador ˆλ = X de uma distribuição de Poisson de parâmetro λ para um tamanho de amostra n = 30. Compare com os valores obtidos analiticamente. Mostre em um gráfico como os valores de Ê[ˆ
λ] e   ˆ
V ar[ˆ
λ] variam em função de n.
4.
Crie um exemplo para ilustrar a não tendenciosidade de estimadores. Sugestão: compare os estimadores S2 = i=1n(X 1 -X)2(n - 1) e ˆσ2 = i=1n(X 1 -X)2∕n do parâmetro de variância σ2 de uma distribuição normal.
5.
Crie um exemplo para comparar a variância de dois estimadores. Por exemplo compare por simulação as variâncias dos estimadores T1 = X e T2 = (X[1] +X[n])2 do parâmetro μ de uma distribuição N(μ,σ2), onde X [1] e X[n] são os valores mínimo e máximo da amostra, respectivamente.