19 Ilustrando propriedades de estimadores
19.1 Consistência
Um estimador é consistente quando seu valor se aproxima do verdadeiro valor do parâmetro à medida
que aumenta-se o tamanho da amostra. Vejamos como podemos ilustrar este resultado usando
simulação. A idéia básica é a seguite:
-
1.
- escolher uma distribuição e seus parâmetros,
-
2.
- definir o estimador,
-
3.
- definir uma sequência crescente de valores de tamanho de amostras,
-
4.
- obter uma amostra de cada tamanho,
-
5.
- calcular a estatística para cada amostra,
-
6.
- fazer um gráfico dos valores das estimativas contra o tamanho de amostra, indicando neste
gráfico o valor verdadeiro do parâmetro.
19.1.1 Média da distribuição normal
Seguindo os passos acima vamos:
-
1.
- tomar a distribuição Normal de média 10 e variância 4,
-
2.
- definir o estimador X = ∑
i=1n,
-
3.
- escolhemos os tamanhos de amostra n = 2, 5, 10, 15, 20,…, 1000, 1010, 1020,…, 5000,
-
4.
- fazemos os cálculos e produzimos um gráfico como mostrado na 47 com os comandos a
seguir.
> ns <- c(2, seq(5, 1000, by = 5), seq(1010, 5000, by = 10))
> estim <- numeric(length(ns))
> for (i in 1:length(ns)) {
+ amostra <- rnorm(ns[i], 10, 4)
+ estim[i] <- mean(amostra)
+ }
> plot(ns, estim)
> abline(h = 10)
19.2 Momentos das distribuições amostrais de estimadores
Para inferência estatística é necessário conhecer a distribuição amostral dos estimadores. Em alguns
casos estas distribuições são derivadas analiticamente. Isto se aplica a diversos resultados vistos
em um curso de Inferência Estatística. Por exemplo o resultado visto na sessão 28: se
Y 1,Y 2,…Y n ~ N(μ,σ2) então y ~ N(μ,σ2∕n). Resultados como estes podem ser ilustrados
computacionalmente como visto na Sessão 28.
Além disto este procedimento permite investigar distribuições amostrais que são complicadas ou
não podem ser obtidas analiticamente.
Vamos ver um exemplo: considere Y uma v.a. com distribuição normal N(μ,σ2) e seja um
parâmetro de interesse θ = μ∕σ2. Para obter por simulação a esperança e variância do
estimador T = Y ∕S2 onde Y é a média e S2 a variância de uma amostra seguimos os
passos:
-
1.
- escolher uma distribuição e seus parâmetros, no caso vamos escolher uma N(180, 64),
-
2.
- definir um tamanho de amostra, no caso escolhemos n = 20,
-
3.
- obter por simulação um número N de amostras, vamos usar N = 1000,
-
4.
- calcular a estatística de interesse para cada amostra,
-
5.
- usar as amostras para obter as estimativas Ê[T] e [T].
Vamos ver agora comandos do R.
> amostras <- matrix(rnorm(20 * 1000, mean = 180, sd = 8), nc = 1000)
> Tvals <- apply(amostras, 2, function(x) {
+ mean(x)/var(x)
+ })
> ET <- mean(Tvals)
> ET
> VarT <- var(Tvals)
> VarT
Nestes comandos primeiro obtemos 1000 amostras de tamanho 20 que armazenamos em uma
matriz de dimensão 20 × 1000, onde cada coluna é uma amostra. A seguir usamos a função apply
para calcular a quantidade desejada que definimos com function(x) {mean(x)/var(x)}. No caso
anterior foi obtido Ê[T] ≈ 3.21 e [T] ≈ 1.33.
Se voce rodar os comandos acima deverá obter resultados um pouco diferentes (mas não muito!)
pois nossas amostras da distribuição normal não são as mesmas. Para obter as masmas amostras
teríamos que usar a mesma semente para geração de números aleatórios.
19.3 Não-tendenciosidade
Fica como exercício.
19.4 Variância mínima
Fica como exercício.
19.5 Exercícios
-
1.
- Ilustre a consistência do estimador = 1∕X de uma distribuição exponencial f(x) =
λ exp{-λx}.
-
2.
- No exemplo dos momentos das distribuições de estimadores visto em (19.2) ilustramos a
obtenção dos momentos para um tamanho fixo de amostra n = 20. Repita o procedimento
para vários tamanho de amostra e faça um gráfico mostrando o comportamento de Ê[T]
e [T] em função de n.
-
3.
- Estime por simulação a esperança e variância do estimador = X de uma distribuição
de Poisson de parâmetro λ para um tamanho de amostra n = 30. Compare com os valores
obtidos analiticamente. Mostre em um gráfico como os valores de Ê[] e [] variam
em função de n.
-
4.
- Crie um exemplo para ilustrar a não tendenciosidade de estimadores. Sugestão: compare
os estimadores S2 = ∑
i=1n(X
1 -X)2∕(n - 1) e 2 = ∑
i=1n(X
1 -X)2∕n do parâmetro
de variância σ2 de uma distribuição normal.
-
5.
- Crie um exemplo para comparar a variância de dois estimadores. Por exemplo compare
por simulação as variâncias dos estimadores T1 = X e T2 = (X[1] +X[n])∕2 do parâmetro
μ de uma distribuição N(μ,σ2), onde X
[1] e X[n] são os valores mínimo e máximo da
amostra, respectivamente.