Estimação

No exemplo acima interessa saber se existe efeito de fertilizante.

Mas o que é existir efeito de fertilizante?

Num mesmo tratamento, plantas diferentes respondem de formas diferentes (variabilidade). O peso seco das plantas é uma variável aleatória!

Vamos considerar que existe efeito de fertilizante quando o peso seco médio das plantas cultivadas em ambiente fertilizado diferir do peso seco médio das plantas cultivadas em ambiente padrão. Isto é, quando as distribuições do peso seco para o grupo controle e grupo tratamento apresentam médias, digamos $\mu_c$ e $\mu_t$ , diferentes.

As quantidades $\mu_c$ e $\mu_t$ são desconhecidas e chamadas parâmetros, e só podem ser conhecidas se observarmos toda a população, o que é quase sempre impossível.

O que fazemos é estimar os parâmetros a partir de uma amostra da população.

As médias $\mu_c$ e $\mu_t$ podem ser estimadas pelas médias amostrais $\bar{X}_c$ e $\bar{X}_t$ , que são funções dos valores da amostra e são chamadas de estimadores de $\mu_c$ e $\mu_t$ .

Os valores de $\bar{X}_c$ e $\bar{X}_t$ observados na amostra

$\bar{x}_c=5,03$ g e $\bar{x}_t=4,66$ g

são chamados de estimativas dos parâmetros. Observe que denotamos estimativas por letras minúsculas e estimadores por letras maiúsculas.

Exemplo: Exemplo 6.1.2 pág 122
Dois diferentes tipos de secagem foram usados na preparação de sementes. Duzentas sementes foram aleatoriamente selecionadas para serem submetidas a dois processos de secagem A e B. Após a secagem, as sementes foram osbervadas quanto à sua germinação. Os resultados foram:

Processo de	Germinação
secagem	Sim	Não	Total
A	70	30	100
B	62	38	100
Total	132	68	200

Neste caso interessa saber se existe diferença entre os métodos de secagem quanto à germinanção de sementes. Vamos considerar que existe efeito de método de secagem quando as proporções populacionais de sementes germinadas pelos métodos A, , e B, , diferem.

Os parâmetros de interesse e são estimados pelas proporções amostrais

$\hat{p}_A=\frac{x_A}{n_A}$ e $\hat{p}_B=\frac{x_B}{n_B}$

em que

é o número de sementes submetidas ao processo A que germinaram;
é o número total de sementes submetidas ao processo A;
é o número de sementes submetidas ao processo B que germinaram;
é o número total de sementes submetidas ao processo B;

As estimativas dos parâmetros e são $\hat{p}_A=0,70$ e $\hat{p}_B=0,62$ .

Nos exemplos acima, os parâmetros de interesse forma médias e proporções, mas poderiamos estar interessados em estimar medianas, desvios-padrão, etc.

Diferentes amostras podem ser retiradas de uma mesma população, e amostras diferentes podem resultar em estimativas diferentes. Isto é, um estimador é uma variável aleatória, podendo assumir valores diferentes para cada amostra.

Então, ao invés de estimar o parâmetro de interesse por um único valor, é muito mais informativo estimá-lo por um intervalo de valores que considere a variação presente na amostra e que contenha o seu verdadeiro valor com determinada confiança. Este intervalo é chamado de intervalo de confiança.

Para construir um intervalo de confiança precisamos conhecer a distribuição de probabilidade do estimador. Lembre que um estimador é uma variável aleatória e que uma variável aleatória é completamente caracterizada por sua distribuição de probabilidade.

Na próxima seção serão apresentados resultados sobre a distribuição de probabilidade da média amostral.

Subsecções

Silvia Shimakura 2005-11-08