No exemplo acima interessa saber se existe efeito de fertilizante.
Mas o que é existir efeito de fertilizante?
Num mesmo tratamento, plantas diferentes respondem de formas diferentes (variabilidade). O peso seco das plantas é uma variável aleatória!
Vamos considerar que existe efeito de fertilizante quando o peso seco médio das plantas cultivadas em ambiente fertilizado diferir do peso seco médio das plantas cultivadas em ambiente padrão. Isto é, quando as distribuições do peso seco para o grupo controle e grupo tratamento apresentam médias, digamos e , diferentes.
As quantidades e são desconhecidas e chamadas parâmetros, e só podem ser conhecidas se observarmos toda a população, o que é quase sempre impossível.
O que fazemos é estimar os parâmetros a partir de uma amostra da população.
As médias e podem ser estimadas pelas médias amostrais e , que são funções dos valores da amostra e são chamadas de estimadores de e .
Os valores de e observados na amostra
g e g
são chamados de estimativas dos parâmetros. Observe que denotamos estimativas por letras minúsculas e estimadores por letras maiúsculas.
Exemplo: Exemplo 6.1.2 pág 122
Dois diferentes tipos de secagem foram usados na preparação de sementes. Duzentas sementes foram aleatoriamente selecionadas para serem submetidas a dois processos de secagem A e B. Após a secagem, as sementes foram osbervadas quanto à sua germinação. Os resultados foram:
Processo de | Germinação | ||
secagem | Sim | Não | Total |
A | 70 | 30 | 100 |
B | 62 | 38 | 100 |
Total | 132 | 68 | 200 |
Neste caso interessa saber se existe diferença entre os métodos de secagem quanto à germinanção de sementes. Vamos considerar que existe efeito de método de secagem quando as proporções populacionais de sementes germinadas pelos métodos A, , e B, , diferem.
Os parâmetros de interesse e são estimados pelas proporções amostrais
e
em que
é o número de sementes submetidas ao processo A que germinaram;
é o número total de sementes submetidas ao processo A;
é o número de sementes submetidas ao processo B que germinaram;
é o número total de sementes submetidas ao processo B;
As estimativas dos parâmetros e são e .
Nos exemplos acima, os parâmetros de interesse forma médias e proporções, mas poderiamos estar interessados em estimar medianas, desvios-padrão, etc.
Diferentes amostras podem ser retiradas de uma mesma população, e amostras diferentes podem resultar em estimativas diferentes. Isto é, um estimador é uma variável aleatória, podendo assumir valores diferentes para cada amostra.
Então, ao invés de estimar o parâmetro de interesse por um único valor, é muito mais informativo estimá-lo por um intervalo de valores que considere a variação presente na amostra e que contenha o seu verdadeiro valor com determinada confiança. Este intervalo é chamado de intervalo de confiança.
Para construir um intervalo de confiança precisamos conhecer a distribuição de probabilidade do estimador. Lembre que um estimador é uma variável aleatória e que uma variável aleatória é completamente caracterizada por sua distribuição de probabilidade.
Na próxima seção serão apresentados resultados sobre a distribuição de probabilidade da média amostral.