Quando temos amostras independentes de cada uma de duas populações, podemos sumarizá-las pelas suas médias, desvios padrão e tamanhos amostrais.
Denote estas medidas por ,
,
para a amostra 1 e
,
,
para a amostra
2.
Denote as correspondentes médias populacionais e desvios padrão
,
,
e
respectivamente.
Para os dados de alturas dos estudantes da UFPR, vamos comparar a altura média dos estudantes do sexo masculino com as dos sexo feminino.
Seja o grupo dos homens a amostra 1, e o grupo das mulheres a amostra 2.
As alturas foram medidas em centímetros e as medidas sumárias foram como segue:
Agora claramente uma estimativa natural da diferença entre médias na
população, , é dada pela diferença nas médias
amostrais:
Agora o que precisamos é um erro padrão para esta estimativa para que possamos
construir um intervalo de confiança ou realizar um teste da hipótese
nula H:
versus H
:
.
O cálculo do erro padrão de
depende da suposição feita a respeito dos desvios padrão de cada grupo de comparação.
Uma regra prática é assumir que os desvios padrão populacionais e
são iguais se a razão do maior desvio padrão amostral para o menor for menor do que 2 ou 3.
Além disso a suposição de variâncias iguais pode ser grosseiramente avaliada através de histogramas dos dados.
Testes formais estão disponíveis se necessário. Um deles é o teste F para igualdade de variâncias de Levene cuja hipótese nula é a de que
.