Seja o conjunto das medidas de uma das variáveis (alturas dos pais), e seja as medidas da outra variável (alturas dos filhos). Seja , , e as médias e desvios padrão amostrais dos dois conjuntos de dados.
Primeiro calcule para cada indivíduo:
Se valores altos de acompanham valores baixos de e vice-versa então a maioria dos valores serão negativos.
Se não existir associação entre e então se tomarmos a média aritmética dos valores , valores positivos e negativos tenderão a se cancelar.
Para obter uma medida do grau de associação da relação linear entre duas variáveis, usamos o coeficiente de correlação de Pearson, definido como:
Para os dados do exemplo acima, temos , , , , , a partir dos quais podemos calcular que .
Assim como para médias e desvios padrão, existe uma letra Grega especial que utlizamos para o coeficiante de correlação populacional: . Podemos considerar como sendo uma estimativa de , exatamente como é uma estimativa da média populacional .
Abaixo estão exemplos de dados com seus coeficientes de correlação correspondentes.
Silvia Shimakura 2011-04-04