Coeficiente de Pearson

Sejam $x_1, x_2, \ldots, x_n$ os valores de um conjunto de medidas em indivíduos $i=1,..., n$. No exemplo dos pesos no nascimento $n=189$ e $x_i$ representam os pesos das mães.

Sejam $y_1, y_2, \ldots, y_n$ as outras medidas correspondentes, ou seja, pesos dos bebês. Então $x_1$ é o peso da primeira mãe, e $y_1$ é o peso ao nascer de seu bebê.

O coeficiente de correlação de Pearson é definido como:

\begin{displaymath}r = \frac{ \sum_i (x_i- \bar{x})(y_i - \bar{y})}{\sqrt{\sum_i (x_i-
\bar{x})^2 \sum_i (y_i- \bar{y})^2}}.\end{displaymath}

Ele quantifica a força de associação linear entre duas variáveis, e portanto descreve quão bem uma linha reta se ajustaria através de nuvem de pontos.

Se os pontos caem exatamente sobre uma linha crescente então $r=1$, e se eles caem exatamente sobre uma linha decrescente, $r=-1$.

Para a Figura 37, a correlação é 0,189, bem próxima de zero como esperado mas positiva, o que também parece consistente com o gráfico e o bom senso.

Podemos também fazer um teste da hipótese nula de não associação. Aqui obtem-se um $p$-valor de 0,011. Temos portanto evidência estatísticamente significativa ao nível de 5% de uma associação entre peso da mãe e o peso de nascimento do bebê.

Este é um exemplo em que há significância estatística, mas não muita associação na prática.

Exercício:
Dados de peso de peixe e comprimento de "otilithbegincenter \fbox{\begin{tabular}{l\vert rrrrrrrrrr}
Otolith length $x$ (mm) & 6.6 & 6.9 & ...
...s $y$ (g) & 86 & 92 & 71 & 74 & 185 & 85 & 201 & 283 & 255 &
222
\end{tabular}} Construa um gráfico de dispersão e calcule o coeficiente de correlação.

Parece existir uma relação entre as variáveis?

Podemos confiar que exista mesmo uma associação com somente 10 valores?

Uma relação linear parece ser apropriada?

Suposições: o teste assume que uma ou ambas as variáveis são aproximadamente normais. Se os dados não parecem formar uma nuvem aproximadamente em forma de elipse, isto é evidência de não-normalidade e o valor de $p$ não deveria ser usado.

Silvia Shimakura 2005-11-08