Sejam os valores de um conjunto de medidas em indivíduos . No exemplo dos pesos no nascimento e representam os pesos das mães.
Sejam as outras medidas correspondentes, ou seja, pesos dos bebês. Então é o peso da primeira mãe, e é o peso ao nascer de seu bebê.
O coeficiente de correlação de Pearson é definido como:
Ele quantifica a força de associação linear entre duas variáveis, e portanto descreve quão bem uma linha reta se ajustaria através de nuvem de pontos.
Se os pontos caem exatamente sobre uma linha crescente então , e se eles caem exatamente sobre uma linha decrescente, .
Para a Figura 37, a correlação é 0,189, bem próxima de zero como esperado mas positiva, o que também parece consistente com o gráfico e o bom senso.
Podemos também fazer um teste da hipótese nula de não associação. Aqui obtem-se um -valor de 0,011. Temos portanto evidência estatísticamente significativa ao nível de 5% de uma associação entre peso da mãe e o peso de nascimento do bebê.
Este é um exemplo em que há significância estatística, mas não muita associação na prática.
Exercício:
Dados de peso de peixe e comprimento de "otilithbegincenter
Construa um gráfico de dispersão e calcule o coeficiente de correlação.
Parece existir uma relação entre as variáveis?
Podemos confiar que exista mesmo uma associação com somente 10 valores?
Uma relação linear parece ser apropriada?
Suposições: o teste assume que uma ou ambas as variáveis são aproximadamente normais. Se os dados não parecem formar uma nuvem aproximadamente em forma de elipse, isto é evidência de não-normalidade e o valor de não deveria ser usado.
Silvia Shimakura 2005-11-08