Uma outra forma de sumarizar dados é em termos dos quantis ou
percentis. Essas medidas são particularmente úteis para
dados não simétricos. A mediana (ou percentil 50) é definida
como o valor que divide os dados ordenados ao meio, i.e. metade dos dados
têm valores maiores do que a mediana, a outra metade tem valores menores
do que a mediana. Adicionalmente, os quartis inferior e superior,
Q1 e Q3, são definidos como os valores abaixo dos quais estão um
quarto e três quartos, respectivamente, dos dados.
Estes três valores são frequentemente usados para resumir os dados
juntamente com o mínimo e o máximo.
Eles são obtidos ordenando os dados do menor para o maior, e então
conta-se o número apropriado de observações: ou seja é ,
e
para o quartil inferior, mediana
e quartil superior, respectivamente. Para um número par de
observações, a mediana é a média dos valores do meio (e
analogamente para os quartis inferior e superior).
A medidade de dispersão é a amplitude inter-quartis, IQR Q3
Q1, i.e. é a diferença entre o quartil superior e o inferior.
Exemplo. O número de crianças em 19 famílias foi
A mediana é o (19+1) / 2 = valor, i.e. 3 crianças.
O quartil inferior e superior são os valores e
, i.e. 2 e 6 crianças,
portanto amplitude inter-quartil é de 4 crianças. Note que 50%
dos dados estão entre os quartis inferior e superior.
Silvia E Shimakura 2006-08-30