O Diagrama de Dispersão

O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são usados para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada elemento do conjunto de dados.

A Tabela 7 e a Figura 26 mostram um esquema do desenho do diagrama de dispersão. Neste exemplo, foram medidos os valores de duas variáveis quantitativas, X e Y, em quatro indivíduos. O eixo horizontal do gráfico representa a variável X e o eixo vertical representa a variável Y.


Tabela 7: Dados esquemáticos.
Indivíduos Variável X Variável Y
A 2 3
B 4 3
C 4 5
D 8 7
   

Figura 26: Esquema do diagrama de dispersão.
\begin{figure}\centerline{\psfig{figure=figuras/disp.ps,height=3in}}
\end{figure}

O diagrama de dispersão é usado principalmente para visualizar a relação/associação entre duas variáveis, mas também para é muito útil para:

A seguir, veremos quatro exemplos da utilização do diagrama de dispersão. Os dois primeiros referem-se ao estudo da associação entre duas variáveis. O terceiro utiliza o diagrama de dispersão para comparar o efeito de duas condições no mesmo indivíduo. O último exemplo, similar ao terceiro, verifica o efeito da aplicação de um tratamento, comparando as medidas antes e depois da medicação.

Exemplo dos ursos marrons (continuação):
Recorde que um dos objetivos dos pesquisadores neste estudo é encontrar uma maneira de conhecer o peso do urso através de uma medida mais fácil de se obter do que a direta (carregar uma balança para o meio da selva e colocar os ursos em cima dela) como, por exemplo, uma medida de comprimento (altura, perímetro do tórax, etc.).

O problema estatístico aqui é encontrar uma variável que tenha uma relação forte com o peso, de modo que, a partir de seu valor medido, possa ser calculado (estimado, na verdade) o valor peso indiretamente, através de uma equação matemática.

O primeiro passo para encontrar esta variável é fazer o diagrama de dispersão das variáveis candidatas (eixo horizontal) versus o peso (eixo vertical), usando os pares de informações de todos os ursos. Você pode tentar as variáveis: idade, altura, comprimento da cabeça, largura da cabeça, perímetro do pescoço e perímetro do tórax.

Na Figura 27, mostramos a relação entre peso e altura e entre peso e perímetro do tórax. Respectivamente.

Figura 27: Diagrama de dispersão da altura versus o peso (a) e do perímetro do tórax versus o peso (b) dos ursos marrons.
\begin{figure}\mbox{\centerline{(a)\psfig{figure=figuras/disp1.ps,height=2.5in}
(b)\psfig{figure=figuras/disp2.ps,height=2.5in}}}\\
\end{figure}

Podemos ver que, tanto a altura quanto o perímetro do tórax são fortemente associados ao peso do urso, no sentido de que quanto mais alto o urso ou quanto maior a medida de seu tórax, mais pesado ele será.

Mas note que este crescimento é linear para o perímetro do tórax e não-linear para a altura.

Além disso, com os pontos estão mais dispersos no gráfico da altura, a variável mais adequada para estimar, sozinha, o peso é o perímetro do tórax (a técnica estatística adequada aqui chama-se Regressão Linear Simples).

Exemplo dos morangos:
Um produtor de morangos para exportação deseja produzir frutos grandes, pois frutos pequenos têm pouco valor mesmo no mercado interno. Além disso, os frutos, mesmo grandes, não devem ter tamanhos muito diferentes entre si. O produtor suspeita que uma dos fatores que altera o tamanho dos frutos é o número de frutos por muda.

Para investigar a relação entre o número de frutos que uma planta produz e o peso destes frutos, ele observou dados de 10 morangueiros na primeira safra (Tabela 8). O diagrama de dispersão é mostrado na Figura 28.


Tabela 8: Peso dos frutos e número de frutos por planta em 10 morangueiros na primeira safra.
Muda N Peso dos Frutos (gramas)
1 5 15,2 15,5 15,6 15,7 16,4                  
2 6 14,0 14,5 15,4 15,9 15,9 16,1                
3 7 13,7 13,8 14,1 14,1 14,5 14,9 15,5              
4 8 11,0 11,5 12,4 12,4 12,9 14,5 15,5 16,6            
5 9 10,2 11,1 12,1 12,4 13,5 13,8 14,0 15,4 16,0          
6 10 9,0 9,3 10,7 11,6 11,7 12,6 12,8 12,8 13,4 15,1        
7 11 7,8 8,6 8,7 9,6 11,1 11,9 12,1 12,5 14,1 14,2 14,0      
8 12 7,3 9,4 10,2 10,3 10,8 10,6 11,1 11,5 11,5 12,9 13,4 15,0    
9 13 6,9 7,6 8,5 10,0 10,9 11,0 11,4 11,6 12,0 12,0 12,7 13,5 14,0  
10 14 7,0 8,0 9,0 10,0 10,0 10,5 11,0 11,2 11,2 11,7 12,5 12,9 13,5 13,5
                             

O diagrama de dispersão mostra-nos dois fatos. O primeiro, que há um decréscimo no valor médio do peso do fruto por árvore à medida que cresce o número de frutos na árvore. Ou seja, não é vantagem uma árvore produzir muitos frutos, pois ele tenderão a ser muito pequenos.

Figura 28: Diagrama de dispersão do número de frutos por árvore versus o peso do fruto e linha unindo os pesos médios dos frutos.
\begin{figure}\centerline{\psfig{figure=figuras/disp3.ps,height=3.0in}}
\end{figure}

O segundo fato que percebemos é que, com o aumento no número de frutos na árvores, cresce também a variabilidade no peso, gerando tanto frutos muito grandes, como muito pequenos.

Assim, conclui-se que não é vantagem ter poucas plantas produzindo muito frutos, mas sim muitas plantas produzindo poucos frutos, mas grandes e uniformes. Uma análise mais detalhada poderá determinar o número ideal de frutos por árvore, aquele que maximiza o peso médio e, ao mesmo tempo, minimiza a variabilidade do peso.

Exemplo da Capacidade Pulmonar:
Captopril é um remédio destinado a baixar a pressão sistólica. Para testar seu efeito, ele foi ministrado a 12 pacientes, tendo sido medida a pressão sistólica antes e depois da medicação (Tabela 9).


Tabela 9: Pressão sistólica (mmHg) medida em 12 pacientes antes e depois do Captopril.
Paciente A B C D E F G H I J K L
Antes 200 174 198 170 179 182 193 209 185 155 169 210
Depois 191 170 177 167 159 151 176 183 159 145 146 177
                       

Os mesmos indivíduos foram utilizados nas duas amostras (Antes/depois). Assim, é natural compararmos a pressão sistólica para cada indivíduo, comparando a pressão sistólica depois e antes. Para todos os pacientes, a pressão sistólica depois do Captopril é menor do que antes da medicação. Mas como podemos ver se estas diferenças são grandes ? Através do diagrama de dispersão mostrado na Figura 29.

Figura 29: Diagrama de dispersão da pressão sistólica antes X depois da medicação e linha correspondendo ao não efeito individual da medicação.
\begin{figure}\centerline{\psfig{figure=figuras/disp4.ps,height=3.0in}}
\end{figure}

Cada ponto no diagrama de dispersão corresponde às medidas de pressão sistólica de um paciente, medida antes e depois da medicação.

A linha marcada no diagrama corresponde à situação onde a pressão sistólica não se alterou depois do paciente tomar o Captopril.

Veja que todos os pontos estão abaixo desta linha, ou seja para todos os pacientes o Captopril fez efeito. Grande parte destes pontos está bem distante da linha, mostrando que a redução na pressão sistólica depois do uso do medicamento não foi pequena.

silvia 2012-09-20