A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística.
Exemplo: O peso de recém-nascidos é uma variável aleatória contínua. A Figura 31 e Figura 32 abaixo mostram a distribuição de frequências relativas de 100 e 5000 pesos de recém-nascidos com intervalos de classe de 500g e 125g, respectivamente.
O segundo histograma é um refinamento do primeiro, obtido aumentando-se o tamanho da amostra e reduzindo-se a amplitude dos intervalos de classe. Ele sugere a curva na Figura 33, que é conhecida como curva normal ou Gaussiana.
A variável aleatória considerada neste exemplo e muitas outras variáveis da área biológica podem ser descritas pelo modelo normal ou Gaussiano.
A equação da curva Normal é especificada usando 2 parâmetros: a média , e o desvio padrão .
Denotamos N() à curva Normal com média e desvio padrão .
A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva.
A distribuição normal é simétrica em torno da média o que implica que e média, a mediana e a moda são todas coincidentes.
Para referência, a equação da curva é
(8) |
Felizmente, você não tem que memorizar esta equação. O importante é que você entenda como a curva é afetada pelos valores numéricos de e . Isto é mostrado no diagrama da Figura 34.
A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é 1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a curva entre esses dois valores.
Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são:
Range | Proportion |
68.3% | |
95.5% | |
99.7% |
Exemplo: Suponhamos que no exemplo do peso do recém-nascidos e . Então:
Usando este modelo podemos dizer que cerca de 68% dos recém-nascidos pesam entre 2300g e 3300g. O peso de aproximadamente 95% dos recém-nascidos está entre 1800g e 3800g. Praticamente todos os bebês desta população nascem com peso no intervalo (1300,4300).
Na prática desejamos calcular probabilidades para diferentes valores de e .
Para isso, a variável cuja distribuição é é transformada numa forma padronizada com distribuição (distribuição normal padrão) pois tal distribuição é tabelada.
A quantidade é dada por
(9) |
Exemplo: A concentração de um poluente em água liberada por uma fábrica tem distribuição N(8,1.5). Qual a chance, de que num dado dia, a concentração do poluente exceda o limite regulatório de 10 ppm?
A solução do problema resume-se em determinar a proporção da
distribuição que está acima de 10 ppm, ie .
Usando a estatística temos:
(10) |
Exercício: A concentração de cadmio em cinzas de um certo lixo radioativo tem distribuição N(1,0.72). Quais são as chances de que uma amostra aleatória das cinzas tenha uma concentração de cadmio entre 0.5 e 1.75 ppm?
Silvia Shimakura 2005-11-08