A distribuição Normal é a mais familiar das distribuições de probabilidade e também uma das mais importantes em estatística.
Exemplo: O peso de recém-nascidos é uma variável aleatória contínua. A Figura 32 e Figura 33 abaixo mostram a distribuição de frequências relativas de 100 e 5000 pesos de recém-nascidos com intervalos de classe de 500g e 125g, respectivamente.
O segundo histograma é um refinamento do primeiro, obtido aumentando-se o tamanho da amostra e reduzindo-se a amplitude dos intervalos de classe. Ele sugere a curva na Figura 34, que é conhecida como curva normal ou Gaussiana.
A variável aleatória considerada neste exemplo e muitas outras variáveis da área biológica podem ser descritas pelo modelo normal ou Gaussiano.
A equação da curva Normal é especificada usando 2 parâmetros: a média , e o desvio padrão .
Denotamos N( ) à curva Normal com média e desvio padrão .
A média refere-se ao centro da distribuição e o desvio padrão ao espalhamento (ou achatamento) da curva.
A distribuição normal é simétrica em torno da média o que implica que a média, a mediana e a moda são todas coincidentes.
Para referência, a equação da curva é
(7) |
Felizmente, você não tem que memorizar esta equação. O importante é que você entenda como a curva é afetada pelos valores numéricos de e . Isto é mostrado no diagrama da Figura 35.
A área sob a curva normal (na verdade abaixo de qualquer função de densidade de probabilidade) é 1. Então, para quaisquer dois valores específicos podemos determinar a proporção de área sob a curva entre esses dois valores.
Para a distribuição Normal, a proporção de valores caindo dentro de um, dois, ou três desvios padrão da média são:
Range | Proportion |
68.3% | |
95.5% | |
99.7% |
Exemplo: Suponhamos que no exemplo do peso do recém-nascidos e . Então:
Usando este modelo podemos dizer que cerca de 68% dos recém-nascidos pesam entre 2300g e 3300g. O peso de aproximadamente 95% dos recém-nascidos está entre 1800g e 3800g. Praticamente todos os bebês desta população nascem com peso no intervalo (1300,4300).
Na prática desejamos calcular probabilidades para diferentes valores de e .
Para isso, a variável cuja distribuição é é transformada numa forma padronizada com distribuição (distribuição normal padrão) pois tal distribuição é tabelada.
A quantidade é dada por
(8) |
Exemplo: Suponha que a pressão arterial sistólica em pessoas jovens saudáveis tenha distribuição .
Neste caso queremos encontrar e tais que: .
Primeiro padronizamos essa probabilidade, isto é,
Ou seja, . Escolhendo uma solução simétrica temos .
Como , da tabela da gaussiana padrão obtemos e .
Consequentemente, e , ou seja, e .
Para essa população de jovens saudáveis, o intervalo engloba 95% dos valores pressóricos, isto é, aproximadamente entre 100 e 140 .