Handout #08

Estatística Descritiva e Inferencial Básica

Prof. Anderson Ara (DESt-UFPR)

01 set 2022

Variáveis aleatórias

Antes da realização do experimento, não sabemos o resultado. Entretanto, seu espaço de probabilidade pode ser estabelecido de forma conveniente, de modo a avaliar a probabilidade de qualquer evento de interesse. Desta forma, podemos também atribuir probabilidades às funções desses eventos. Pois, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória, uma regra de associação de um valor numérico a cada ponto do espaço amostral.

Matematicamente, uma variável aleatória é uma função com domínio em e contradomínio em \(\mathbb{R}\), definida da seguinte forma:

\[ X:\,\Omega\rightarrow\mathbb{R} \]

Exemplificação da idéia de uma variável aleatória Exemplificação da idéia de uma variável aleatória

Como evidenciado na Figura, cada possível resultado do experimento aleatório \((\omega_{i})\) corresponderá apenas a um único valor numérico da variável aleatória. Porém, um valor numérico da variável aleatória poderá corresponder a um ou mais possíveis resultados de um experimento.

Em outras palavras, uma variável aleatória é o resultado numérico de um experimento aleatório. E muitos experimentos aleatórios produzem resultados não-numéricos. Antes de analisá-los, é conveniente transformar seus resultados em números, o que é feito através da variável aleatória.


Exemplo: Seja um experimento aleatório que consiste na observação do volume de vendas diário de três pontos de venda de uma empresa. Então, \(\Omega=\left\{ (v_{1},v_{2},v_{3})|\, ~v_{i}\in\mathbb{N},\, i=1,2,3\right\}\). Podemos definir as seguintes variáveis aleatórias:

\(X\)= soma das vendas diárias dos três pontos de venda da empresa

\(Y\)= máximo das vendas diárias

Note que, para este exemplo, o espaço amostral é infinito enumerável e está situado no conjunto \(\mathbb{N}^{3}\), no qual alguns possíveis resultados deste experimento podem ser dados como \((0,0,0),(1,0,0),(0,1,0), \ldots, (53,0,21),\ldots.\)


Assim, temos o interesse em verificar tais modelos probabilísticos para diversos tipos de variáveis. Fato que irá nos ajudar interpretar e compreender ainda mais o comportamento aleatório de uma informação em estudo. A ideia geral de um modelo é a construir uma formulação matemática para a probabilidade de cada possível valor de \(X\).

\(X=x_{i}\) \(x_{1}\) \(x_{2}\) \(\ldots\) \(x_{n}\)
\(P(X=x_{i})\) \(p(x_{1})\) \(p(x_{2})\) \(\ldots\) \(p(x_{n})\)

Variáveis Aleatórias Discretas

Uma função \(X\), definida sobre o espaço amostral e assumindo valores num conjunto enumerável de pontos do conjunto real, é chamada de variável aleatória discreta.

O comportamento de uma variável aleatória \(X\) do tipo discreto estará bem caracterizado se indicamos os possíveis valores \(x_{1},x_{2}, \ldots,x_{k}\) que \(X\) pode assumir e as suas respectivas probabilidades \(p(x_{1}),p(x_{2}), \ldots ,p(x_{k})\), ou seja, se conhecemos o modelo de probabilidade \(\left\{ \, x;\, p(x)\,\right\}\), em que \(p(x)\) detona a função de probabilidades e \(p(x)= \text{P}(X=x)\). Note que o esquema do Exemplo anterior apenas se aplica a este caso.

Dada a variável aleatória discreta \(X\), assumindo os valores \(x_{1},x_{2}, \ldots ,x_{k}\), chamamos de esperança matemática de \(X\) o valor:

\[E(X)=\sum_{i=1}^{k}x_{i}p(x_{i})\]

Chamamos de variância de \(X\) o valor:

\[\mbox{Var}(X)=\text{E}(X^{2})-[\text{E}(X)]^{2}\]

em que E\((X^{2})=\sum_{i=1}^{k}x_{i}^{2}p(x_{i})\) e de desvio padrão de \(X\) o valor :

\[\text{DP}(X)=\sqrt{\text{Var}(X)}\]



Exemplo: Um jogador paga 5 fichas para participar de um jogo de dados, disputando com a banca quem tem o maior ponto. A regra de premiação é a seguinte: se o ponto do jogador for maior, ele ganha duas vezes a diferença entre seu ponto obtido e o ponto obtido pela banca, e se o ponto do jogador for menor ou igual ao da banca, ele não ganha. O jogador e a banca lançam, cada um o seu dado. Qual é a sua opinião sobre o jogo? (Dantas 2004Dantas, C. A. B. 2004. Probabilidade: Um Curso Introdutório. 2(^a) ed. Eduso.).


Variáveis Aleatórias Contínuas

Uma variável aleatória cujos valores são expressos em uma escala contínua é dita variável aleatória contínua.

Podemos construir modelos teóricos para as variáveis aleatórias contínuas escolhendo adequadamente a **função de densidade de probabilidade*}** (f.d.p.) que é uma função indicadora da probabilidade nos possíveis valores de \(X\).

Assim a área sob a f.d.p. entre dois pontos \(a\) e \(b\) nos fornece a probabilidade da variável assumir valores entre \(a\) e \(b\). Portanto podemos escrever:

\[\text{P}(a<X<b)=\int_{b}^{a}f(x)dx\]

Da relação entre a probabilidade e a área sob a função, a inclusão ou não dos extremos \(a\) e \(b\) na expressão acima não afetará os resultados. Assim, iremos admitir:

\[\text{P}(a<X<b)= \text{P}(a\leq X<b)= \text{P}(a<X\leq b)= \text{P}(a\leq X\leq b)\]

Note que para o caso contínuo a P\((X=a)=0;\:\forall\, a\in\mathbb{R}\).

Função densidade de probabilidade

No caso de uma variável contínua, a distribuição de probabilidade será caracterizada por sua função de densidade de probabilidade, que denotamos por \(f(x)\), que deve obedecer às seguintes propriedades:

A primeira propriedade decorre do fato de não haver probabilidade negativa. A segunda indica que a probabilidade de a variável aleatória assumir valor em um intervalo será dada pela integral da função nesse intervalo. Interpretada geometricamente, essa propriedade estabelece que a probabilidade correspondente a um intervalo será dada pela área determinada por esse intervalo sob o gráfico da função densidade de probabilidade. A terceira propriedade, que pode ser considerada como decorrente da segunda, diz que a área total sob o gráfico da função é unitária.

A forma geométrica da função densidade de probabilidade irá caracterizar a distribuição de probabilidade no caso das variáveis aleatórias contínuas, e o gráfico da função dará uma ideia visual de como deverá ser seu comportamento.

Resultados impossíveis, no caso das variáveis aleatórias contínuas, são caracterizados por uma função densidade de probabilidade nula no intervalo considerado.

Função de distribuição acumulada

Uma maneira alternativa pela qual podemos caracterizar o comportamento probabilístico de uma variável aleatória é através da sua função de distribuição acumulada, também conhecida apenas como função distribuição, denotada por \(F(x)\). Essa função retorna a probabilidade acumulada em cada ponto, sendo definida por:

\[F(a)=\text{P}(X\leq a)\]

Portanto, Trata-se de uma função que fornece, para qualquer ponto considerado, a probabilidade de que a variável aleatória \(X\) assuma um valor menor ou igual que o correspondente ao ponto \(a\). Assim, para variáveis discretas

\[F(a)=\sum_{x_i\leq a}\text{P}(x_{i})\]

e para contínuas,

\[F(a)=\int_{-\infty}^{a}f(x)dx.\]

Logo, uma vez conhecida a função de probabilidade de uma variável aleatória discreta ou a função de densidade de uma variável aleatória contínua, podemos determinar sua função de distribuição.

Distribuições de Variáveis Discretas

Nesta seção apresentamos algumas das principais, e mais utilizadas, distribuições de probabilidade para variáveis aleatórias discretas.

Distribuição de Bernoulli

Alguns fenômenos acontecem com mais frequência na prática. E portanto, alguns modelos foram construídos para acomodar tais situações.

Considere a situação onde temos um experimento \(E\), associado a um espaço amostral \(\Omega\) e seja \(X\) uma variável aleatória, tal que esta assume dois resultados.

quando o resultado é o atributo de interesse (característica)

quando não tem o atributo de interesse.

Usualmente denotamos:

\((X=1)\) = quando o resultado é o atributo de interesse (sucesso) e

\((X=0)\) = caso contrário (fracasso)

Seja p a probabilidade de ocorrência de sucesso

\((X=1)=p\Rightarrow \text{P}(X=0)=1-p\)

Podemos escrever o modelo probabilístico da seguinte forma:

\[ p(x) = \left\{ \begin{array}{ll} p, & x=1 \\ 1-p, & x=0. \end{array} \right. \]

Geralmente \(1-p\) é denotado por \(q\).

Portanto o modelo de Bernoulli é dado por:

\[ \text{P}(X=x)=p^{x}(1-p)^{1-x},\: x=0,1 \]

Este modelo é chamado de distribuição de Bernoulli e \(p\) é o parâmetro do modelo.

Observações:

  1. O gráfico de \(p(x)\) depende do parâmetro \(p\).

Distribuição de Bernoulli Distribuição de Bernoulli

  1. \(X \sim bern(p)\), dizemos que \(X\) tem distribuição de Bernoulli com parâmetro \(p\).

  2. Se \(X \sim bern(p)\), então E\((X)=p\) e Var\((X)=p(1-p)\)

Distribuição Binomial

Seja um experimento dentro das seguintes condições:

  1. cada realização do experimento é uma prova de Bernoulli;

  2. são realizadas \(n\) ensaios independentes do experimento;

  3. a probabilidade \(p\) de sucesso em cada prova é constante e a probabilidade de fracasso consequentemente também.

Vamos então definir uma variável aleatória \(X\) como sendo o número de sucessos nas \(n\) realizações (ensaios de Bernoulli).

A distribuição de probabilidade de \(X\) é dada por:

\[\text{P}(X=k)=\left(\begin{array}{c} n\\ k \end{array}\right)p^{k}(1-p)^{n-k},\]

em que \(n\) e \(p\) são como definimos nos itens a) e b) e, \(k = 0,1,2, \ldots, n\).

A Figura exibe o comportamento da distribuição binomial

Distribuição Binomial (n=10, p=0.3)

Distribuição Binomial (n=10, p=0.3)

Observações:

Distribuição de Poisson

No caso da distribuição binomial, a variável de interesse era o número de sucessos em um intervalo discreto (\(n\) provas). Muitas vezes, entretanto, estamos interessados no número de sucessos em um intervalo contínuo, que pode ser um intervalo de tempo, comprimento, superfície, etc.

Se admitirmos que:

  1. eventos definidos em intervalos não sobrepostos são independentes;

  2. em intervalos de mesmo tamanho, são iguais as probabilidades de ocorrência de um mesmo número de sucessos;

  3. em intervalos muito pequenos, a probabilidade de mais de um sucesso é desprezível;

  4. em intervalos muito pequenos, a probabilidade de um sucesso é proporcional ao tamanho do intervalo.

A função de probabilidade de uma variável \(X\) com distribuição Poisson com parâmetro \(\lambda\) é dada por:

\[\text{P}(X=x)=\frac{e^{-\lambda}\lambda^{x}}{x!}\]

A Figura exibe o comportando da distribuição Poisson com parâmetro \(\lambda=2\).

Distribuição Poisson (2)

Distribuição Poisson (2)

Observações:


Exemplo: Os clientes chegam a uma loja de departamento a razão de 6,5 por hora. Determine a probabilidade de que, durante qualquer hora:

  1. não chegue clientes;

  2. mais de um cliente.

  3. chegar mais de um cliente em uma hora e meia.


Distribuição Uniforme Discreta

Enquadram-se aqui as distribuições em que os possíveis valores da variável tenham todos a mesma probabilidade. Logo, se existirem \(n\) valores possíveis, cada qual terá probabilidade igual a \(\frac{1}{n}\). Merece destaque o caso em que os \(n\) valores são equi-espaçados, ou seja, a diferença entre eles é constante. Nesse caso, a distribuição fica perfeitamente caracterizada se conhecermos três quantidades, que, por exemplo, são o primeiro valor \(x_{1}\), a diferença constante \(h\) e o número de valores \(n\). Como nesse caso os valores obedecem a uma progressão aritmética, o último valor será:

\(x_{n}=x_{1}+(n-1)h\)

A Figura exibe o comportando da distribuição uniforme discreta.

Distribuição Uniforme Discreta (1,6)

Distribuição Uniforme Discreta (1,6)

Observações:

  1. \(E(X) = \frac{x_{1}+x_{n}}{2}\);

  2. \(\mbox{Var}(X) = \frac{h^{2}(n^{2}-1)}{12}\).

Distribuições de Variáveis Contínuas

Nesta seção apresentamos algumas das principais, e mais utilizadas, distribuições de probabilidade para variáveis aleatórias contínuas.

Distribuição Uniforme Contínua

Seja uma variável aleatória contínua que pode assumir qualquer valor num intervalo \([a,b]\). Se a probabilidade da variável assumir um valor em determinado subintervalo for a mesma para qualquer outro subintervalo de mesmo comprimento, temos uma distribuição uniforme. A função densidade de probabilidade é dada por:

\[f(x)=\begin{cases} \frac{1}{b-a\:} & \mathrm{para}\: a\leq x\leq b;\\ 0 & \mathrm{caso\,\mathrm{contr\acute{a}rio.}} \end{cases}\]

A Figura exibe a função densidade de probabilidade da distribuição uniforme contína no intervalo \([a,b]\).

Distribuição Uniforme Contínua

Distribuição Uniforme Contínua

Observações:

Um caso particular de interesse é o da distribuição uniforme no intervalo \([0,1]\) cujo valor esperado é 0,5 e variância é \(\frac{1}{12}\). Este caso particular é bastante usado como fonte de aleatoriedade em processos de simulação estatística, havendo diversos programas computacionais que “geram” valores obedecendo praticamente à essa distribuição. Esses valores são transformados convenientemente, de modo a obter outras variáveis aleatórias com as distribuições desejadas no processo de simulação.

Distribuição Normal

A distribuição normal é a mais importante das distribuições de probabilidades. Conhecida como a curva em forma de sino, a distribuição normal tem sua origem associada aos erros de mensuração. É sabido que, quando repetidas mensurações são efetuadas, de determinada grandeza com um aparelho equilibrado, os resultados de cada umas das medições oscilam bastante, de modo aproximadamente simétrico, em torno do verdadeiro valor. Com a construção do histograma destes valores, é possível observar o comportamento aproximadamente simétrico dos valores. Gauss deduziu matematicamente a distribuição normal como distribuição de probabilidade dos erros de observação, denominando-a então “lei normal dos erros”.

Inicialmente se supunha que todos os fenômenos da vida real devessem ajustar-se a uma curva em forma de sino, caso contrário, suspeitava-se de alguma anormalidade no processo de coleta de dados. Daí a designação de curva normal.

A observação cuidadosa subsequente mostrou, entretanto, que essa pretensa universalidade da curva, ou distribuição normal, não correspondia à realidade. De fato, não são poucos os exemplos de fenômenos da vida real representados por distribuições não normais, curvas assimétricas, por exemplo. Mesmo assim, a distribuição normal desempenha papel preponderante na estatística, e os processos de inferência nela baseados tem larga aplicação.

A distribuição normal tem função de densidade de probabilidade dada por:

\[f(x)=\frac{1}{\sqrt{2\pi\sigma^{2}}}exp\left[-\frac{(x-\mu)^{2}}{2\sigma^{2}}\right]\:,~~-\infty\leq x\leq\infty,\] em que

\(\mu\): posição central da distribuição (média)

\(\sigma^{2}:\) dispersão da distribuição (variância)

Se uma variável aleatória \(X\) tem uma distribuição normal com média \(\mu\) e variância \(\sigma^{2}\), a notação de \(X\) é \(X \sim\) N(\(\mu\), \(\sigma^{2}\)). A Figura exibe a função densidade de probabilidade da distribuição normal.

Distribuição Normal

Distribuição Normal

A distribuição normal é muito importante para a Teoria Estatística e é frequentemente utilizada em diversos tipos de aplicação. A distribuição normal também é a distribuição limite no Teorema Central do Limite.

Propriedades da distribuição normal

Variações da distribuição normal são obtidas quando variamos os valores dos parâmetros \(\mu\) e \(\sigma\). Fixando \(\mu\) e variando \(\sigma\), a distribuição pode ter forma mais achatada (maior dispersão) e mais concentrada (menor dispersão). A Figura apresenta exemplos em que \(\mu\) e \(\sigma\) estão variando.

Diferentes parâmetros da normal

Diferentes parâmetros da normal

Note que a moda de uma variável aleatória normal ocorre em \(x= \mu\) (igual a média e mediana), além disso os pontos de inflexão ocorrem em \(\mu-\sigma\) e \(\mu+\sigma\).

Como descrito anteriormente, a probabilidade de uma variável assumir valores entre \(a\) e \(b\) é igual à área sobre a curva entre esses dois pontos. A determinação da probabilidade é realizada matematicamente através da integração da função de densidade de probabilidade no intervalo \([a,b]\). No caso da distribuição normal, a integral não pode ser calculada exatamente, e a probabilidade entre dois pontos só pode ser obtida por métodos numéricos. Esta tarefa é facilitada pelo uso da distribuição normal padrão definida a seguir.

A distribuição normal padrão

A distribuição normal, particularmente, com média 0 e desvio padrão 1 é chamada de distribuição normal padrão, e convencionalmente denotada por \(Z\).

Se \(X \sim N(\mu,\sigma^{2})\), então a variável aleatória

\[Z = \frac{X-\mu}{\sigma} \sim \text{N}(0,1)\].

Os valores das probabilidades, considerando que \(Z \sim \text{N}(0,1)\) são tabelados, e por isso, calcular probabilidades para uma variável aleatória com distribuição se torna mais simples, desde que sempre podemos padronizar a variável em estudo.

A função de densidade de probabilidade da distribuição normal padrão é dada por

\[f(z)=\frac{1}{\sqrt{2 \pi}}\exp\left\{-\frac{z^2}{2}\right\}=\phi(z)\]

A área à esquerda de um valor especificado da \(N(0,1)\) encontra-se tabelada. Utilizando-se a transformação acima, podemos obter as probabilidade para qualquer \(N(\mu, \sigma^{2})\).

Tabela Normal Padrao

Tabela Normal Padrao

Exemplo: Sabendo que \(Z\sim N(0,1)\), encontre:

  1. \(P(0 < Z < 1,25)\);

  2. \(P(-1,48 < Z < 0,5)\);

  3. \(P(Z > -0,6)\).




Exemplo: Considere \(X \sim N(\mu = 50; \sigma^2 = 25)\). Calcule:

  1. \(P(40<X<50)\);

  2. \(P(56<X \leq 60)\);

  3. \(P(40<X<65)\).




Exemplo: Um componente é produzido sobre um valor nominal de \(80\)kg e uma variação em desvio padrão de 2kg. Calcule a \(P(X\geq90\,\mathrm{kg})\).