Handout #07

Estatística Descritiva e Inferencial Básica

Prof. Anderson Ara (DESt-UFPR)

30 ago 2022

Técnicas de contagem

Também conhecidas como Análise Combinatória, estas técnicas possibilitam a contagem de agrupamentos de diferentes tipos, sendo estes originados de um grupo finito de elementos. Neste sentido, Arranjos, Permutações e Combinações são os três tipos principais de agrupamentos e são extremamente úteis para o cálculo de probabilidades, em específico para espaços amostrais finitos e eventos elementares equiprováveis (probabilidade clássica).

Princípio fundamental da contagem

Utilizamos esta técnica quando um experimento é composto por dois estágios. Desta forma, o primeiro pode ocorrer de \(m\) modos diferentes, o segundo de \(n\) modos diferentes. O número de maneiras distintas de ocorrer este acontecimento é \(m\times n\). Este procedimento pode ser estendido facilmente a um experimento composto por vários estágios.


Exemplo: Ao se fabricar lápis temos que escolher entre dois tipos de grafite (\(A\) e \(B\)) e três tipos de madeira (\(M_{1},M_{2},M_{3}\)). Quantos são os possíveis lápis a serem produzidos?

Resolução:

\(2\) possíveis grafites \(\times\) \(3\) possíveis madeiras.

\(2\times3=6\)

Logo temos 6 possíveis lápis a serem produzidos

\(\Rightarrow\{AM_{1},AM_{2},AM_{3},BM_{1},BM_{2},BM_{3}\}\)


Note que, para o exemplo anterior, a escolha da madeira não é influenciada pela escolha do lápis, ou seja, estas escolhas acontecem de forma independente.

Tipos de elementos

Considere o conjunto \(A=\{a,b,c\}\) e os subconjuntos \((a,b)\), \((a,c)\) e \((c,a)\).

Arranjo

Utilizamos um arranjo quando queremos verificar de quantas maneiras distintas podemos organizar, arranjar, agrupar \(n\) elementos distintos em \(k\) lugares, \(k\) posições \((k<n)\).

Denotamos \(A_{n,k}\) = arranjo simples \(k\) a \(k\) dos \(n\) elementos do conjunto \(A\). Assim, temos

\[\begin{array}{cc} n & \mbox{possibilidades para escolha do 1º elemento}; \\ n-1 & \mbox{possibilidades para escolha do 2º elemento}; \\ n-2 & \mbox{possibilidades para escolha do 3º elemento}; \\ \vdots & \vdots \\ n-(k-1)=n-k+1 & \mbox{possibilidades para escolha de }~k~\mbox{elemento} \end{array}\]

Organizando estas ideias para as possíveis escolhas, temos:

\[A_{n,k}=n(n-1)(n-2)...(n-(k-1))=\frac{n!}{(n-k)!}\]

Lembre-se: \(n!\) é lido como n fatorial e implica em \(n\times(n-1)\times...\times1\), ou seja, \(4!=4\times3\times2\times1=24\).


Exemplo: Na fabricação de uma máquina, seu design final deve possuir necessariamente duas cores. A primeira cor é destinada a parte superior e a segunda é destinada a parte inferior. O setor disponibiliza somente 4 cores: Preto, Vermelho, Cinza e Branca. De quantas maneiras distintas esta máquina pode ser pintada?

Resolução: A problemática deste exercício se baseia em: De quantas maneiras diferentes podemos agrupar 4 cores nas duas partes da máquina?

\[\begin{array}{ccc} \mbox{(Preto, Vermelho)} & \mbox{(Preto,Cinza)} & \mbox{(Preto,Branco)} \\ \mbox{(Cinza, Preto)} & \mbox{(Cinza,Vermelho)} & \mbox{(Cinza, Branco)} \\ \mbox{(Vermelho, Preto)} & \mbox{(Vermelho,Cinza)} & \mbox{(Vermelho,Branco)} \\ \mbox{(Branco, Preto)} & \mbox{(Branco, Vermelho)} & \mbox{(Branco, Cinza)} \end{array}\]


Ou seja,

\[\begin{array}{cccc} 4 & \times & 3 & =12 \mbox{ maneiras}\\ \mbox{Superior} & & \mbox{Inferior} \end{array}\]


Permutação

Se ao invés de tomarmos os elementos \(k\) e \(k\), consideramos estes \(n\) a \(n\), basicamente, estamos verificando o problema de organizar os \(n\) elementos distintos. Ou seja;

\[\begin{array}{cc} n & \mbox{possibilidades para escolha do 1º elemento}; \\ n-1 & \mbox{possibilidades para escolha do 2º elemento}; \\ n-2 & \mbox{possibilidades para escolha do 3º elemento}; \\ \vdots & \vdots \\ 1 & \mbox{possibilidades para escolha de}~ n\mbox{-éssimo elemento.} \end{array}\]

Organizando estas idéias para as possíveis escolhas, temos:

\[A_{n,n}=n\times(n-1)\times(n-2)\times...\times1=n!=P_{n}\]


Exemplo: Para o exemplo anterior, considere que devemos pintar a máquina necessariamente com 4 cores: Preto, Vermelho, Cinza e Branco.

\[\begin{array}{cccccccc} 4 & \times & 3 & \times & 2 & \times & 1 & =24\,\mathrm{possibilidades}\\ \mbox{Área 1} & & \mbox{Área 2} & & \mbox{Área 3} & & \mbox{Área 4} \end{array}\]

Note que estes elementos se diferenciavam por ordem e natureza, como indicado na Figura acima.

Ou seja, arranjo e permutação levam em consideração ordem e natureza dos elementos.


Combinação

As vezes a ordem não é importante, estamos interessados em elementos que diferem apenas pela natureza. Ou seja, o objetivo é verificar o número de maneiras possíveis que podemos selecionar, combinar elementos distintos, desconsiderando sua ordem. Neste sentido, dentre \(n\) elementos distintos temos o interesse em selecionar \(k\). Esta operação é chamada combinação e é denotada por \(C_{n,k}\) (lê-se: combinação de \(n\) elementos \(k\) a \(k\)).

\[C_{n,k}=\left(\begin{array}{c} n\\ k \end{array}\right)=\frac{n!}{k!(n-k)!}\]


Exemplo: Considere o problema de compra das 4 possíveis cores para a pintura da máquina anterior. Sabemos que o departamento de marketing pode comprar quaisquer 4 cores dentre 20 possíveis.

Problema: Quantos conjuntos de cores diferentes podem ser compradas?

Resolução:

\[C_{20,4}=\left(\begin{array}{c} 20\\ 4 \end{array}\right)=\frac{20!}{4!16!}=4845\]


Quando possuímos \(n_{1}\) objetos do tipo \(1\), \(n_{2}\) objetos do tipo \(2\), \(\ldots\)\(n_{k}\) objetos do tipo \(k\). A permutação é corrigida da seguinte forma:

\[P_{n}=\frac{n!}{n_{1}!\times n_{2}!\times\ldots\times n_{k}!}\]

Através das técnicas de contagem introduzidas acima, podemos resolver problemas de Probabilidade mais complexos. Em particular aplicando a teoria de probabilidade clássica, ou seja, quando o espaço amostral é finito. Para ilustrar tal aplicação considere os próximos exemplos.


Exemplo: Em um grupo de \(n\) pessoas, qual a probabilidade de pelo menos duas fazerem aniversário no mesmo dia?

Resolução:

Seja o evento \(A\): pelo menos duas pessoas nasceram no mesmo dia

\(\#(\Omega) = 365\times365\times\ldots\times365=365^{n}\)

\(P(A)=\frac{\#(A)}{\#(\Omega)}\)

\(A^{c}:\) não ter pelo menos duas pessoas que nasceram no mesmo dia \(=\) nenhuma pessoa faz aniversário no mesmo dia que a outra

\(\#(A^{c})=365\times364\times\ldots\times(365-(n-1))\)

\(P(A)=1-P(A^{c})=1-\frac{\#(A^{c})}{\#(\Omega)}=1-\frac{365\times364\times...(365-n+1)}{365^{n}}\)




Exemplo: Uma urna contém 5 peças vermelhas, 6 peças azuis e 8 peças pretas. Se um conjunto de 3 peças for selecionado ao acaso, qual a probabilidade de selecionarmos todas as peças da mesma cor? E de cores diferentes?

Resolução:

\(\Omega=\{(V,V,V),(V,A,P),(A,V,P),\ldots\}\)

\(\#(\Omega)=19\times18\times17=5814\)

Seja \(A\): as peças são da mesma cor;

\(A_{v}\): as peças são vermelhas;

\(A_{a}\): as peças são azuis;

\(A_{p}\): as peças são pretas.

\(A=(A_{v} \cup A_{a} \cup A_{p})\)

\(A_{a} \cap A_{v}=A_{v} \cap A_{p}=A_{p} \cap A_{a}=\varnothing\)\(\Rightarrow\) disjuntos

\(P(A)=P(A_{v}\cup A_{a}\cup A_{p})=P(A_{v})+P(A_{a})+P(A_{p})\)

\[=\frac{\#(A_{v})+\#(A_{p})+\#(A_{a})}{\#(\Omega)}=\frac{5\times4\times3+8\times7\times6+6\times5\times4}{5814}\cong0,09\]


Probabilidade Condicional e Independência

Até agora, definimos um espaço amostral e todas as probabilidades foram calculadas com respeito a este espaço amostral. Porém, existem situações nas quais podemos atualizar o espaço amostral baseado em uma nova informação ou informação de interesse. Nestes casos, podemos atualizar o cálculo de probabilidades a qual será condicionada por tal informação, chamamos esse tipo de probabilidade de probabilidade condicional.

Seja \(A\) e \(B\) dois eventos quaisquer de um espaço amostral, a probabilidade condicional de \(B\) sabendo que o evento \(A\) é considerado conhecido é expressa por \(P(B|A)\) (lê-se: probabilidade de \(B\) dado \(A\)) e definida em:

\[P(B|A)=\frac{P(A \cap B)}{P(A)}\]

Analogamente, \(P(A,B)=P(A \cap B)=P(B|A)P(A)=P(A|B)P(B)\).

Esta expressão, considerando mais do que dois eventos, permite a construção de probabilidades em espaços amostrais que representam experimentos realizados em sequências. Considerando a intersecção de \(n\) eventos \(A_{1},A_{2}, \ldots ,A_{n},\) temos:

\(P(A_{1} \cap A_{2} \cap , \ldots, \cap A_{n})=P(A_{1})P(A_{2}|A_{1})P(A_{3}|A_{1},A_{2})...P(A_{n}|A_{1}A_{2} \ldots A_{n-1})\)

Teorema de Bayes

Seja \(B_{1},B_{2}, \ldots ,B_{k}\) uma partição de \(\Omega\), isto é, eventos disjuntos em que sua união resulta em \(\Omega\). Considere \(A\) um evento e \(P\) uma probabilidade definida nos eventos de \(\Omega\). Podemos visualizar estas ideias no Diagrama de Venn da Figura abaixo.

Exemplo de Partição

Exemplo de Partição

Assim, o evento \(A\) pode ser escrito utilizando a disjunção proveniente das interseções com \(B\), ou seja, \(A = (A \cap B_{1}) \cup (A \cap B_{2}) \cup \ldots \cup (A \cap B_{k})\), sendo que \(P(A \cap B_{i})=P(A|B_{i})P(B_{i})\) para \(i=1,\ldots,k\). Uma vez que \((A \cap B_{1}), \ldots ,(A \cap B_{k})\) são disjuntos, temos a igualdade abaixo, também conhecida como teorema da probabilidade total (Magalhães 2006Magalhães, M. N. 2006. Probabilidade E Variáveis Aleatórias. Edusp.),

\[P(A)=\sum_{i=1}^{k}P(A|B_{i})P(B_{i})\]

Seja \(P(A)>0\), temos que

\[P(B_{j}|A)=\frac{P(B_{j})P(A|B_{j})}{P(A)}\] em que \(P(A)\) é definida anteriomente.

Portanto, o Teorema de Bayes é dado por:

\[P(B_{j}|A)=\frac{P(B_{j})P(A|B_{j})}{\sum_{i=1}^{k}P(A|B_{i})P(B_{i})}\]


Exemplo: Seja \(E\): lançamento de um par de dados (\(\Omega\) = \(\{(1,1),\ldots,(6,6)\}\)). Você não vê o lançamento, mas recebe a informação: “em cada um dos lançamentos, a face superior é menor ou igual a 2”. Qual a probabilidade da soma das faces superiores ser igual a 4?

Resolução:

Seja

\(B\): a soma é igual a 4.

\(B=\{(1,3),(2,2),(3,1)\}\)

A probabilidade de ocorrer o evento \(B\) é \(P(B)=\frac{3}{36}\).

\(A\): a face superior dos dois dados é menor ou igual a 2.

\(A=\{(1,1),(1,2),(2,1),(2,2)\}\)

Agora, sabendo que \(A\) ocorreu, a probabilidade de ocorrência de B é \(P(B|A)=\frac{1}{4}\). Note que o espaço amostral foi reduzido ao evento \(A\). Logo, o conhecimento de \(A\) altera a probabilidade de B.


Observações:

  1. Em geral na aplicação do teorema de Bayes conhecemos (ou fazemos suposições) a respeito de \(P(A|B_{i})\) e \(P(B_{i})\), para \(i=1, \ldots,k\)

  2. Note que \(\sum_{j=1}^{k}P(B_{j}|A)=1\)

  3. Interpretação: Suponha que \(B_{i}\) represente uma possível causa no resultado de um experimento aleatório. Realizado tal experimento e obtido o resultado A, o teorema de Bayes indica como atualizar as probabilidades a priori \(P(B_{j})\). As probabilidades resultantes \(P(B_{j}|A)\), são chamadas de probabilidades a posteriori.

Estas probabilidades são utilizadas para avaliar o quanto o evento A é responsável por cada \(B_{j}\).


Exemplo: Considere cinco urnas numeradas de 1 a 5. Cada uma contém dez bolas. A urna \(i\) contém \(i\) bolas defeituosas e \(10-i\) bolas perfeitas, para \(i\) variando de 1 a 5. Considere o seguinte experimento aleatório: uma urna é selecionada aleatoriamente e então uma bola é selecionada desta urna.

  1. Qual a probabilidade de uma bola defeituosa ter sido selecionada?

Seja

\(U_{i}\): selecionar a urna \(i\)

\(D\): Selecionar uma bola defeituosa

Sabemos que \(P(U_{i})=\frac{1}{5}\)

\(P(D|U_{i})=\frac{i}{10}\), com \(i=1,...,5\)

\(P(D)=P(D|U_{1})P(U_{1})+P(D|U_{2})P(U_{2})\) \(+P(D|U_{3})P(U_{3})+P(D|U_{4})P(U_{4})+P(D|U_{5})P(U_{5})\)

\(P(D)=\frac{1}{10}.\frac{1}{5}+\frac{2}{10}.\frac{1}{5}+\frac{3}{10}.\frac{1}{5}+\frac{4}{10}.\frac{1}{5}+\frac{5}{10}.\frac{1}{5}=\frac{3}{10}\)

  1. Sabendo que a bola selecionada é defeituosa, qual a probabilidade de ter sido da urna 5?

\(P(U_{5}|D)=\frac{P(U_{5}\cap D)}{P(D)} = \frac{P(U5)P(D|U5)}{P(D)}\) \(= \frac{\frac{5}{10}\frac{1}{5}}{\frac{3}{10}}\) = \(\frac{1}{3}\)


Independência condicional

Basicamente, podemos considerar que os eventos \(A\) e \(B\) são independentes, quando existe a relação:

\[P(A|B)=P(A)\;\mathrm{ou}\; P(B|A)=P(B)\]

Desta forma, podemos dizer que \(A\) não influencia a chance de acontecer \(B\) e vice-versa. A relação acima advém da propriedade de independência \(P(A\cap B)=P(A)P(B)\).


Exemplo: A probabilidade de um homem viver mais 10 anos é P(H) = \(\frac{1}{4}\). E da sua esposa viver mais 10 anos é P(M) = \(\frac{1}{3}\). Encontre as probabilidades de:

  1. Ambos estarem vivos dentro de 10 anos.

\(P(HM)=P(H)P(M)\)

  1. Ao menos um estar vivo dentro de 10 anos.

\(P(H\cup M)=P(H)+P(M)-P(HM)\)

  1. Nenhum estar vivo dentro de 10 anos.

\(P(H^{c}\cap M^{c})=P(H^{c})P(M^{c})\)

  1. Somente a esposa estar viva dentro de 10 anos.

\(P(H^{c}\cap M)=P(H^{c})P(M)\)


Mais exemplos e exercícios sobre a teoria de probabilidades podem ser encontrados em Costa Neto and Cymbalista (1974Costa Neto, P. L. O., and M. Cymbalista. 1974. “Probabilidades.” São Paulo: Editora Edgard Blucher Ltda.).

A Linguaguem R e procedimentos iniciais em probabilidades

#ARRANJO SIMPLES 2 A 2 DE 4 ELEMENTOS
factorial(4)/factorial(2)
## [1] 12
#PERMUTAÇÃO DE 5 ELEMENTOS
factorial(5)
## [1] 120
#TODAS AS COMBINAÇÕES DE 4 ELEMENTOS 2 A 2
combn(c("w1","w2","w3","w4"), 2)
##      [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] "w1" "w1" "w1" "w2" "w2" "w3"
## [2,] "w2" "w3" "w4" "w3" "w4" "w4"
# O NÚMERO DE COMBINAÇÕES DE 4 ELEMENTOS 2 A 2
choose(4,2)
## [1] 6
factorial(4)/(factorial(2)*factorial(4-2))
## [1] 6

Python e procedimentos iniciais em probabilidades

#ARRANJO SIMPLES 2 A 2 DE 4 ELEMENTOS
import math
math.factorial(4)/math.factorial(2)
## 12.0
#PERMUTAÇÃO DE 5 ELEMENTOS
math.factorial(5)
## 120
#TODAS AS COMBINAÇÕES DE 4 ELEMENTOS 2 A 2
from itertools import combinations
res=combinations(["w1", "w2", "w3", "w4"], 2)
for i in list(res):
    print (i)
## ('w1', 'w2')
## ('w1', 'w3')
## ('w1', 'w4')
## ('w2', 'w3')
## ('w2', 'w4')
## ('w3', 'w4')
# O NÚMERO DE COMBINAÇÕES DE 4 ELEMENTOS 2 A 2
math.comb(4, 2)
## 6
math.factorial(4)/(math.factorial(2)*math.factorial(4-2))
## 6.0