Handout #06

Estatística Descritiva e Inferencial Básica

Prof. Anderson Ara (DESt-UFPR)

30 set 2022

Introdução à Probabilidade

De um modo geral, podemos dizer que a natureza do homem é investigativa, somos levados todos os dias a lidar com nossas curiosidades e explorações ao ambiente que nos cerca, tais como: Será que vai chover? Meu time irá ganhar? Será que estou pagando um preço justo por este equipamento? O produto ou processo que estou desenvolvendo será aceito no mercado? Ele realmente funciona como deveria?

Muitos destes questionamentos estão sujeitos ao acaso, não sabemos exatamente o que vai acontecer até que aconteça. Mas será que fenômenos como esses são, realmente, apenas uma obra do acaso? Existe alguma lei ou interpretação científica?

Para responder parcialmente este questionamento, devemos nos lembrar de algumas noções básicas de estatística e de probabilidade do ensino médio. Assim, pegue dois dados tradicionais, de 6 faces, os lance e some os resultados. Digamos que um dado resultou 4 e o outro 6, totalizando 10. Lance novamente. Digamos que o primeiro dado, agora, resultou 2 e o segundo 5, totalizando 7. Aqui estamos considerando que os resultados não foram influenciados por condições físicas como, por exemplo, vento ou forma de lançamento. Se você realizar o experimento várias vezes perceberá que os resultados se alteram sem uma ordem evidente. Isso realmente é verdade?

Imagine que você jogou os dados 10 vezes e contou quantas vezes cada resultado foi obtido, gerando a primeira linha da Tabela 1. Caso você tenha jogado novamente os dados 100 vezes, possíveis resultados são indicados na segunda linha. Caso você tenha jogado novamente os dados 1 000 vezes, possíveis resultados são indicados na terceira linha.

Resultado 2 3 4 5 6 7 8 9 10 11 12
10 lançamentos 0 0 2 4 0 1 3 0 0 0 0
100 lançamentos 3 2 9 10 15 18 13 15 8 5 2
1000 lançamentos 29 69 74 107 145 164 149 107 80 53 23

Compare visualmente os resultados das três linhas da tabela acima. O que podemos observar?

Exatamente! O resultado 7 obteve a maior frequência nas duas últimas tabelas, em proporção 0,18 e 0,164, respectivamente.

Note ainda que existem 36 possibilidades de resultado para o lançamento dos dois dados {(1,1), (1,2), \(\ldots\), (6,6)} e apenas 6 possibilidades com soma igual a 7, {(1,6), (2,5),(3,4),(4,3),(5,2),(6,1)}, ou seja, a probabilidade da soma resultar 7 é igual a \(\frac{6}{36}=0,166\), sendo o resultado com maior probabilidade. Ou seja, lançar o dado inúmeras vezes nos aproximou da probabilidade real deste experimento, o que podemos chamar como a lei que rege o lançamento destes dados. Através dela podemos concluir que ao lançar dois dados, a maior chance é obter um resultado 7.

Assim como em um lançamento de dados, muitos fenômenos são regidos pelo acaso e existe a possibilidade de traduzirmos este acaso em números, probabilidades e a algo mais geral que, futuramente, iremos denominar modelo probabilístico. Porém, há casos em que não podemos repeti-los várias vezes e observar sua frequência, por exemplo a morte de um paciente, um desastre ambiental. O que nos resta fazer é trabalhar com uma matemática de alto nível para tentar descobrir qual o comportamento da incerteza de um experimento.

Ou seja, o campo de probabilidades é extremamente útil para a tomada de decisões, vasto e pode ser incrivelmente complicado. Nesta primeira parte do curso, iremos conhecer alguns conceitos básicos da teoria de probabilidades, o que nos ajudará a perceber melhor a incerteza que está a nossa volta e tratá-la de uma forma analítica e, no decorrer do curso, direcioná-la a tomada de decisões.

Origem

A teoria das probabilidades teve origem despretensiosa no século XVII através da troca de correspondência entre os matemáticos de Fermat e Pascal, destinados a estudar “jogos de azar”. Tornou-se depois um alicerce essencial para a Ciência Estatística, auxiliando a tomada de decisão em determinadas situações de incerteza. Isto ocorre em nível empresarial, em nível de governo, além das aplicações científicas, no estudo de fenômenos físicos, biológicos ou sociais. Para maiores detalhes sobre a história da probabilidade, sugerimos o texto de Lopes and Meirelles (2005Lopes, C. E., and E. Meirelles. 2005. “O Desenvolvimento Da Probabilidade E Da Estatı́stica.” XVIII Encontro Regional de Professores de MatemÁTica–LEM/IMECC/UNICAMP–2005.).

Experimentos

Incerteza é o nome que se dá à propriedade de eventos que não são completamente previsíveis. Neste contexto, existe uma grande classe de experimentos que ao serem realizados nas mesmas condições iniciais podem produzir resultados diferentes. Estes experimentos são chamados de experimentos aleatórios.

No estudo da teoria de probabilidades, muitos experimentos práticos podem ser generalizados como lançamentos de dados ou moedas. A seguir exibimos alguns exemplos desta generalização e caracterização dos experimentos aleatórios.


Exemplo: Um estudante, em um estudo de incerteza, realiza dois experimentos simples: \(E_1\) = lançamento de um dado tradicional de 6 faces e \(E_2\) = lançamento de uma moeda tradicional (cara ou coroa). Considerando que os lançamentos possam ser repetidos sobre as mesmas condições iniciais - posição e força de lançamento, vento, temperatura, etc - ambos podem gerar resultados diferentes. A cada lançamento, um novo resultado pode acontecer. Por isso, ambos os experimentos são aleatórios. Note que se em cada face do dado estivesse estampado o mesmo número, por exemplo 1, e se em ambos os lados da moeda estivesse estampado a mesma figura, por exemplo cara, os dois experimentos não seriam aleatórios. Teríamos a certeza que o dado resultaria 1 e a moeda resultaria cara. Aqui estamos descartando também fatos irrelevantes como a moeda cair em pé ou os lançamentos serem interrompidos. Além disso, note que a incerteza aparece quando temos mais de um resultado possível e aumenta conforme o aumento no número de resultados do experimento. Comparando ambos os lançamentos, temos maior incerteza no lançamento do dado e menor incerteza no lançamento da moeda: no dado poderíamos ter qualquer resultado de 1 a 6 e na moeda apenas cara ou coroa.



Exemplo: A coordenação de uma Faculdade, através da listagem de 42 livros relativos às referências básicas e complementares de um curso superior, solicita ao responsável pela biblioteca que pesquise e conte quantos livros desta listagem já possui uma nova edição disponível para compra. Neste caso, o experimento aleatório é a contagem dos livros, pois essa poderia assumir qualquer valor de 0 a 42 e se repetido sobre as mesmas condições iniciais poderia gerar resultados diferentes. Note que este experimento é o mesmo de que lançar uma vez um dado hipotético com 43 faces, numeradas de 0 a 42. Porém, não estamos aqui mensurando a chance de cada um destes resultados acontecer, mas sim caracterizando o experimento.



Exemplo: Em determinada indústria, o gerente de manutenção solicita a um de seus colaboradores que verifique, em um setor com 5 máquinas, se o eixo principal de cada uma das máquinas está desgastado ou não. Neste caso, o experimento aleatório é a observação do desgaste em todas as 5 máquinas, o qual pode gerar vários resultados, por exemplo: nenhuma das máquinas possui o eixo principal desgastado; apenas a primeira máquina possui o eixo principal desgastado; somente a terceira e a quinta máquina possuem o eixo principal desgastado, etc. Cada máquina é classificada como desgaste ou não. Assim, este experimento é o mesmo de se lançar uma moeda para cada máquina, tendo respectivamente uma das faces da moeda como desgaste e a outra face como não desgaste. Porém, novamente não estamos aqui mensurando a chance de cada um destes resultados acontecer, mas sim caracterizando o experimento. Não podemos dizer que a chance de desgaste da primeira máquina é de 50%, mas poderíamos imaginar que a chance de desgaste é a mesma chance de uma moeda - não equilibrada - resultar cara.


Note que inúmeras situações do nosso dia-a-dia são experimentos aleatórios. O exemplo a seguir exibe resumidamente outros experimentos aleatórios.


Exemplo: Outros possíveis exemplos de experimentos aleatórios:


Alternativamente, quando realizamos o mesmo experimento diversas vezes - sob as mesmas condições inicias - e este produz sempre o mesmo resultado, chamamos de experimentos determinísticos. O resultado do experimento já está determinado antes da realização do experimento. O exemplo a seguir exibe resumidamente outros experimentos determinísticos.


Exemplo: Possíveis exemplos de experimentos determinísticos:


Para lidar cientificamente com estes experimentos, necessitamos de formulações matemáticas para ambos (determinísticos e aleatórios). Para isso, modelos teóricos são construídos para cada caso. Por exemplo, a Física clássica lida com problemas em experimentos determinísticos e a Estatística lida com problemas em experimentos aleatórios. A Figura abaixo exibe a forma de modelagem - proposição de modelos teóricos - em ambos os experimentos.

Tipos gerais de modelagem para experimentos Tipos gerais de modelagem para experimentos

Criando um modelo probabilístico

Probabilidade é um conceito matemático que permite a quantificação da incerteza, permitindo que ela seja obtida, analisada e utilizada para a realização de previsões ou, até mesmo, para a orientação de intervenções. Ela torna possível tratar de forma racional (não lógica) problemas envolvendo o imprevisível (Ross 2009Ross, S. 2009. Probabilidade: Um Curso Moderno Com Aplicações. Bookman Editora.).

Basicamente, a teoria é baseada na construção de um modelo matemático para representar e tratar experimentos aleatórios. Esta construção pode ser sumarizada em dois passos:

  1. Para cada experimento aleatório, descreva todo o conjunto de possíveis resultados;

  2. “Atribua pesos” a cada possível resultado que reflita a sua chance de ocorrência durante a realização do experimento.

\[\mbox{Modelo probabilístico} \Rightarrow \mbox{tentativa precisa de descrever o acaso}\]

Assim, para descrever o conjunto de possíveis resultados de um experimento, temos a importância da definição do conceito de espaço amostral.

Espaço Amostral

O Espaço amostral é um conjunto de (todos) possíveis resultados que podemos ter ao realizar um experimento aleatório. Tal espaço é comumente denotado pela letra grega \(\Omega\). Ele pode ser finito, infinito enumerável ou, simplesmente, infinito. Cada resultado possível é chamado de ponto ou evento elementar e denotado geralmente por \(\omega.\) Então, escrevemos \(\omega \in \Omega\) para indicar que o elemento \(\omega\) pertence a \(\Omega\) (Ross 2009Ross, S. 2009. Probabilidade: Um Curso Moderno Com Aplicações. Bookman Editora.).


Exemplo: Uma rede de computadores está em operação contínua, mas pode sofrer avaria a qualquer momento. Na ocorrência de pane, o tempo de colocar a rede novamente em operação é importante e pode depender do número de falhas ocorridas. Se estivermos interessados no número de falhas diárias temos como espaço amostral: \(\Omega=\)\(\{0,1, \ldots,m\}\).

Neste caso, \(\Omega\) é um conjunto finito enumerável, sendo \(m\) o limite máximo de falhas estabelecido pelo administrador da rede. (pode-se considerar \(\Omega\) como sendo infinito enumerável, pois tal limite poderia ser não estabelecido). Em uma análise estatística, poderia haver interesse em avaliar o valor de m, para estabelecer políticas de manutenção preventiva.

Supondo agora que o interesse esteja em observar a hora do dia em que acontece a 1ª falha temos: \(\Omega\) = \(\{\omega\,\in\,\Omega\,|\,0\leq\omega<24\}\). Este conjunto não é enumerável, é infinito. Existem infinitos pontos dentro do intervalo de 0 a 24.


O exemplo acima nos mostra que é possível associar diferentes espaços amostrais a um mesmo experimento. A escolha amostral adequada depende do interesse em estudo.

Note que o espaço amostral é um conjunto matemático e, futuramente, teremos o interesse de realizar operações com os elementos deste conjunto.

Teoria dos Conjuntos

Um evento é qualquer subconjunto do espaço amostral. Usualmente denotamos os eventos com letras maiúsculas e iniciais do alfabeto (A, B, C, \(\ldots\)). Considere um experimento aleatório \(E\) associado a determinado experimento e espaço amostral \(\Omega=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5},\omega_{6}\}\). Considere também os eventos \(A\subset\Omega\), \(B\subset\Omega\) e \(C\subset\Omega\), (Lembre-se: \(\subset\) significa está contido e \(\supset\) significa contém). Além disso, para melhor entendimento da teoria de conjuntos, considere as figuras ilustrativas de cada operação, as quais exibem uma visualização frequente na literatura da teoria de probabilidades baseada na diagramação de Eüller-Venn para os eventos e o seu espaço amostral.

Sejam \(A=\{\omega_{1},\omega_{2},\omega_{3}\}\), \(B=\{\omega_{2},\omega_{4},\omega_{5}\}\) e \(C=\{\omega_{6}\}\).

\[A\cup B=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5}\}\]

A união B A união B

A intersecção B A intersecção B

c) Complementar: o complemento do evento A, denotado por \(\overline{A}\) ou \(A^{c}\), é o conjunto composto por todos os elementos que não estão em A, mas estão em \(\Omega\).

\[A^{c}=\overline{A}=\{\omega_{4},\omega_{5},\omega_{6}\}\]

A complementar A complementar

Ainda temos que

\(A\cup B\cup C=\{\omega_{1},\omega_{2},\omega_{3},\omega_{4},\omega_{5},\omega_{6}\}=\Omega\)

Algumas Propriedades

Sejam \(A, B\) e \(C\) três eventos de \(\Omega\):

Eventos Elementar e Compostos

Como vimos antes, quaisquer subconjuntos do espaço amostral é um evento, porém este pode ser classificado da seguinte forma:

Eventos Mutuamente Exclusivos

São eventos nos quais sua intersecção é vazia \((\varnothing)\). Seja A e B eventos contidos no espaço amostral, se \(A\cap B=\varnothing\) dizemos que A e B são mutuamente exclusivos ou disjuntos.

Eventos disjuntos Eventos disjuntos

Partição

São eventos que são disjuntos entre si e que sua união forma o espaço amostral. Matematicamente, seja \(A_{1},A_{2},\cdots,A_{n}\) eventos pertencentes ao espaço amostral \(\Omega\).

Dizemos que \(A_{1},A_{2},\cdots,A_{n}\) formam uma partição se e somente se:

\[A_{i}\cap A_{j}=\varnothing\;\;\forall\,1\leq i<j\leq n\]

\[\cup_{i=1}^{n}A_{i}=A_{1}\cup A_{2}\ldots\cup A_{n}=\Omega\]


Exemplos: Se lançarmos dois dados tradicionais, como um dado branco e um dado preto, o espaço amostral será:

\[\Omega=\left\{ \begin{array}{cccccc} (1,1) & (1,2) & (1,3) & (1,4) & (1,5) & (1,6)\\ (2,1) & (2,2) & (2,3) & (2,4) & (2,5) & (2,6)\\ (3,1) & (3,2) & (3,3) & (3,4) & (3,5) & (3,6)\\ (4,1) & (4,2) & (4,3) & (4,4) & (4,5) & (4,6)\\ (5,1) & (5,2) & (5,3) & (5,4) & (5,5) & (5,6)\\ (6,1) & (6,2) & (6,3) & (6,4) & (6,5) & (6,6) \end{array}\right\}\]

\(\#(\Omega)=36\), (número total de elementos no espaço amostral)

\(A = \{(1,1)\}\) e portanto \(\#(A) = 1\), evento elementar

\(B = \{(2,2), (3,1), (1,3)\}\) e portanto \(\#(B) = 3\), evento composto

\(C = \{(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (3,1), (3,2),(4,1)\}\) e portanto \(\#(C) = 10\)

\(D = \{(2,1), (2,2), (2,3), (2,4), (2,5), (2,6)\}\) e portanto \(\#(D) = 6\)

Além disso, podemos ilustrar as operações:

\(D\cup B = \{(1,3), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1)\} \Rightarrow\) resultar 2 no dado branco ou soma dos lados igual a 4

\(B^{c} \cup D^{c} = (B \cap D)^{c} \Rightarrow\) a soma não é 4 ou não temos 2 no dado branco.

Podemos utilizar o mesmo exemplo para verificar o conceito de eventos disjuntos:

\(A\cap B = \varnothing\) (vazio) \(\Rightarrow\) dar 1 nos dois dados e a soma resulta em 4.

Considere os novos eventos:

\(B1: \{(1,1),(1,2),\cdots,(1,6)\}\), resultar 1 no dado branco;

\(B2: \{(2,1),(2,2),\cdots,(2,6)\}\), resultar 2 no dado branco;

\(\vdots\)

\(B6: \{(6,1),(6,2),\cdots,(6,6)\}\), resultar 6 no dado branco;

Estes eventos são uma partição, pois \(Bi \cap Bj = \varnothing\), \(1\leq i < j \leq 6\) e \(B1 \cup B2 \cup B3 \cup B4 \cup B5 \cup B6 = \Omega\).


Para mais detalhes sobre a teoria dos conjuntos aplicada a probabilidades, recomendamos o estudo de Dantas (2004Dantas, C. A. B. 2004. Probabilidade: Um Curso Introdutório. 2(^a) ed. Eduso.) e Ross (2009Ross, S. 2009. Probabilidade: Um Curso Moderno Com Aplicações. Bookman Editora.).

Definições de probabilidade

Durante o amadurecimento da ciência probabilística, várias definições de probabilidade foram introduzidas. Exibimos aqui as definições mais importantes.

\[P(A)=\frac{\#(A)}{\#(\Omega)}=\frac{m}{n}=\frac{\mbox{número de casos favoráveis ao evento A}}{ \mbox {número total de casos}}\]

sendo que # representa o número de vezes em que o evento ocorre.

Neste caso, considera-se igual a chance de ocorrência de cada evento, isto é, o espaço é equiprovável.

\[P(A)=\frac{\mbox{número de vezes que o evento A ocorreu}}{\mbox{número total de repetições}}\]

Observe que desta forma não é necessária a hipótese de equiprobabilidade dos eventos elementares nem de que o espaço amostral seja finito.

Note que existe uma forte relação entre as definições, entretanto a definição clássica de probabilidade fornece uma metodologia de atribuição de probabilidades a eventos aleatórios mais direta, considerando casos em que os eventos elementares são equiprováveis.

Mesmo assim, temos que todas as definições acima seguem as seguintes propriedades:

  1. \(P(\varnothing)=0\);

  2. \(P(A^{c})=1-P(A)\);

  3. se \(A\subseteq B\), então \(P(A)\leq P(B)\);

  4. \(P(B\cap A^{c})\) = \(P(B)-P(B\cap A)\);

  5. \(P(A\cup B)=P(A)+P(B)-P(A\cap B)\).

Podemos aplicar estas ideias para o cálculo de probabilidades. Para ilustrar algumas, consideramos os exemplos:


Exemplo: Dentre 1000 registros de compra de uma empresa, 560 são registros de compra do fornecedor A, 220 são registros de compra do fornecedor B. Desta forma, calcule as probabilidades:

  1. A empresa efetuar uma compra do fornecedor A;

\(P(A)=560/1000\)

  1. A empresa efetuar uma compra do fornecedor B;

\(P(B)=220/1000\)

  1. A empresa efetuar uma compra de pelo menos um desses fornecedores.

\(P(A\cup B)=\frac{560}{1000}+\frac{220}{1000}=\frac{780}{1000}\)




Exemplo: Dois processadores tipos A e B são colocados em teste por 50 000 horas. A probabilidade de que um erro de cálculo aconteça em um processador do tipo A é de \(\frac{1}{30},\) do tipo B é \(\frac{1}{80}\) e em ambos é \(\frac{1}{1000}\). Qual a probabilidade de que:

  1. Pelo menos um dos processadores apresente erro?

\(P(A\cup B)=P(A)+P(B)-P(A \cap B)=0,045\)

b) Nenhum dos processadores apresente erro?

\(P(A^{c} \cap B^{c})=P((A\cup B)^{c})=1-0,045=0,955\)

c) Apenas A apresente erro?

\(P(A \cap B^{c})=P(A)-P(A \cap B)=0,032\)




Exemplo: Em uma processo seletivo para preenchimento de vaga de gerente em determinada empresa, existem 5 candidatos (A, B, C, D e E). Uma análise prévia do currículo e competências pessoais de cada um indica que: O candidato A tem cinco vezes mais chance de ocupar a vaga que o candidato B, o candidato B tem duas vezes mais chance que o candidato C, o candidato C tem a mesma chance que candidato D e, finalmente, o candidato D tem duas vezes mais chance que o candidato E. Qual a probabilidade de cada candidato ser selecionado para a vaga?

Resolução: Seja o espaço amostral \(\Omega= \{\omega_{1},\omega_{2},\omega_{3}, \omega_{4}, \omega_{5}\}\), sendo \(\omega_{1}\): O candidato A é selecionado para a vaga, \(\ldots\), \(\omega_{5}\): O candidato E é selecionado para a vaga.

Considerando \(p\) como a probabilidade do candidato E ser selecionado para a vaga, isto é, \(p\) = P(\(\omega_{5}\)), conseguimos retirar a probabilidade de cada candidato através das associações do enunciado. Da sentença “o candidato D tem duas vezes mais chance que o candidato E”, sabemos P(\(\omega_{4}\)) = \(2p\); da sentença “o candidato C tem a mesma chance que candidato D”, sabemos que P(\(\omega_{3}\)) = P(\(\omega_{4})\)= \(2p\). Da sentença “o candidato B tem duas vezes mais chance que o candidato C”, sabemos que P(\(\omega_{2}\)) = 2\(\times\)P(\(\omega_{3}\)) = \(4p\). Por fim, da sentença “o candidato A tem cinco vezes mais chance de ocupar a vaga que o candidato B”, sabemos que P(\(\omega_{1}\)) = 5\(\times\)P(\(\omega_{2}\)) = \(20p\).

Como \(P(\Omega)=P(\omega_{1}\cup\omega_{2}\cup\omega_{3}\cup\omega_{4}\cup\omega_{5})=\sum_{i=1}^{5}P(\omega_{i})=1\), temos \[20p + 4p + 2p + 2p +p= 1 \Rightarrow p = \frac{1}{28}\]

Portanto, P(\(\omega_{1})\)= \(\frac{20}{29}\), P(\(\omega_{2}\)) = \(\frac{4}{29}\), P(\(\omega_{3}\)) = \(\frac{2}{29}\), P(\(\omega_{4}\)) = \(\frac{2}{29}\) e P(\(\omega_{5}\)) = \(\frac{1}{29}\).


Em muitos problemas, especialmente quando desejamos utilizar a definição clássica de probabilidade, necessitamos de ferramentas que nos permitam contar o tamanho de um espaço amostral, para isso utilizamos técnicas de contagem. Uma breve revisão deste conteúdo é exposta a seguir.


Diagrama de Venn em R

require(ggvenn)

#GERANDO 3 CONJUNTOS DE ELEMENTOS
set.seed(1)
elementos <- paste("w",1:200,sep="")
x <- list(
  A = sample(elementos,50), 
  B = sample(elementos,50), 
  C = sample(elementos,50)
)

#CRIANDO O DIAGRAMA DE VENN
ggvenn(x, stroke_size = 0.5,fill_color = c("red","yellow","green"),  show_percentage = F)

Diagrama de Venn em Python

import matplotlib.pyplot as plt
from matplotlib_venn import venn3
plt.figure()
venn3(subsets = (23, 25, 10, 23,12,10,5),
      set_labels = ('A', 'B','C'))
## <matplotlib_venn._common.VennDiagram object at 0x00000000635FD0C0>
plt.show()