Noções de Probabilidade e Estatística
Resolução dos Exercícios Pares
Capítulo 3

Gledson Luiz Picharski

Data da última atualização: 2 de Maio de 2008

Seção 3.1


2. Com base na informação que você conhece, crie os valores e as respectivas probabilidades para a variável número de filhos em familias, no caso da população considerada ser:


a) A classe média paulistana.
b) Os habitantes do interior do Maranhão.

Resposta:

Existem várias respostas para este problema, faço então uma suposição para os itens e calculo as probabilidades.
a)

  > freq = c(10, 20, 30, 35, 30, 15, 5)
  > x <- data.frame(num.filhos = 0:6, freq, prob = freq/sum(freq))
  > x

    num.filhos freq       prob
  1          0   10 0.06896552
  2          1   20 0.13793103
  3          2   30 0.20689655
  4          3   35 0.24137931
  5          4   30 0.20689655
  6          5   15 0.10344828
  7          6    5 0.03448276

b)

  > freq = c(5, 10, 28, 32, 35, 20, 10, 5)
  > x <- data.frame(num.filhos = 0:7, freq, prob = freq/sum(freq))
  > x

    num.filhos freq       prob
  1          0    5 0.03448276
  2          1   10 0.06896552
  3          2   28 0.19310345
  4          3   32 0.22068966
  5          4   35 0.24137931
  6          5   20 0.13793103
  7          6   10 0.06896552
  8          7    5 0.03448276



4. O número de anos prestando vestibular para conseguir uma vaga na universidade está sendo estudado. As carreiras têm procuras diferentes e, em muitas delas, o comum pode ser prestar vestibular mais de um ano. Suponha que escolhemos, ao acaso, um dos ingressantes da sua carreira. Que probabilidade você atribuiria(invente!) ànecessidade de 1,2,3,... anos de vestibular.

Resposta:

Devem ser respeitados os axiomas de probabilidade para fazer esta suposição, uma solução possivel seria:

  > x <- data.frame(anos = 1:5, prob = c(0.3, 0.25, 0.2, 0.15, 0.1))





anosprob



1 1 0.30
2 2 0.25
3 3 0.20
4 4 0.15
5 5 0.10





6. Uma variável aleató X tem a seguinte função de distribuição:

        (
        || 0, se x < 10;
        |||
        |{ 0,2 se 10 ≤ x < 12;
F (x ) =   0,5 se 12 ≤ x < 13;
        |||
        |||( 0,9 se 13 ≤ x < 25;
          1 sex ≥ .

Determine:


a) A função probabilidade de X.
b) P(X 12).
c) P(X < 12).
d) P(12 X 20)
e) P(X > 18).

Resposta:
a)

        (
        ||| 0, se x < 10;
        ||| 0.2, se 10 ≤ x < 12;
        {
f (x) = | 0.3, se 12 ≤ x < 13;
        ||| 0.4, se 13 ≤ x < 25;
        ||(
          0.1, se x ≥ 25.

b) P(X 12) = P(X < 12) + P(X = 12) = 0.2 + 0.3 = 0.5
c) P(X < 12) = 0.2
d) P(12 X 20) = 0.3 + 7 ×0.4-
 9 = 0.61
e) P(X > 18) = 6 ×0.4-
 9 + 0.1 = 0.37



Seção 3.2


2. Sendo X uma variável seguindo o modelo Uniforme Discreto, com valores no conjunto1,2,3,...,10, pergunta-se:


a) P(X 7).
b) P(3 < X 7).
c) P(X < 2 ou X 8).
d) P(X 5 ou X > 8).
e) P(X > 3 e X < 6).
f) P(X 9|X 6).

Resposta:

Uma solução computacionalmente correta seria a que segue, mais abaixo faço um detalhamento um pouco maior de uma resolução não computacional.

  > x <- 1:10

a)

  > mean(x >= 7)

  [1] 0.4

b)

  > mean(x <= 7 & x > 3)

  [1] 0.4

c)

  > mean(x < 2  | x >= 8)#A opção "|" significa "ou"

  [1] 0.4

d)

  > mean(x > 5  | x > 8)#A opção "|" significa "ou"

  [1] 0.5

e)

  > mean(x > 3 & x < 6)

  [1] 0.2

f)

  > mean(x[x >= 6] <= 9)

  [1] 0.8

Resolução alternativa:

É sempre interessante deixar bem definida a distribuição com a qual está trabalhando.
Ω = {1, 2,, 3, 4, 5, 6, 7, 8, 9, 10}
X ~ Uniforme(a,b)
a  =  1
b  =  10

No caso do modelo uniforme discreto é fácil utilizar a definição classica de probabilidade, onde simplesmente dividimos o número de casos faforaveis ao evento pelo número de casos possíveis.
a) A = {x ∈ Ω|x 7}  =  {7, 8, 9, 10}

P(X 7) = ♯A
---
♯Ω = 4
---
10 = 0.4
b)

B = {x ∈ Ω|3 < x 7}  =  {4, 5, 6, 7}

P(3 < X 7) = ♯B
---
♯Ω =  4
---
10 = 0.4
c) C = {x ∈ Ω|x < 2 ou x 8}  =  {1, 8, 9, 10}

P(X < 2 ou X 8) = P(X < 2 X 8) = ♯C-
♯Ω = -4-
10 = 0.4

Este caso também pode ser visto de forma diferente:
C1 = {x ∈ Ω|x < 2}  =  {1}
C2 = {x ∈ Ω|x 8}  =  {8, 9, 10}

P(X < 2   X 8) = P(C1 C2) = P(C1) + P(C2) - P(C1 C2)

Sabendo que não existe intersecção entre os eventos, ou seja P(C1 C2) = 0, temos:

P(X < 2   X 8) =  1
---
10 +  3
---
10 =  4
---
10 = 0.4
d) D = {x ∈ Ω|x 5 ou x > 8}  =  {5, 6, 7, 8, 9, 10}

P(X 5 ou X > 8) = ♯D-
♯Ω = -6-
10 = 0.6

De forma analoga ao item anterior, temos:

D1 = {x ∈ Ω|x 5}  =  {5, 6, 7, 8, 9, 10}
D2 = {x ∈ Ω|x > 8}  =  {9, 10}

P(X 5 ou X > 8) = P(D1 D2) = P(D1) + P(D2) - P(D1 D2)

P(X 5 ou X > 8) = 6
---
10 +  2
---
10 -2
---
10 =  6
---
10 = 0.6
e) D = {x ∈ Ω|x > 3 e x < 6}  =  {4, 5}

P(3 < X < 6) = ♯E-
♯Ω = 2--
10 = 0.2
f)

A probabilidade condicionada pode ser vista classicamente assumindo que o evento de condição é o novo espaço amostral, assim teriamos:

Ωf = {x ∈ Ω|x 6} = {6, 7, 8, 9, 10}

F1 = {x ∈ Ωf|x 9} = {6, 7, 8, 9}

P(X 9|X 6) = ♯F-1-
♯Ωf = 4-
5 = 0.8

Também pode ser resolvido pela própria definição de probabilidade condicional, que em muitos casos pode ser mais favorável por nos levar ao teorema de Bayes. Consideremos novamente o espaço amostral inicial e definamos os eventos F2 e F3.
F2 = {x ∈ Ω|x 9} = {1, 2, 3, 4, 5, 6, 7, 8, 9}
F3 = {x ∈ Ω|x 6} = {6, 7, 8, 9, 10}

P(X 9|X 6) = P(F 2 ∩ F3)
------------
  P (F 3) = 4-
150-
10 = 4
--
5 = 0.8



4. Discuta a validade do modelo Binomial nos seguintes casos:


a) Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se declaram usuários de drogas.
b) Escolhemos 20 lâmpadas ao acaso na prateleira de um supermercado, sendo 10 de uma fábrica e 10 de outra. Contamos o número total de defeituosas.
c) Quinze automóveis 0 km de uma mesma marca e tipo são submetidos a um teste anti-poluição e contamos o número deles que passaram no teste.
d) Um motorista é submetido a um teste em que deve estacionar seu vaículo num pequeno espaço(is é popularmente chamado de fazer baliza). Em 10 tentativas, contamos o número de vezes em que o motorista estacionou corretamente.

Resposta:

Não existe resposta única, mas vou reproduzir possiveis respostas para os problemas.
a) O modelo binomial não parece adequado para está situação, pois existe uma chance diferente de cada aluno ser dorgado, para ser Binomial a chance de cada um ser drogado deferia ser a mesma.
b) Neste caso o modelo Binomial não se aplica, pois cada lâmpada possui chance diferênte de ter defeito.
c) Por serem da mesma fábrica e mesmo modelo, podemos considerar que a chance que cada carro tem de ser poluente é a mesma, então o modelo Binomial poderia ser usado, visto que temos um número limidado de eventos e cada um pode ter apenas como resultado falha ou aprovado.
d) Considerando que o motorista não está ganhando experiência durante o teste, podemos utilizar o modelo Binomial, pois cada evento, possui chance semelhante ao anterior, e temos duas possibilidades para cada evento que são acerto e erro.



6. Uma certa doença pode ser curada através de precedimentos cirúrgico em 80% dos casos. Dentre os que têm essa doença, sorteamos 15 participantes que serão submetidos à cirurgia. Fazendo alguma suposição adicional que jugar necessária, responda qual é a probabilidade de:


a) Todos serem curados?
b) Pelo menos dois não serem curados?
c) Ao menos 10 ficarem livres da doença?

Resposta:

X ~ Binomial(n,p) n = 15 p = 0.8 X : # de pessoas curadas.

  > n <- 15
  > p <- 0.8

a) Basta calcular a Binomial para X = 15.

  > pbinom(14, n, p, lower = F)

  [1] 0.03518437

b) Pelo menos 13 serão curados, então teremos X 13.

  > pbinom(13, n, p)

  [1] 0.8328742

c) c) Isto significa que teremos X 10.

  > pbinom(9, n, p, lower = F)

  [1] 0.9389486



Seção 3.3


2. Uma moeda equilibrada é lançada sucessivamente, de modo independente, até que ocorra a primeira cara. Seja X a variável aleatória que conta o número de lançamentos anteriores à ocorrência de cara. Determine:


a) P(X = 3)
b) P(2 X < 4)
c) P(X > 1|X 2)
d) P(X 1).

Resposta:

X ~ Geométrica(0.5).
a)

  > pgeom(2, 0.5)

  [1] 0.875

b)

  > pgeom(1, 0.5, lower = F)

  [1] 0.25

c)

  > sum(dgeom(4:5, 0.5))

  [1] 0.046875

d)

  > qgeom(0.8, 0.5)

  [1] 2



4. A aplicação de fundo anti-corrosivo em chapas de aço de 1 m2 é feita mecanicamente e pode produzir defeitos (pequenas bolhas na pintura), de acordo com uma variável aleatória Poisson de parâmetro λ = 1 por m2. Uma chapa é sorteada ao acaso para ser inspecionada, pergunta-se a probabilidade de :


a) Encontrarmos pelo menos 1 defeito.
b) No máximo 2 defeitos serem encontrados.
c) Encontrarmos de 2 a 4 defeitos.
d) Não mais de 1 defeito ser encontrado.

Resposta:

X ~ poisson(1)
a) P(X 1)

  > ppois(0, 1, lower = F)

  [1] 0.6321206

b) P(X 2)

  > ppois(2, 1)

  [1] 0.9196986

c) P(2 X 4)

  > sum(dpois(2:4, 1))

  [1] 0.2605813

d) P(X 1)

  > ppois(1, 1)

  [1] 0.7357589



6. Por engano 3 peças defeituosas foram misturadas com boas formando um lote com 12 peças no total. Escolhendo ao acaso 4 dessas peças, determine a probabilidade de encontrar:


a) Pelo menos 2 defeituosas.
b) No máximo 1 defeituosa.
c) No mínimo 1 boa.

Resposta:

Observamos que neste caso para o R, n vai ser o número de peças boas e m o número de defeituosas.
a)

  > phyper(2, 3, 9, 4, lower = F)

  [1] 0.01818182

b)

  > phyper(4, 3, 9, 4)

  [1] 1

c)

  > phyper(3, 3, 9, 4)

  [1] 1



Seção 3.4


2. Uma agência de turismo apresenta aos clientes o orçamento de uma certa viagem em duas partes. A primeira é o transporte aéreo que têm três opções com preços, 3; 3,5 e 4 mil reais e preferências de de escolha o,5; 0,3 e 0,2 para orçamento é a escolha TWA, TWB e TWC, respectivamente. A segunda parte do orçamento é a escolha de estadia. Existem quatro opções de hotéis que custam 2; 2,5; 3 e 3,5 mil reais e são escolhidos pelos clientes com a mesma preferência, independentemente da companhia aérea. Seja X a variável aleatória orçamento da viagem. Calcule a função de probabilidade e a função de distribuição da variável X.

Resposta:

Faço algumas simulações de valores para conseguir os dados que o livro deu de forma resumida, então obtenho a função de probabilidade e a função densidade.

  > transporte <- matrix(c(3,3.5,4,0.5,0.3,0.2),ncol=2)
  > estadia <- matrix(c(2,2.5,3,3.5,rep(0.25,4)),ncol=2)
  > despesa <- matrix(c(rep(transporte[,1],each=4)+rep(estadia[,1],3),
  +                   rep(transporte[,2],each=4)*rep(estadia[,2],3)),ncol=2,
  +                   dim =  list(rep("",12),c("valor","prob")))
  > ##função de probabilidade da despesa de viagem.
  > despesa

   valor  prob
     5.0 0.125
     5.5 0.125
     6.0 0.125
     6.5 0.125
     5.5 0.075
     6.0 0.075
     6.5 0.075
     7.0 0.075
     6.0 0.050
     6.5 0.050
     7.0 0.050
     7.5 0.050

  > for(i in 1:12){a <- paste("a",1:12,sep=""); assign(a[i],sum(despesa[1:i,2]))}
  > distribuição.despesa <- matrix(c(despesa[,1],unlist(lapply(a,get))),
  +                                ncol=2,dim =  list(rep("",12),c("valor","prob")))
  > ##função distribuição de probabilidade da despesa de viagem.
  > distribuição.despesa

   valor  prob
     5.0 0.125
     5.5 0.250
     6.0 0.375
     6.5 0.500
     5.5 0.575
     6.0 0.650
     6.5 0.725
     7.0 0.800
     6.0 0.850
     6.5 0.900
     7.0 0.950
     7.5 1.000

4. Na verificação de máquinas, observam-se as partes elétrica, mecânica e estrutural. A probabilidade de aparecer uma falha em cada uma das partes é 0,01; independente das demais. Ocorrendo falha, o tempo de conserto é 10, 20 ou 50 minutos para falha elétrica, mecânica ou estrutural, respectivamente. Se a falha elétrica aparece junto com a falha mecânica, teremos ainda um acréscimo de 20 minutos. Para uma máquina escolhida ao acaso, qual a probabilidade do tempo de interrupção(se não há falha, esse tempo é zero):


a) Durar menos de 25 minutos?
b) Ultrapassar 40 minutos?

Resposta:

O número 1 representa a ocorrência de falha na parte descrita, e 0 representa a não ocorrência de falha, as três primeiras colunas de prob são correspondente ao aparecimento ou não de falha, a coluna prob é obtida pelo produto das três probabilidades, visto que são eventos independentes.

  > x <- data.frame(ele = rep(c(0, 1), each = 4), mec = rep(c(0,
  +     1, 0, 1), each = 2), est = rep(c(0, 1), 4), prob1 = rep(c(0.9,
  +     0.1), each = 4), prob2 = rep(c(0.9, 0.1, 0.9, 0.1), each = 2),
  +     prob3 = rep(c(0.9, 0.1), 4))
  > x$prob <- with(x, prob1 * prob2 * prob3)
  > x$tempo <- with(x, ele * 10 + mec * 20 + est * 50)
  > x$tempo[x$ele == 1 & x$mec == 1] <- x$tempo[x$ele == 1 & x$mec ==
  +     1] + 20
  > x

    ele mec est prob1 prob2 prob3  prob tempo
  1   0   0   0   0.9   0.9   0.9 0.729     0
  2   0   0   1   0.9   0.9   0.1 0.081    50
  3   0   1   0   0.9   0.1   0.9 0.081    20
  4   0   1   1   0.9   0.1   0.1 0.009    70
  5   1   0   0   0.1   0.9   0.9 0.081    10
  6   1   0   1   0.1   0.9   0.1 0.009    60
  7   1   1   0   0.1   0.1   0.9 0.009    50
  8   1   1   1   0.1   0.1   0.1 0.001   100

a) Basta somarmos as probabilidades onde onde tivermos o tempo menor que 25 minutos.

  > with(x, sum(prob[tempo < 25]))

  [1] 0.891

b) Soma-se as probabilidades correspondentes a tempos maiores que 40 minutos.

  > with(x, sum(prob[tempo > 40]))

  [1] 0.109



6. Uma variável aleatória X tem a seguinte função de distribuição:

F(x) = {
  0, se x < - 1;
  0.2, se  - 1 ≤ x < 2;0.5, se 2 ≤ x < 5;0.7, se 5 ≤ x < 6;0.9, se 6 ≤ x < 15; 1, se x ≥ 15;

Determine:


a) A função de probabilidade de X.
b) P(X ≤-2)
c) P(X < 2).
d) P(3 X 12)
e) P(X > 14)

Resposta:
a) A função de probabilidade pode ser obtida observando a probabilidade de cada classe mostrada pelo exercício.

        ( 0, se x < - 1;
        ||||
        ||| 0.2, se - 1 ≤ x <  2;
        |{ 0.3, se 2 ≤ x < 5;
f (x ) =
        ||| 0.2, se 5 ≤ x < 6;
        ||| 0.2, se 6 ≤ x < 15;
        ||(
          0.1, se x ≥ 15.

b) P(X ≤-2) = 0
c) P(X < 2) = 0.2
d) P(3 X 12) = 2 ×0.3
 3 + 0.2 + 6 ×0.2-
9 = 0.533
e) P(X > 14) = 1 *0.2
 9 + 0.1 = 0.122



8. Em treinamento de animais, usa-se a repetição como estratégia de aprendizagem. Num experimento, um macaco realiza certa tarefa corretamente, pela primeira vez, com probabilidade 0,5. Caso falhe, a probabilidade de realizar corretamente na segunda tentativa cresce 10%, ou seja, a probabilidade é agora 0,55 e assim sucessivamente. Admita que o experimento termina em quatro tentativas ou antes, na primeira vez que o macaco acertar. Descreva o comportamento probabilístico do número de tentativas.

Resposta:

Aqui podemos observar um caso particular de Bernoulli, pois em cada tentativa só pode dar certo ou errado, mas como temos 4 eventos possiveis, em que o experimento termina quando o macaco acerta na tarefa, e cada tentativa tem probabilidade diferente da anterior, então este modelo é desconhecido, mas podemos dizer que as chances de acertividade são cada veis maiores conforme almentam o número de tentativas.
10. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para uma família com três filhos, calcule a probabilidade de que:


a) Exatamente dois sejam do sexo masculino.
b) Pelo menos um deles ser do sexo masculino.
c) Todos serem do sexo masculino.

Resposta:

Usando o número 0 para representar o sexo feminino e 1 para o masculino, construo uma matriz de casos possiveis e através disto obtenhos as probabilidades.

  > x <- data.frame(A = rep(c(0, 1), each = 4), B = rep(c(0, 1, 0,
  +     1), each = 2), C = rep(c(0, 1), 4), prob = rep(0.5^3, 8))

a) Percebemos esta situação onde a soma entre as colunas A, B e C resultam em exatamente 2.

  > with(x, sum(prob[A + B + C == 2]))

  [1] 0.375

b) Isso pode ser observado nas linhas onde a soma das três primeiras colunas é maior ou igual a 1.

  > with(x, sum(prob[A + B + C >= 1]))

  [1] 0.875

c) Esta situação é observada onde a soma das colunas resulta em exatamente 0.

  > with(x, sum(prob[A + B + C == 0]))

  [1] 0.125



12. Um certo equipamento é expedido em lotes de 500 unidades. Antes que uma remessa seja aprovada, um inspetor escolhe 5 desses equipamentos e os inspeciona. Se nenhum dos equipamentos inspecionados for defeituoso, o lote é aprovado. Se um ou mais equipamentos forem defeituosos, todas as unidades são inspecionadas. Suponha que existam, de fato, dez equipamentos defeituosos no lote. Utilizando uma suposição conveniente, qual é a probabilidade de que seja necessário testar todos os equipamentos?

Resposta:

temos 500 unidades deste equipamento, serão retirados 5 para inspeção, sabemos que 10 são defeituosos e 490 são bons, então basta colocar os dados em uma hypergeométrica que obtemos o resultado, assim verifico a probabilidade de haver um equipamento defeituoso entre os 5 retirados.

  > phyper(1, 490, 10, 5)

  [1] 4.041299e-07

14. Um laboratório estuda a emissão de partículasde certo material radioativo. Seja N: número de partículas emitidas em 1 minuto. O laboratório admiteque N tem função de probabilidade Poisson com parâmetro 5, isto é,

P(N = k) =  - 5 k
e--5--
  k!,k = 0, 1, 2,...


a) Calcule a probabilidade de que em um minuto não haja emissões de partículas.
b) Determine a probabilidade de que pelo menos uma partícula seja emitida em um minuto.
c) Qual a probabilidade que, em um minuto, o número de partículas emitidas esteja entre 2 e 5(inclusive)?

Resposta:

O calculo pode ser feito usando a fómula, mas de forma mais simples uso uma função do R para obter a resposta.
a)

  > ppois(0, 5)

  [1] 0.006737947

b)

  > ppois(0, 5, lower = F)

  [1] 0.993262

c) queremos verificar P(2 < X 5), usa-se a mesma função.

  > diff(c(ppois(2, 5), ppois(5, 5)))

  [1] 0.4913086



16. Uma vacina contra a gripe é eiciente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:


a) Pelo menos 18 imunizados.
b) No máximo 4 imunizados.
c) Não mais do que 3 não imunizados.

Resposta:

X ~ Binom(n,p) n = 20 p = 0.7 X : # de pacientes imunizados
a) Podemos usar o lower.tail do pbinom para para calcular a probabilidade de ser acima do valor, ou então podemos usar o complementar da probabilidade de ser abaixo do valor. Talvez existam outras maneiras interessantes de resolver esta questão.

  > pbinom(17, 20, 0.7, lower = F)

  [1] 0.03548313

  > 1 - pbinom(17, 20, 0.7)

  [1] 0.03548313

b)

  > pbinom(4, 20, 0.7)

  [1] 5.550253e-06

c)

  > pbinom(17, 20, 0.7)

  [1] 0.9645169



18. As pacientes diagnosticadas com câncer de mama precocemente têm 80% de probabilidade de serem completamente curadas. Para um grupo de 12 pacientes nessas condições, calcule a probabilidade de:


a) Oito ficarem completamente curadas.
b) Não serem curadas 3 a 5 pacientes.
c) Não mais de 2 permanecerem com a doença.

Resposta:

X ~ Binom(n,p) n = 12 p = 0.8 X : # de paciêntes completamente curados.
a) P(X = 8)

  > dbinom(8, 12, 0.8)

  [1] 0.1328756

b) P(X < 3,X > 5)

  > sum(c(pbinom(2, 12, 0.8), pbinom(5, 12, 0.8)))

  [1] 0.003907658

c) P(X < 10)

  > pbinom(9, 12, 0.8)

  [1] 0.4416543



20. Em momentos de pico, a chegada de aviões a um aeroporto se dá segundo o modelo Poisson com taxa de 1 por minuto.


a) Determine a probabilidade de 3 chegadas em um minuto qualquer do horário de pico.
b) Se o aeroporto pode atender 2 aviões por minuto, qual a probabilidade de haver aviões sem atendimento imediato?
c) Previsões para os próximos anos indicam que o tráfego deve dobrar nesse aeroporto, enquanto que a capacidade de atendimentopoderá ser no máximo ampliada em 50%. Como ficará a probabilidade de espera por atendimento?

Resposta:

X ~ Pois(λ) λ = 1 X : # de aviões por minuto.
a) P(X = 3)

  > dpois(3, 1)

  [1] 0.06131324

b) Para que algum avião fique sem atendimento imediato já deve ter dois sendo atendidos, ou seja, temos que calcular P(X > 2)

  > ppois(2, 1, lower = F)

  [1] 0.0803014

c) Com o tráfego dobrando, teremos λ sendo 2, sendo 3 aviões a nova capacidade, devemos calcular: P(X > 3)

  > ppois(3, 2, lower = F)

  [1] 0.1428765



22. No estudo do desempenho de uma central de computação, o acesso à Unidade Central de Processamento(CPU) é assumido ser Poisson com 4 requisições por segundo. Essas requisições podem ser de várias naturezas tais como: imprimir um arquivo, efetuar um certo cálculo ou enviar uma mensagem pela Internet entre outras.


a) EScolhendo ao acaso um intervalode 1 segundo, qual é a probabilidade de haver mais de 2 acessos à CPU? E do número de acessos não ultrapassar 5?
b) Considerando agora o intervalo de 10 segundos, também escolhido ao acaso, qual é a probabilidade de haver 50 acessos?

Resposta:

X ~ Pois(λ) λ = 4 X : # de acessos à CPU por segundo.
a) ueremos calcular: P(X > 2) e P(X 5)

  > ppois(2, 4, lower = F)

  [1] 0.7618967

  > ppois(5, 4)

  [1] 0.7851304

b) Para λ = 10, queremos: P(X = 50)

  > dpois(50, 10)

  [1] 1.492727e-19



24. Considere uma variável aleatória X ~ G(0, 8). Construa uma nova variável Y tal que Y = X para os valores 0, 1, 2,..., 5 e Y = 6 para X 6. Dessa forma, Y corresponde ao truncamento de X a valores menores ou iguais a 6. Obtenha a função de probabilidade de Y e calcule:


a) P(Y = 2)
b) O valor da função de distribuição (acumulado) no ponto 2,5;
c) P(Y = 3|Y 5).
d) P(Y eX < 8)

Resposta:

X ~ Geométrica(p) p = 0.8

       (
       | 0, se y < 0;
       {           y
f(y) = | 0.8 × (0.2) , se 0 ≤ y < 6;
       ( 0.8 × (0.2)6, se y ≥ 6.

  > df <- function(y) {
  +     if (y < 0)
  +         0
  +     else {
  +         if (y >= 0 | y < 6)
  +             dgeom(y, 0.8)
  +         else {
  +             dgeom(6, 0.8)
  +         }
  +     }
  + }
  > pf <- function(y) {
  +     sum(sapply(0:y, df))
  + }

a) Poderiamos observar a função de probabilidade para ver a condição e então calcular usando a função dpois(q,p), ou podemos usar a função que criei.

  > df(2)

  [1] 0.032

b) A probabilidade acumulada até o ponto 2.5 pode ser obtida por: P(X < 3)

  > pf(3)

  [1] 0.9984

c) P-(Y-=-3-∩-Y--≤-5)
   P (Y ≤=   5) = --P(X--=-3--
P (Y ≤=   5)

  > df(3)/pf(5)

  [1] 0.00640041

d) P(3 Y 5)

  > diff(c(pf(2), pf(5)))

  [1] 0.007936



26. Em um estudo sobre o crescimento de jacarés, uma pequena lagoa contém 4 exemplares de espécie A e 5 da espécie B. A evolução de peso e tamanho dos 9 jacarés da lagoa é acompanhada pelos pesquisadores através de capturas periódicas. Determine a probabilidade de, em três jacarés capturados de uma vez, obtermos:


a) Todos da espécie A.
b) Nem todos serem da espécie B.
c) A maioria ser da espécie A.

Resposta:

Temos aqui, uma hipergeométrica, com m=4, n= 5 e r = 3, sendo o total de jacarés m+n.
a)

  > dhyper(3, 4, 5, 3)

  [1] 0.04761905

b) P(X 1)

  > phyper(0, 4, 5, 3, lower = F)

  [1] 0.8809524

c) P(X 2)

  > phyper(1, 4, 5, 3, lower = F)

  [1] 0.4047619



28. (Use o computador) Para os dados apresentados na Tabela 1.1 no Capítulo 1.


a) Construa a tabela de freqüências para a variável Exer, horas de atividade física por semana.
b) Suponha que 5 possoas são selecionadas ao acaso. Qual a probabilidade de que 3 delas pratiquem, pelo menos, 6 horas de atividade física por semana?
c) Repita o item (b) calculando a probabilidade de todas as pessoas escolhidas praticarem pelo menos 6 horas de atividade física.

Resposta:

A tabela pode ser obtida com o diretamente do site, ou de um arquivo local, basta direcionar corretamente.

  > tab <- read.table("http://www.ime.usp.br/~noproest/dados/questionario.txt",
  +     head = T)
  > head(tab)

    Id Turma Sexo Idade  Alt Peso Filhos Fuma Toler Exerc Cine OpCine TV OpTV
  1  1     A    F    17 1.60 60.5      2  NAO     P     0    1      B 16    R
  2  2     A    F    18 1.69 55.0      1  NAO     M     0    1      B  7    R
  3  3     A    M    18 1.85 72.8      2  NAO     P     5    2      M 15    R
  4  4     A    M    25 1.85 80.9      2  NAO     P     5    2      B 20    R
  5  5     A    F    19 1.58 55.0      1  NAO     M     2    2      B  5    R
  6  6     A    M    19 1.76 60.0      3  NAO     M     2    1      B  2    R

a) Verifico o minimo e o máximo, então escolho o tamanho de cada classe e divido em classe.

  > with(tab, range(Exerc))

  [1]  0 10

  > with(tab, table(cut(Exerc, c(0:5 * 2), right = F, include = T)))

   [0,2)  [2,4)  [4,6)  [6,8) [8,10]
      11     14     12      8      5

b) A situação corresponde ao modelo hipergeométrico, onde podemos dividir casos favoraveis como sendo 6 horas ou mais de exercicios, e desfavoraveis o complementar disto.

  > m <- with(tab, sum(Exerc >= 6))
  > n <- with(tab, sum(Exerc < 6))
  > dhyper(3, m, n, 5)

  [1] 0.08989975

c)

  > dhyper(5, m, n, 5)

  [1] 0.0006074308



30. (Use o computador) Considere os dados do arquivo aeusp.txt descrito no exercício 26, Capítulo 1.


a) Para a variável Temposp, construa uma tabela de freqüência com faixas de tamanho 10, a partir do zero. Obtenha o histograma correspondente e discuta a adequação de algum modelo discreto a esses dados.
b) Faça um histograma da variável Resid. Verifique se o modelo Binomial com parâmetros n = 10 e p = 0, 5 seria adequado para representar o comportamento dessa variável na população.

Resposta:

  > se <- read.xls("aeusp.xls", head = T)

  [1] "/tmp/Rtmp0L0ym5/file7a6d8d3c.csv"

  > head(se)

    Num    Comun Sexo Idade Ecivil X.Reproce X.Temposp X.Resid Trab Ttrab X.Itrab
  1   1 JdRaposo    2     4      4  Nordeste        21       9    3    NA      20
  2   2 JdRaposo    2     1      1   Sudeste        24       9    1     1      14
  3   3 JdRaposo    2     2      1  Nordeste        31       3    1     1      14
  4   4 JdRaposo    1     2      2  Nordeste        10       3    1     4      10
  5   5 JdRaposo    2     4      2  Nordeste        31       6    1     1      11
  6   6 JdRaposo    2     4      2   Sudeste        24       4    2    NA      15
    X.Renda X.Acompu X.Serief
  1       1        2        1
  2       2        2        7
  3       5        2        7
  4       5        2       11
  5       6        1        4
  6       4        2        4

  > names(se) <- lapply(strsplit(names(se), "X."), function(x) x[length(x)])
  > head(se)

    Num    Comun Sexo Idade Ecivil  Reproce Temposp Resid Trab Ttrab Itrab Renda
  1   1 JdRaposo    2     4      4 Nordeste      21     9    3    NA    20     1
  2   2 JdRaposo    2     1      1  Sudeste      24     9    1     1    14     2
  3   3 JdRaposo    2     2      1 Nordeste      31     3    1     1    14     5
  4   4 JdRaposo    1     2      2 Nordeste      10     3    1     4    10     5
  5   5 JdRaposo    2     4      2 Nordeste      31     6    1     1    11     6
  6   6 JdRaposo    2     4      2  Sudeste      24     4    2    NA    15     4
    Acompu Serief
  1      2      1
  2      2      7
  3      2      7
  4      2     11
  5      1      4
  6      2      4

  > with(se, Sexo[Sexo != 1 & Sexo != 2] <- NA)
  > with(se, Idade[Idade < 1 | Idade > 4] <- NA)
  > with(se, Ecivil[Ecivil < 1 | Ecivil > 5] <- NA)
  > with(se, Temposp[Temposp[Idade == 1] > 25] <- NA)
  > with(se, Temposp[Temposp[Idade == 2] > 35] <- NA)
  > with(se, Temposp[Temposp[Idade == 3] > 45] <- NA)
  > with(se, Temposp[Temposp[Idade == 4] > Inf] <- NA)
  > with(se, Idade[Temposp == NA] <- NA)
  > with(se, Trab[Trab < 1 | Trab > 3] <- NA)
  > with(se, Ttrab[Ttrab < 1 | Ttrab > 5] <- NA)
  > with(se, Renda[Renda < 1 | Renda > 6] <- NA)
  > with(se, Acompu[Acompu < 1 | Acompu > 2] <- NA)
  > with(se, Serief[Serief < 1 | Serief > 12] <- NA)

a) Observamos na Figura 1 que os dados parecem com a distribuição de poisson, e faz sentido, pois mostra uma relação com a faixa de tempo que as pessoas moram na região.

  > with(se, range(Temposp))

  [1]  1 67

  > with(se, table(cut(Temposp, 0:7 * 10)))

   (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]
      105     124     105      29      19       2       1

  > with(se, hist(Temposp, breaks = 0:7 * 10, main = ""))


pict
Figura 1: Histograma do tempo de residencia em SP



b)

  > R.obs <- with(se, table(Resid))
  > R.obs <- c("0" = 0, R.obs)
  > R.esp <- dbinom(0:10, size = 10, p = 0.5)

  > barplot(rbind(R.obs/sum(R.obs), R.esp), bes = T, col = c("gray70",
  +     "gray30"))
  > legend("topright", c("Observados", "Esperados"), fill = c("gray70",
  +     "gray30"))


pict
Figura 2: Comparativo entre o Modelo Binomial e a variavel número de residentes(Resid).




Seção 3.3


2. Sendo X uma variável seguindo o medelo Binomial com parâmetros n = 15 e p = 0, 4; pergunta-se:


a) P(X 14).
b) P(8 < X 10).
c) P(X < 2 ou X 11).
d) P(X 11 ou X > 13).
e) P(X > 3 e X < 6).
f) P(X 13|X   11).

Resposta:
a)
b)
c)
d)
e)
f)