15 Intervalos de confiança – I

Nesta sessão vamos verificar como utilizar o R para obter intervalos de confiança para parâmetros de distribuições de probabilidade.

Para fins didáticos mostrando os recursos do R vamos mostrar três possíveis soluções:

1.
fazendo as contas passo a passo, utilizando o R como uma calculadora
2.
escrevendo uma função
3.
usando uma função já existente no R

15.1 Média de uma distribuição normal com variância desconhecida

Considere o seguinte problema:

Exemplo
O tempo de reação de um novo medicamento pode ser considerado como tendo distribuição Normal e deseja-se fazer inferência sobre a média que é desconhecida obtendo um intervalo de confiança. Vinte pacientes foram sorteados e tiveram seu tempo de reação anotado. Os dados foram os seguintes (em minutos):

2.93.43.54.14.64.74.53.85.34.9
4.85.75.85.03.45.96.34.65.56.2

Entramos com os dados com o comando

  > tempo <- c(2.9, 3.4, 3.5, 4.1, 4.6, 4.7, 4.5, 3.8, 5.3, 4.9, 4.8,
  +     5.7, 5.8, 5, 3.4, 5.9, 6.3, 4.6, 5.5, 6.2)

Sabemos que o intervalo de confiança para média de uma distribuição normal com variância desconhecida, para uma amostra de tamanho n é dado por:

(      ∘  ---      ∘ ---)
          S2-        S2-
  ¯x - tt  n ,x¯+ tt   n
onde tt é o quantil de ordem 1 - α∕2 da distribuição t de Student, com n - 1 graus de liberdade.

Vamos agora obter a resposta das três formas diferentes mencionadas acima.

15.1.1 Fazendo as contas passo a passo

Nos comandos a seguir calculamos o tamanho da amostra, a média e a variância amostral.

  > n <- length(tempo)
  > n

  [1] 20

  > t.m <- mean(tempo)
  > t.m

  [1] 4.745

  > t.v <- var(tempo)
  > t.v

  [1] 0.9920789

A seguir montamos o intervalo utilizando os quantis da distribuição t, para obter um IC a 95% de confiança.

  > t.ic <- t.m + qt(c(0.025, 0.975), df = n - 1) * sqrt(t.v/length(tempo))
  > t.ic

  [1] 4.278843 5.211157

15.1.2 Escrevendo uma função

Podemos generalizar a solução acima agrupando os comandos em uma função. Nos comandos primeiro definimos a função e a seguir utilizamos a função criada definindo intervalos a 95% e 99%.

  > ic.m <- function(x, conf = 0.95) {
  +     n <- length(x)
  +     media <- mean(x)
  +     variancia <- var(x)
  +     quantis <- qt(c((1 - conf)/2, 1 - (1 - conf)/2), df = n - 1)
  +     ic <- media + quantis * sqrt(variancia/n)
  +     return(ic)
  + }
  > ic.m(tempo)

  [1] 4.278843 5.211157

  > ic.m(tempo, conf = 0.99)

  [1] 4.107814 5.382186

Escrever uma função é particularmente útil quando um procedimento vai ser utilizados várias vezes.

15.1.3 Usando a função t.test

Mostramos as soluções acima para ilustrar a flexibilidade e o uso do programa. Entretanto não precisamos fazer isto na maioria das vezes porque o R já vem com várias funções para procedimentos estatísticos já escritas. Neste caso a função t.test pode ser utilizada como vemos no resultado do comando a sequir que coincide com os obtidos anteriormente.

  > t.test(tempo)

   One Sample t-test
  
  data:  tempo
  t = 21.3048, df = 19, p-value = 1.006e-14
  alternative hypothesis: true mean is not equal to 0
  95 percent confidence interval:
   4.278843 5.211157
  sample estimates:
  mean of x
      4.745

15.2 Exercícios

Em cada um dos exercícios abaixo tente obter os intervalos das três formas mostradas acima.

1.
Pretende-se estimar a proporção p de cura, através de uso de um certo medicamento em doentes contaminados com cercária, que é uma das formas do verme da esquitosomose. Um experimento consistiu em aplicar o medicamento em 200 pacientes, escolhidos ao acaso, e observar que 160 deles foram curados. Montar o intervalo de confiança para a proporção de curados.
Note que há duas expressões possíveis para este IC: o “otimista”e o “conservativo”. Encontre ambos intervalos.
2.
Os dados abaixo são uma amostra aleatória da distribuição Bernoulli(p). Obter IC’s a 90% e 99%.

0 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1

3.
Encontre intervalos de confiança de 95% para a média de uma distribuição Normal com variância 1 dada a amostra abaixo

9.5 10.8 9.3 10.7 10.9 10.5 10.7 9.0 11.0 8.4
10.9 9.8 11.4 10.6 9.2 9.7 8.3 10.8 9.8 9.0

4.
Queremos verificar se duas máquinas produzem peças com a mesma homogeneidade quanto a resistência à tensão. Para isso, sorteamos dias amostras de 6 peças de cada máquina, e obtivemos as seguintes resistências:

Máquina A145127136142141137







Máquina B 143128132138142132

Obtenha intervalos de confiança para a razão das variâncias e para a diferença das médias dos dois grupos.