Subsections

10 Intervalos de confiança - I

Nesta sessão vamos verificar como utilizar o R para obter intervalos de confiança para parâmetros de distribuições de probabilidade.

Para fins didáticos mostrando os recursos do R vamos mostrar três possíveis soluções:

fazendo as contas passo a passo, utilizando o R como uma calculadora
escrevendo uma função
usando uma função já existente no R

10.1 Média de uma distribuição normal com variância desconhecida

Considere o seguinte problema:

Exemplo
O tempo de reação de um novo medicamento pode ser considerado como tendo distribuição Normal e deseja-se fazer inferência sobre a média que é desconhecida obtendo um intervalo de confiança. Vinte pacientes foram sorteados e tiveram seu tempo de reação anotado. Os dados foram os seguintes (em minutos):

2.9	3.4	3.5	4.1	4.6	4.7	4.5	3.8	5.3	4.9
4.8	5.7	5.8	5.0	3.4	5.9	6.3	4.6	5.5	6.2

Entramos com os dados com o comando

> tempo <- c(2.9, 3.4, 3.5, 4.1, 4.6, 4.7, 4.5, 3.8, 5.3, 4.9,
            4.8, 5.7, 5.8, 5.0, 3.4, 5.9, 6.3, 4.6, 5.5, 6.2)

Sabemos que o intervalo de confiança para média de uma distribuição normal com variância desconhecida, para uma amostra de tamanho é dado por:

$\begin{displaymath}\left(\bar{x} - t_t \sqrt{\frac{S^2}{n}}\;\;\;,\;\;\; \bar{x} + t_t \sqrt{\frac{S^2}{n}} \right) \end{displaymath}$

onde

é o quantil de ordem $1-\alpha/2$ da distribuição

de Student, com

graus de liberdade.

Vamos agora obter a resposta das três formas diferentes mencionadas acima.

10.1.1 Fazendo as contas passo a passo

Nos comandos a seguir calculamos o tamanho da amostra, a média e a variância amostral.

> n <- length(tempo)
> n
[1] 20 
> t.m <- mean(tempo)
> t.m
[1] 4.745
> t.v <- var(tempo)
> t.v
[1] 0.992079

A seguir montamos o intervalo utilizando os quantis da distribuição

, para obter um IC a 95% de confiança.

> t.ic <- t.m + qt(c(0.025, 0.975), df = n-1) * sqrt(t.v/length(tempo))
> t.ic
[1] 4.278843 5.211157

10.1.2 Escrevendo uma função

Podemos generalizar a solução acima agrupando os comandos em uma função. Nos comandos primeiro definimos a função e a seguir utilizamos a função criada definindo intervalos a 95% e 99%.

> ic.m <- function(x, conf = 0.95){
+   n <- length(x)
+   media <- mean(x)
+   variancia <- var(x)
+   quantis <- qt(c((1-conf)/2, 1 - (1-conf)/2), df = n-1)
+   ic <- media + quantis * sqrt(variancia/n)
+   return(ic)
+ }
> ic.m(tempo)
[1] 4.278843 5.211157

> ic.m(tempo, conf=0.99)
[1] 4.107814 5.382186

Escrever uma função é particularmente útil quando um procedimento vai ser utilizados várias vezes.

10.1.3 Usando a função `t.test`

Mostramos as soluções acima para ilustrar a flexibilidade e o uso do programa. Entretanto não precisamos fazer isto na maioria das vezes porque o R já vem com várias funções para procedimentos estatísticos já escritas. Neste caso a função t.test pode ser utilizada como vemos no resultado do comando a sequir que coincide com os obtidos anteriormente.

> t.test(tempo)

        One Sample t-test

data:  tempo
t = 21.3048, df = 19, p-value = 1.006e-14
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 4.278843 5.211157
sample estimates:
mean of x
    4.745

10.2 Exercícios

Em cada um dos exercícios abaixo tente obter os intervalos das três formas mostradas acima.

Pretende-se estimar a proporção p de cura, através de uso de um certo medicamento em doentes contaminados com cercária, que é uma das formas do verme da esquitosomose. Um experimento consistiu em aplicar o medicamento em 200 pacientes, escolhidos ao acaso, e observar que 160 deles foram curados. Montar o intervalo de confiança para a proporção de curados.
Note que há duas expressões possíveis para este IC: o ``otimista''e o ``conservativo''. Encontre ambos intervalos.
Os dados abaixo são uma amostra aleatória da distribuição . Obter IC's a 90% e 99%.
0 0 0 1 1 0 1 1 1 1 0 1 1 0 1 1 1 1 0 1 1 1 1 1 1
Encontre intervalos de confiança de 95% para a média de uma distribuição Normal com variância 1 dada a amostra abaixo
9.5 10.8 9.3 10.7 10.9 10.5 10.7 9.0 11.0 8.4 10.9 9.8 11.4 10.6 9.2 9.7 8.3 10.8 9.8 9.0
Queremos verificar se duas máquinas produzem peças com a mesma homogeneidade quanto a resistência à tensão. Para isso, sorteamos dias amostras de 6 peças de cada máquina, e obtivemos as seguintes resistências:

Máquina A 145 127 136 142 141 137

Máquina B 143 128 132 138 142 132

Obtenha intervalos de confiança para a razão das variâncias e para a diferença das médias dos dois grupos.

Paulo Justiniano Ribeiro Jr

2.9	3.4	3.5	4.1	4.6	4.7	4.5	3.8	5.3	4.9
4.8	5.7	5.8	5.0	3.4	5.9	6.3	4.6	5.5	6.2

Máquina A	145	127	136	142	141	137
Máquina B	143	128	132	138	142	132

2.9	3.4	3.5	4.1	4.6	4.7	4.5	3.8	5.3	4.9
4.8	5.7	5.8	5.0	3.4	5.9	6.3	4.6	5.5	6.2