Nesta sessão vamos verificar como utilizar o R para obter intervalos de confiança para parâmetros de distribuições de probabilidade.
Para fins didáticos mostrando os recursos do R vamos mostrar três possíveis soluções:
Considere o seguinte problema:
Exemplo
O tempo de
reação de um novo medicamento pode ser considerado como tendo
distribuição Normal e deseja-se fazer inferência sobre a média que é
desconhecida obtendo um intervalo de confiança.
Vinte pacientes foram sorteados e tiveram seu tempo de reação
anotado.
Os dados foram os seguintes (em minutos):
2.9 | 3.4 | 3.5 | 4.1 | 4.6 | 4.7 | 4.5 | 3.8 | 5.3 | 4.9 |
4.8 | 5.7 | 5.8 | 5.0 | 3.4 | 5.9 | 6.3 | 4.6 | 5.5 | 6.2 |
Entramos com os dados com o comando
> tempo <- c(2.9, 3.4, 3.5, 4.1, 4.6, 4.7, 4.5, 3.8, 5.3, 4.9, 4.8, 5.7, 5.8, 5.0, 3.4, 5.9, 6.3, 4.6, 5.5, 6.2)
Sabemos que o intervalo de confiança para média de uma distribuição normal com variância desconhecida, para uma amostra de tamanho é dado por:
Vamos agora obter a resposta das três formas diferentes mencionadas acima.
> n <- length(tempo) > n [1] 20 > t.m <- mean(tempo) > t.m [1] 4.745 > t.v <- var(tempo) > t.v [1] 0.992079A seguir montamos o intervalo utilizando os quantis da distribuição , para obter um IC a 95% de confiança.
> t.ic <- t.m + qt(c(0.025, 0.975), df = n-1) * sqrt(t.v/length(tempo)) > t.ic [1] 4.278843 5.211157
> ic.m <- function(x, conf = 0.95){ + n <- length(x) + media <- mean(x) + variancia <- var(x) + quantis <- qt(c((1-conf)/2, 1 - (1-conf)/2), df = n-1) + ic <- media + quantis * sqrt(variancia/n) + return(ic) + } > ic.m(tempo) [1] 4.278843 5.211157 > ic.m(tempo, conf=0.99) [1] 4.107814 5.382186
Escrever uma função é particularmente útil quando um procedimento vai ser utilizados várias vezes.
Mostramos as soluções acima para ilustrar a flexibilidade e o uso do programa.
Entretanto não precisamos fazer isto na maioria das vezes porque o R já vem com várias funções para procedimentos estatísticos já escritas.
Neste caso a função t.test
pode ser utilizada como vemos no resultado do comando a sequir que coincide com os obtidos anteriormente.
> t.test(tempo) One Sample t-test data: tempo t = 21.3048, df = 19, p-value = 1.006e-14 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 4.278843 5.211157 sample estimates: mean of x 4.745
Em cada um dos exercícios abaixo tente obter os intervalos das três formas mostradas acima.
Máquina A | 145 | 127 | 136 | 142 | 141 | 137 |
Máquina B | 143 | 128 | 132 | 138 | 142 | 132 |
Obtenha intervalos de confiança para a razão das variâncias e para a diferença das médias dos dois grupos.