A função de verossimilhança é central na inferência estatística. Nesta sessão vamos ver como traçar gráficos de funções de verossimilhança de um parâmetro utilizando o programa R. Também veremos como traçar a função deviance, obtida a partir da função de verossimilhança e conveniente em certos casos para representações gráficas, cálculos e inferências.
Seja L(θ; y) a função de verossimilhança. A notação indica que o argumento da função é θ que pode ser um escalar ou um vetor de parâmetros. Nesta sessão consideraremos que é um escalar. O termo y denota valores realizados de uma variável aleatória Y , isto é os valores obtidos em uma amostra.
O valor que maximiza L(θ; y) é chamado do estimador de máxima verossimilhança e denotado por . A função de verossimilhança relativa ou normatizada R(θ; y) é dada pela razão entre a função de verossimilhança e o valor maximizado desta função, portanto R(θ; y) = L(θ; y)∕L( ; y), assumindo valores no intervalo [0, 1]. Esta função é útil para comparar todos dos modelos dados pelos diferentes valores de θ com o modelo mais plausível (verossível) para a amostra obtida.
O valor que maximiza a função de verossimilhança é também o que maximiza a a função obtida pelo logarítimo da função de verossimilhança, chamada função de log-verossimilhança, uma vez que a função logarítimo é uma função monotônica. Denotamos a função de log-verossimilhança por l(θ; y) sendo l(θ; y) = log(L(θ; y)). A função de log-verossimilhança é mais adequada para cálculos computacionais e permite que modelos possam ser comparados aditivamente, ao invés de multiplicativamente.
Aplicando-se o logarítimo à função padronizada obtemos log{R(θ; y)} = l(θ; y) - l( ; y), que tem portanto um valor sempre não-positivo. Desta forma esta função pode ser multiplicada por um número negativo arbitrário, e sendo este número -2 obtemos a chamada função deviance, D(θ; y) = -2, onde lembramos que é o estimador de máxima verossimilhança de θ. Esta função tem portanto o seu mínimo em zero e quanto maior o seu valor, maior a diferença de plausibilidade entre o modelo considerado e o modelo mais plausível para os dados obtidos na amostra. Esta função combina as vantagens da verossimilhança relativa e da log-verossimilhança sendo portanto conveniente para cálculos computacionais e inferência.
Seja o vetor (12, 15, 9, 10, 17, 12, 11, 18, 15, 13) uma amostra aleatória de uma distribuição normal de média μ e variância conhecida e igual a 4. O objetivo é fazer um gráfico da função de log-verossimilhança.
Solução:
Vejamos primeiro os passos da solução analítica:
Vamos ver agora uma primeira possível forma de fazer a função de verossimilhança no R.
|
Entretanto podemos obter a função de verossimilhança no R de outras forma mais geral e menos trabalhosa. Sabemos que a função dnorm() calcula a densidade f(x) da distribuição normal e podemos usar este fato para evitar a digitação da expressão acima.
Note na sintaxe acima que a função sapply aplica a função logvero anteriormente definida em cada elemento do vetor mu.vals.
Para encerrar este exemplo vamos apresentar uma solução ainda mais genérica que consiste em criar uma função que vamos chamar de vero.norm.v4 para cálculo da verossimilhança de distribuições normais com σ2 =4. Esta função engloba os comandos acima e pode ser utilizada para obter o gráfico da log-verossimilhança para o parâmetro μ para qualquer amostra obtida desta distribuição.
Considere agora a amostra armazenada no vetor y:
de uma distribuição de Poisson de parâmetro λ. A função de verossimilhança pode ser definida por:
E podemos usar esta função para fazer o gráfico da função de verossimilhança como visto à esquerda da Figura 39
E o comando para gerar o gráfico poderia incluir o texto do eixos:
ou simplesmente usar:
Alternativamente pode-se fazer um gráfico da função deviance, como nos comandos abaixo.
Ou fazendo novamente em um intervalo menor
|
O estimador de máxima verossimilhança é o valor que maximiza a função de verossimilhança que é o mesmo que minimiza a função deviance. Neste caso sabemos que o estimador tem expressão analítica fechada λ = e portanto calculado com o comando.
Caso o estimador não tenha expressão fechada pode-se usar maximização (ou minimização) numérica. Para ilustrar isto vamos encontrar a estimativa do parâmetro da Poisson e verificar que o valor obtido coincide com o valor dado pela expressão fechada do estimador. Usamos o função optimise() para encontrar o ponto de mínimo da função deviance.
A função optimise() é adequada para minimizações envolvendo um único parâmetro. Para dois ou mais parâmetros deve-se usar a função optim() ou nlminb().
Finalmente os comandos abaixo são usados para obter graficamente o intervalo de confiança (a 95%) baseado na deviance.
Os limites (aproximados) do IC podem ser obtidos da forma:
E adicionados ao gráfico com
Vamos agora revisitar o Exemplo 1 desta seção, usando os mesmos dados porém agora sem assumir que a variância é conhecida. Portanto temos agora dois parâmetros sobre os quais queremos fazer inferência: μ e σ . O objetivo é fazer um gráfico 3-D da função de log-verossimilhança de dois argumentos l(μ, σ).
Solução:
Vejamos primeiro os passos da solução analítica:
Assim como no Exemplo 1 poderíamos calcular a verossimilhança fazendo as contas "passo a passo"da função acima, ou então usando a função dnorm(). Neste exemplo vamos fazer apenas da segunda forma, ficando a primeira como exercício para o leitor.
Note na sintaxe acima que a função apply aplica a função logveroN a cada par de valores em cada linha de par.vals. Ao final o objeto |par.vals| contém na terceira coluna os valores da log-verossimilhança correspondentes as valores dos parâmetros dados na primeira e segunda colunas.
|
Notas: