8. Monitoramento de convergência e adaptação para algoritmos MCMC


O objetivo deste capítulo é apresentar diferentes métodos de monitoramento ou diagnósticos propostos para verificar a convergência de um algoritmo MCMC ao considerar sua saída e responder à pergunta mais comum sobre MCMC, ou seja, “quando paramos nosso algoritmo MCMC?” Distinguimos aqui entre duas noções separadas de convergência, ou seja, convergência para estacionaridade e convergência de média ergódica, em contraste com configurações iid.

Também discutimos vários tipos de diagnósticos de convergência, principalmente aqueles contidos no pacote coda de Plummer et al. (2006), embora métodos mais precisos possam estar disponíveis em configurações específicas.

Como a avaliação da convergência é uma etapa preliminar na comparação de algoritmos quando vários são considerados; também abordamos neste capítulo final, embora brevemente, algoritmos MCMC adaptativos, apontando os perigos da adaptabilidade básica e discutindo o pacote amcmc desenvolvido por Rosenthal (2007), para uma proposta específica de passeio aleatório adaptativo.



8.1 Introdução

Em cada um dos dois capítulos anteriores, apresentamos os algoritmos MCMC e, embora tenhamos omitido a maioria dos detalhes teóricos, argumentamos que, sob condições bastante gerais, esses algoritmos são convergentes porque as cadeias que produzem são ergódicas. Embora tais desenvolvimentos sejam obviamente necessários como uma validação teórica dos algoritmos MCMC, eles são insuficientes do ponto de vista da implementação dos métodos MCMC.

De fato, as garantias teóricas não nos dizem quando parar esses algoritmos e quando produzir nossas estimativas com confiança suficiente. A configuração ideal seria fornecer marcadores de convergência claros que pudessem ser incluídos em seu programa R para que nenhum processamento sequencial fosse necessário!

Na prática, isso é quase impossível, e várias execuções de seu programa geralmente são necessárias até que você esteja satisfeito com o resultado (ou fique sem tempo e/ou paciência).

Como no Capítulo 4, as técnicas que apresentamos neste capítulo são principalmente empíricas, com dificuldades adicionais porque estamos apenas simulando aproximadamente a partir da densidade do alvo. Estamos principalmente na situação de descrever uma sequência de técnicas incomparáveis com graus amplamente variados de justificação teórica e utilidade, enquanto a avaliação derivada dessas técnicas é parcialmente subjetiva e claramente não infalível.

Historicamente, houve uma enxurrada de trabalhos no final da década de 1990 preocupados com o desenvolvimento de diagnósticos de convergência (ver Robert e Casella, 2004, Capítulo 13), incluindo a construção de um pacote R chamado coda, que discutiremos a seguir. Esta urry agora se acalmou, a principal razão, infelizmente, é que nenhum critério é absoluto. É um pouco ilusório pensar que podemos controlar o fluxo de uma cadeia de Markov e avaliar seu comportamento de convergência com base apenas em algumas (centenas ou milhares ou mesmo milhões) realizações dessa cadeia. Sempre há configurações que, para a maioria das realizações, invalidarão um diagnóstico arbitrário, e a aleatoriedade inerente à natureza do problema impede qualquer garantia categórica de desempenho.