MCIE - Métodos Computacionais para Inferência Estatística

1 Modelo multinomial com efeitos aleatórios

Considere uma variável aleatória com distribuição multinomial com três categorias. Neste caso a função de probabilidade é dada por

\[ P(X = x) = \frac{n!}{x_1! x_2! x_3!} p_1^{x_1} p_2^{x_2} p_3^{x_3}, \quad \text{sendo que} \quad \sum_{i=1}^3 p_i = 1. \]

Considere a situação com um único ensaio, realizado em \(n\) indivíduos independentes. Para todos os itens simule variáveis aleatórias de acordo com o modelo proposto.

  1. Encontre o estimador de máxima verossimilhança para \(p_1\), \(p_2\) e \(p_3\). Forneça ao menos dois intervalos de confiança.
  2. Considere agora que para cada indivíduo um conjunto de duas covariáveis \(x1\) e \(x_2\) esteja disponíveis (crie como achar mais conveniente). Proponha um modelo de regressão para dados multinomiais.
  3. Implemente a estimação por máxima verossimilhança (pontual, intervalar e teste de hipóteses) para o modelo proposto em (b).
  4. Faça um estudo de simulação para avaliar a distribuição dos estimadores de maxima verossimilhança para os coeficientes de regressão.
  5. Avalie a taxa de cobertura dos intervalos Wald e deviance para cada um dos parâmetros de regressão.
  6. Considere agora que mais de uma observação é realizada no mesmo individuo. Proponha um modelo com efeitos aleatórios para levar em conta as múltiplas observações no mesmo individuo. Use a distribuição normal bivariada para modelar os efeitos aleatórios.
  7. Para o modelo proposto em (f) implemente a estimação por máxima verossimilhança, obtenha intervalos de confiança usando resultados assintóticos.
  8. Para a implementação em (g) obtenha o perfil de verossimilhança para os parâmetros que indexam a distribuição do efeito aleatório.

2 Modelo unit gamma com efeitos aleatórios

Considere uma variável aleatória com distribuição unit gamma, ou seja, sua função densidade probabilidade é dada por

\[ f(y|\alpha, \beta) = \frac{\beta^{\alpha}}{\Gamma(\alpha)} y^{\beta-1} (-\log(y))^{\alpha -1} \] onde \(0 < y < 1\) e \(\alpha, \beta > 0\).

  1. Encontre o estimador de máxima verossimilhança para \(\alpha\) e \(\beta\). Forneça ao menos dois intervalos de confiança.
  2. Procure por uma parametrização adequada e proponha um modelo de regressão adequado baseado nesta distribuição.
  3. Implemente a estimação por máxima verossimilhança (pontual, intervalar e teste de hipóteses) para o modelo proposto em (b).
  4. Faça um estudo de simulação para avaliar a distribuição dos estimadores de maxima verossimilhança para os coeficientes de regressão.
  5. Avalie a taxa de cobertura dos intervalos Wald e deviance para cada um dos parâmetros de regressão e dispersão.
  6. Considere agora que mais de uma observação é realizada no mesmo individuo. Proponha um modelo com efeitos aleatórios para levar em conta as múltiplas observações no mesmo individuo. Use a distribuição normal para modelar os efeitos aleatórios.
  7. Para o modelo proposto em (f) implemente a estimação por máxima verossimilhança, obtenha intervalos de confiança usando resultados assintóticos.
  8. Para a implementação em (g) obtenha o perfil de verossimilhança para o parâmetro que indexa a distribuição do efeito aleatório.

3 Modelos de regressão para contagens censuradas

Considere uma variável aleatória com distribuição Poisson cujas observações são medidas com censura a esquerda, direita ou intervalar.

  1. Proponha um modelo para lidar com esta situação.
  2. Implemente a estimação por máxima verossimilhança (pontual, intervalar e teste de hipóteses) para o modelo proposto em (a).
  3. Suponha que um conjunto de covariáveis \(x_1\) e \(x_2\) esteja disponível. Proponha um modelo de regressão baseado no modelo proposto em (a).
  4. Implemente a estimação por máxima verossimilhança para o modelo proposto em (c).
  5. Faça um estudo de simulação para avaliar a distribuição dos estimadores de maxima verossimilhança para os coeficientes de regressão.
  6. Avalie a taxa de cobertura dos intervalos Wald e deviance para cada um dos parâmetros de regressão e dispersão.
  7. Esboce a implementação de uma função genérica (estilo glm) para estimação do modelo proposto em (a) e (c).
  8. Deixe disponível em sua implementação a obtenção de intervalos baseados em verossimilhança perfilhada.

4 Modelo t-Multivariado para dados espaciais

Considere um vetor aleatório de tamanho \(n\) de uma distribuição t-Multivariada, conforme implementado no pacote mvtnorm do R.

  1. Baseado na distribuição t-Multivariada proponha um modelo alternativo ao modelo geostatístico apresentado no Capítulo 4 do material do SINAPE.
  2. Implemente a estimação por máxima verossimilhança dos parâmetros envolvidos no modelo em (a).
  3. Faça um estudo de simulação para avaliar a distribuição dos estimadores de maxima verossimilhança do modelo proposto em (a).
  4. Avalie a taxa de cobertura dos intervalos Wald e deviance para cada um dos parâmetros do modelo.
  5. Obtenha os perfis de verossimilhança para os parâmetros do modelo proposto.

5 Modelo INAR(1)

Considere uma série temporal de dados de contagens. Um modelo popular para esta situação é o modelo INAR(p), veja por exemplo (https://www.tandfonline.com/doi/full/10.1080/01621459.2014.983230]).

  1. Considere um especificação particular onde \(p = 1\), ou seja, AR(1) e a distribuição Poisson é assumida para o processo. Escreva o modelo neste caso e identifique o parâmetro.
  2. Explique com detalhes com simular realizações deste modelo.
  3. Implemente a estimação por máxima verossimilhança do modelo em (a).
  4. Faça um estudo de simulação para avaliar a distribuição dos estimadores de maxima verossimilhança do modelo proposto em (a).
  5. Avalie a taxa de cobertura dos intervalos Wald e deviance para cada um dos parâmetros do modelo.
  6. Obtenha os perfis de verossimilhança para os parâmetros do modelo.
25px