Essa é uma revisão anterior do documento!
Tabela de conteúdos
Métodos estatísticos aplicados no monitoramento de ovos do mosquito Aedes aegypti
Relatório de análise estatística, apresentado à disciplina de Laboratório I, do curso de Bacharelado em Estatística, do Setor de Ciências Exatas da Universidade Federal do Paraná.
Orientador: Prof. Ricardo Sander Ehlers.
Co-Orientador: Prof. Paulo Justiniano Ribeiro Jr.
Introdução
A degradação do meio ambiente e os problemas sócio-culturais no Brasil afetam o cenário epidemiológico urbano brasileiro, levando-o a ser destaque na mídia nacional e internacional, decorrente de epidemias de dengue, leptospirose, a recorrência de tuberculose, entre outras.
Diante dessa realidade constatou-se que é de fundamental importância criar métodos capazes de detectar precocemente o número de casos que caracterizam surtos epidêmicos, modelar e identificar fatores de risco e de proteção nas situações endêmicas e epidêmicas.
Nesta perspectiva foi elaborado o Projeto SAUDAVEL ( Sistema de Apoio Unificado para Detecção e Acompanhamento em Vigilância Epidemiológica), o qual pretende contribuir para aumentar a capacidade do setor de saúde no controle de doenças transmissíveis, demonstrando ser necessário desenvolver novos instrumentos para a prática da vigilância epidemiológica, incorporando aspectos ambientais, identificadores de risco e métodos automáticos e semi-automáticos, que permitam a detecção de surtos e seu acompanhamento no espaço e no tempo.
A página deste relatório encontra-se dividido em 5 seções. A primeira busca dar uma visão ao leitor sobre o projeto SAUDAVEL, a segunda apresenta os objetivos gerais e específicos, a terceira apresenta os procedimentos metodológicos sendo que esta foi dividida em duas partes, uma primeira que trata da área de estudo e dos instrumentos e técnicas de campo como também os aspectos computacionais envolvidos no projeto, a segunda trata propriamente das metodologias estatísticas. A quarta apresenta sintéticamente os resultados e a quinta e última apresenta as principais conclusões e algumas recomendações.
Objetivos
O objetivo principal deste trabalho é desenvolver um procedimento para a visualização espaço-temporal dos dados do experimento de coleta de ovos do mosquito Aedes aegypti que está sendo desenvolvido pelo projeto SAUDAVEL na cidade de Recife-PE. Para isto, optou-se por uma resolução de análise por bairros, visando interpolar uma superfície com base nas amostras coletadas. Para atender a este propósito buscou-se na literatura, métodos para a interpolação de superfícies, dois destes métodos são descritos a saber Regressão Local e Superfície de Tendência.
Além disto, também buscou-se demonstrar a utilidade de softwares desenvolvidos pelos grupos integrantes do projeto SAUDAVEL, dando enfâse ao aRT-API R-TerraLib1)[RIBEIRO Jr.,2004] desenvolvido pelo LEG - Laboratório de Estatística e Geoinformação da Universidade Federal do Paraná.
Procedimentos metodológicos
Nesta seção serão descritos o experimento, métodos de coleta de dados, e a metodologia estatística utilizada.
Área de estudo, Instrumentos e Técnicas de Campo
O experimento está sendo desenvolvido na cidade de Recife/PE onde foram criteriosamente instaladas 564 armadilhas para o mosquito Aedes aegypti cuja a femêa é o principal vetor da Dengue. Estas armadilhas estão sendo monitoradas a partir de 03/2004, cerca de um quarto das armadilhas são monitoradas a cada 7 dias, assim em um ciclo de 28 dias todas as armadilhas são monitoradas, o experimento foi realizado em 5 dos 94 bairros da cidade de Recife.
A rede de armadilhas foi instalada de modo a cobrir toda a extensão do bairro, caracterizando bem o tipo de delineamento utilizado para a coleta de dados, até a data de 12/2006 foram realizadas 17.668 coletas, com as quais foram contados ao todo 13.628.909 ovos do mosquito Aedes aegypti.
Uma parte importante em projetos desta magnitude, é a forma de armazenamento, tratamento e visualização dos dados, já que um experimento como este gera uma grande quantidade de dados que não são facilmente manipuláveis, requerendo-se para isto ferramentas específicas.
Neste experimento cada armadilha contém uma lâmina na qual a fêmea do mosquito coloca os ovos, essas lâminas são recolhidas e a contagem dos ovos é feita em laboratório especializado. Os dados são inseridos em um banco de dados através de uma interface Web que foi desenvolvida pelo INPE-Instituto Nacional de Pesquisas Espaciais e CPqAM (Centro de pesquisas Aggeu Magalhães), esta interface foi projetada para evitar formas complexas de entrada de dados e fornecer algumas medidas espaço temporais rápidas.
Os serviços de saúde locais e o laboratório de Entomologia são os coordenadores operacionais e logísticos, e responsáveis pela realização do experimento[VIEIRA,2006].
O banco de dados do Recife SAUDAVEL, está implementado em TerraLib tecnologia de código aberto light-DBMS, e MySql Database Sever 2), como um repositório e sistema gerenciador de dados espaço-temporais, baseado no modelo espaço-temporal da TerraLIb [Silveira,2004]. O banco de dados original do SAUDAVEL Recife fica no INPE e um backup é feito pelo LEG-Laboratório de Estatística e Geoinformação da UFPR.
O LEG tem particular importância para o experimento de Recife, já que ele é o responsável por coordenar e implementar os modelos estatísticos. O LEG também é responsável por desenvolver tecnologias de integração entre a biblioteca TerraLib e um ambiente de computação e modelagem estatística, o projeto R[R Development Core Team,2007]. Neste sentido vem sendo desenvolvido o pacote aRT.
A figura 1 ilustra o formato geral da análise. Após a equipe de campo coletar as lâminas e estas serem analisadas pelo laboratório especializado, os dados entram no banco através da interface Web e ficam armanenados no banco de dados geográficos, construído sobre a plataforma TerraLib com o MySql Server Database. Isto feito, pode-se acessar o banco via aRT, assim todas as análises estatísticas são realizadas em um ambiente próprio no caso o R. Após as análises serem concluídas tem-se através do aRT, a opção de retornar os dados para o banco geográfico, podendo ser acessado por um visualizador de SIG(Sistema de Informação Geográfica) como é o caso do TerraView3), ou então gerar uma página Web para a visualização pública dos resultados.
De maneira ampla pode-se resumir o procedimento para a visualização espaço-temporal do fenômeno após a coleta e entrada dos dados no banco, pelos seguintes passos:
- Ler o banco geográfico através do aRT.
- Estimar uma superfície para cada semana do experimento através dos métodos descritos na seção seguinte.
- Interpolar 7 imagens entre cada superfície estimada.
- Gerar um arquivo do tipo .avi para a visualização das imagens através do software mencoder contido no Mplayer para Linux.
- Disponibilizar o arquivo .avi em uma página na Web para visualização.
Metodologia Estatística
De forma geral, os dados estão disponíveis na forma de amostras pontuais do processo e para utilizá-las de forma efetiva necessita-se de um procedimento de interpolação, para gerar uma superfície que represente o fenômeno em toda a área. Na literatura de estatística espacial este tipo de procedimento é comumente chamado de análise de superfície.
Para gerar uma superfície que aproxime o fenômeno em estudo de forma realista, é necessário modelar sua estrutura de covariância espacial. De uma forma ampla pode-se considerar três tipos de abordagem para este propósito, conforme [Druck,2004] .
- Modelos determinísticos de efeitos locais; cada ponto da superfície é estimado com base apenas na interpolação dos valores das amostras mais próximas. A suposição implícita é que predominam apenas os efeitos puramente locais.
- Modelos determinísticos de efeitos globais; a suposição implícita, nesta classe de interpoladores, é de que, para a caracterização do fenômeno, predomina a variação em larga escala, este é o caso dos interpoladores por superfície de tendência.
- Modelos estatísticos de efeitos globais e locais (Krigagem); cada ponto da superfície é estimado apenas tendo como fundamento a interpolação dos valores das amostras mais próximas, utilizando um estimador estatístico.
A primeira será explicada aqui levando em consideração uma forma mais ampla de considerar os efeitos espaciais de forma local, representada pela Regressão Polinomial Local considerada neste trabalho mais eficiente que os estimadores de kernel tradicionais, a segunda será considerada pelos interpoladores de superfície de tendência e a terceira não será considerada neste trabalho, para maiores informações ver [DIGGLE,2007].
Resultados
O primeiro método utilizado para gerar a superfície foi a Regressão Local, como descrito na metodologia para a aplicação deste método necessita-se fazer três escolhas: o parâmetro de suavização span ou bandwidth, grau do polinômio local e a função de suavização ou Kernel.
O span foi definido como 0.75 como é default em vários pacotes estatísticos, para o grau do polinômio local foi definido como 2 e a função de suavização utilizada foi a tri-cúbica.
As superfícies interpoladas foram suaves e aproximam o fenômeno em estudo, um cuidado especial também foi tomado decorrente dos dados serem provenientes de uma contagem, esses foram reexpresso pelo seu logaritmo, sendo que onde as contagens eram iguais a zero foi adicionado uma unidade.
As superfícies foram geradas semanalmente, para cada um dos 5 bairros que compõe o experimento em Recife, gerando até 160 imagens dependendo do número de observações feitas em cada bairro, essas imagens foram animadas utilizando uma interpolação pixel a pixel, sendo que entre duas superfície estimadas foram interpoladas 7 uma para cada dia da semana.Abaixo são apresentadas as cinco animações correspondentes a cada um dos bairros que fazem parte do experimento.
O segundo método utilizado busca mostrar efeitos globais de tendências no espaço, a superfície foi interpolada utilizando uma regressão polinomial de segunda ordem, onde a contagem de ovos do mosquito reexpressa pelo seu logaritmo foi a variável resposta e as coordenadas de cada armadilha as regressoras do modelo.
As superfícies para este método mostram-se menos suaves e variações abruptas ocorrem em determinados pontos no tempo, somente um procedimento visual é capaz de verificar tais variações. Também para este método abaixo são apresentadas as animações correspondentes a cada um dos cinco bairros que fazem parte do experimento.
Para ambos os métodos a escala de cores utilizada é conhecida como terrain colors, nesta escala valores altos da variável resposta, número de ovos do mosquito, são representados por cores claras sendo o valor mais alto pela cor branca, no outro extremo, valores baixo da variável resposta são expressos por tons de verde.
O procedimento aqui proposto, buscou definir uma resolução de análises por bairro estimando uma superfície que mostra a intensidade com que ovos do mosquito Aedes aegypti são capturados pelas armadilhas, este procedimento visa um monitoramento através de uma análise dinâmica, ou seja, instantânea a partir da chegada dos dados a superfície pode ser estimada e definido um certo nível de tolerância para a intensidade de ovos, ser emitido um sinal de aviso ou mesmo um sinal para intervenção, por exemplo, quando o número de ovos ultrapassar um certo nível considerado como aceitável.
Conclusões / Recomendações
A visualização de dados espaço-temporal é algo recente na estatística e portanto, pouco se tem de ferramentas exploratória para dados desta natureza. O intuito de uma análise exploratória é dar subsídios para o estatístico buscar modelos que se adequem aos dados, dando a ele a visualização de como o fenômeno se desenvolveu tanto no espaço como no tempo.
Para o caso do experimento de contagens de ovos do mosquito Aedes aegypti na cidade de Recife/PE, o procedimento mostrou-se satisfatório, gerando uma visualização espaço-temporal do experimento, evidenciando picos e tendências espaciais e mostrando a evolução do fenômeno em toda a área, dando a possibilidade de ver os dados, coisa que não é nada fácil em um experimento desta magnitude. Também possibilita um monitoramento, da intensidade de ovos do mosquito em toda a área com base em amostras pontuais do fenômeno, sendo que podem ser definidos sinais de aviso quando por exemplo a intensidade de ovos capturados for muito superior ao padrão considerado normal.
Com este trabalho também é possível verificar as potencialidades da integração entre os Sistemas de Informações Geográficas (SIG's) e ambientes estatísticos como R, onde através do aRT o ambiente estatístico ganha as potencialidades do SIG agregada ao potencial de análise estatística próprios destes ambientes, não antes disponível em um único ambiente integrado.
Além disso esta análise preliminar busca dar subsídios para um modelo espaço-temporal, o qual pretende contribuir para aumentar a capacidade do setor de saúde no controle de doenças transmissíveis como a Dengue.
Uma limitação do procedimento proposto é a escala dos dados já que dados em diferentes pontos no tempo apresentaram valores bastante diferentes, sendo dificil a geração de uma única animação com escalas variadas do processo, além disso, a presença de pontos discrepantes tendem a deixar a escala de visualização distorcida escondendo variações em pequenas escalas.
Deixa-se aqui como futuras agendas de pesquisa para o projeto SAUDAVEL Recife, incorporar nas superfícies estimadas outras possíveis covariáveis como condições climáticas, e defasagens temporais da variável resposta. Métodos mais flexíveis que não assumam formas lineares como os estimadores de superfície de tendência e não sejam dependentes de um raio span de influência como a Regressão Local. Além disso, a definição de limites de controle para efetuar o monitoramento e até mesmo intervenção, afim de manter a população de mosquitos em um nível que não traga risco a população de ser infectada pela Dengue.
Referências Bibliográficas
- [2007, manual | www]
- R Development Core Team. (2007). R: A Language and Environment for Statistical Computing Vienna, Austria.
- [2004, book]
- Druck, S., Carvalho, M. Sá., Câmara, G., & Monteiro, A. M. V. (2004). Análise Espacial de Dados Geográficos. Brasília: Embrapa.
- [2007, book]
- Diggle, P. J., & Ribeiro Jr, P. J. (2007). Model-based Geostatistics. Brasília: Springer Verlag.
- [2006, article]
- VIEIRA, M. A. M., CARAVALHO, M. SÁ., ASSUNÇÃO, R., VIEIRA, W., RIBEIRO Jr, P. J., Jr, C. D., & REGIS, L. (2006). SAUDAVEL: Bridging the Gap between Research and Services in Public Health Operational Programs by Multi - Institutional Networking Development and Use of Spatial Infromation Technology Innovative Tools.
- [2004, article]
- de Andrade Neto, P. R., Carrero, M. A., de Mello, T. E. B., & Ribeiro Jr, P. J. (2004). Integration of Geographic Information Systems and Statistical Computing: the TerraLib/R Case. V Simpósio Brasileiro de Geoinformática.
Anexos
Monitoramento de ovos de Aedes em Recife
Texto completo apresentado à disciplina. labitextofinal1.pdf
Apresentação ap1.pdf
Dependências para a visualização dos filmes
A visualização dos filmes depende do Mplayer para Linux disponível para download gratuito na página www.mplayer.com.
Para a visualização no Windows Xp deve ser instalado K Lite Codec Pack disponível para download gratuito na página http://www.free-codecs.com/download/K_Lite_Codec_Pack.htm .
Agradecimentos
Oswaldo Cruz por disponibilizar a função Kfade, responsável pela criação das animações.
FIOCRUZ Recife/PE e equipe do SAUDAVEL por dispor os dados.
LEG pela cessão dos recursos computacionais necessários a este projeto.
Autor
Wagner Hugo Bonat