Bruna Melo Guimar˜
aes
Modelagem para Processos
Espa¸
co-Temporais com Ponto de Massa de
Probabilidade no Zero: Um Estudo Sobre a
Dengue
Niter´oi - RJ, Brasil Agosto de 2013
Universidade Federal Fluminense
Bruna Melo Guimar˜
aes
Modelagem para Processos
Espa¸
co-Temporais com Ponto de
Massa de Probabilidade no Zero:
Um Estudo Sobre a Dengue
Trabalho de Conclus˜ao de Curso
Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.
Orientador: Prof. Luis Guillermo Coca Velarde
Niter´oi - RJ, Brasil Agosto de 2013
Universidade Federal Fluminense
Bruna Melo Guimar˜
aes
Modelagem para Processos
Espa¸
co-Temporais com Ponto de Massa de
Probabilidade no Zero: Um Estudo Sobre a
Dengue
Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo
“Mod-elagem para Processos Espa¸co-Temporais com Ponto de Massa
de Probabilidade no Zero: Um Estudo Sobre a Dengue”,
de-fendida por Bruna Melo Guimar˜aes e aprovada em Agosto de
2013, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:
Prof. Dr. Luis Guillermo Coca Velarde Orientador Departamento de Estat´ıstica – UFF
Profa. Dra. Lumilla da Silva Viana Jacobson Departamento de Estat´ıstica – UFF
Prof. Dr. Leonardo Soares Bastos Funda¸c˜ao Oswaldo Cruz – Fiocruz
Guimarães, Bruna Melo
Modelagem para Processos Espaço-Temporais com Ponto de Massa
de Probabilidade no Zero: Um Estudo Sobre a Dengue / Bruna
Melo Guimarães; Luis Guillermo Coca Velarde, orientador. Niterói, 2013.
91 f. : il.
Trabalho de Conclusão de Curso (Graduação em Estatísticaa ) – Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2013.
1. Processo de Poisson. 2. Processos espaço-temporais. 3. Excesso de zeros. 4. Dengue. I. Velarde, Luis Guillermo Coca, orientador. II. Universidade Federal Fluminense. Instituto de Matemática e Estatística. III. Título.
Resumo
A dengue ´e uma doen¸ca viral causada pelo mosquito Aedes aegypti que pode ser de
curso benigno ou grave de acordo com a forma que se apresente. Os principais sintomas s˜ao: febre, cefaleia, dores musculares e articulares. A doen¸ca ´e mais frequente nos meses mais chuvosos. Entretanto, nos meses que n˜ao chove ou chove muito pouco, temos poucas ocorrˆencias de dengue ou at´e mesmo nenhuma, isto ´e, meses em que n˜ao s˜ao observados casos de dengue.
Os dados de casos de dengue dos munic´ıpios do Estado do Rio de Janeiro mostraram diversos meses com nenhum caso da doen¸ca. Este estudo tem como foco principal propor um modelo que considera processos espa¸co-temporais com excesso de zeros. Ser˜ao apre-sentados alguns trabalhos encontrados na literatura que lidam com o problema de excesso de zeros.
Uma das conclus˜oes que se chegou foi que o conjunto de dados de dengue no Estado
do Rio de Janeiro realmente necessita do uso de um modelos espec´ıfico. Notou-se, ent˜ao, que a utiliza¸c˜ao de um modelo que considera dados inflacionados de zero apresenta bons resultados.
Agradecimentos
Agrade¸co em primeiro lugar, a Deus que me iluminou em toda esta longa caminhada. Aos meus pais, Marta e Geremias, irm˜ao, Felipe, e a toda minha fam´ılia que de forma especial e carinhosa me deram for¸ca e coragem.
Ao meu amigo e companheiro Victor Eduardo que sempre acreditou em mim e que me ajudou de todas as formas poss´ıveis.
Aos meus amigos de estudo Juliana, Fabio, Bruno, Evandro e Guilherme que come¸caram
essa caminhada comigo e que me incentivaram `as vezes sem perceberem.
As minhas amigas de sempre Suelen, Taila, Claudiane e Joseane pelo carinho, pelo apoio, pela compreens˜ao e pelas broncas.
Aos professores da UFF que foram t˜ao importantes na minha vida acadˆemica e em
especial ao Prof. Dr. Luis Guillermo Coca Velarde pela paciˆencia na orienta¸c˜ao e incentivo que tornaram poss´ıvel a conclus˜ao desta monografia.
A todos os amigos de curso na UFF que dividiram comigo seus estudos, suas d´uvidas, seus sofrimentos e seus sonhos.
Sum´
ario
Lista de Figuras Lista de Tabelas 1 Introdu¸c˜ao p. 9 1.1 Objetivos . . . p. 12 1.2 Fonte de Dados . . . p. 122 Alguns Modelos para Dados com Excesso de Zero p. 14
2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica . . . p. 14
2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de
Prob-abilidade no Zero . . . p. 17 2.3 Casos de Estudo . . . p. 19
2.3.1 Modelagem para Dados de Violˆencia Dom´estica . . . p. 19
2.3.2 Modelagem para o Estudo de Focas Arrastadas para Fora do Gelo
Glacial no Alaska . . . p. 20
2.3.3 Modelagem de Excesso de Zeros na Captura de Peixes . . . p. 22
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro p. 24
4 Resultados e Discuss˜ao p. 31
4.1 Modelo Proposto . . . p. 31 4.2 Distribui¸c˜oes a Priori dos Parˆametros . . . p. 34 4.3 Estima¸c˜ao dos Parˆametros . . . p. 34 4.4 Compara¸c˜ao dos Modelos e Previs˜ao . . . p. 39
5 Conclus˜ao p. 47
Referˆencias p. 48
Anexo A -- Programa Utilizado para Leitura do Mapa do Estado do Rio
de Janeiro com os N´umero de Casos de Dengue no Mˆes de Janeiro
de 2008 p. 49
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do
Modelo Completo via MCMC p. 51
Anexo C -- Programa em R Utilizado para Estimar os Parˆametros do
Modelo com M´edia Comum via MCMC p. 65
Anexo D -- Programa em R Utilizado para Estimar os Parˆametros do
Lista de Figuras
1 Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Cabo
Frio . . . p. 25
2 Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Mag´e p. 25
3 Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro
entre Janeiro de 2007 a Dezembro de 2011 . . . p. 27
4 Evolu¸c˜ao da Dengue de Janeiro de 2008 a Junho de 2008 no Estado do
Rio de Janeiro . . . p. 29
5 Evolu¸c˜ao da Dengue de Julho de 2008 a Dezembro de 2008 no Estado do
Rio de Janeiro . . . p. 30
6 Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro
entre Janeiro de 2011 a Dezembro de 2011 e os Valores Esperados usando
os Modelos Propostos . . . p. 41
7 Probabilidade de Zero de Janeiro de 2011 a Junho de 2011 . . . p. 42
8 Probabilidade de Zero de Julho de 2011 a Dezembro de 2011 . . . p. 43
9 Valores Esperados para o N´umero de Casos Dengue de Janeiro de 2011
a Junho de 2011 . . . p. 44
10 Valores Esperados para o N´umero de Casos Dengue de Julho de 2011 a
Dezembro de 2011 . . . p. 45
11 Mapas dos Valores Observados e Esperados para o mˆes de Dezembro de
Lista de Tabelas
1 Quantidade de Zeros em cada Munic´ıpio por Ano . . . p. 26
9
1
Introdu¸
c˜
ao
A dengue ´e uma doen¸ca infecciosa febril aguda, epidˆemica ou endˆemica, transmitida pelo mosquito Aedes aegypti e que ocorre principalmente nas ´areas tropicais e subtropicais do mundo, inclusive no Brasil. O Minist´erio da Sa´ude descreve o Aedes aegypti como sendo de cor escura e com listras brancas no corpo todo, entretanto apenas a fˆemea do mosquito
transmite a doen¸ca e costuma picar durante o dia, nas primeiras horas da manh˜a e ao
anoitecer (BRASIL, 2001). O v´ırus da doen¸ca persiste na natureza atrav´es do ciclo homem - mosquito - homem, isto ´e, a fˆemea do mosquito se contamina ao picar um indiv´ıduo
infectado tornando-se capaz de transmitir o v´ırus a outro indiv´ıduo (MINIST´ERIO DA
SA ´UDE, 2005).
O agente da dengue ´e o arbov´ırus do gˆenero Flaviv´ırus que pertence `a fam´ılia Fa-vilidade com quatro sorotipos conhecidos: DEN-1, DEN-2, DEN-3 e DEN-4. A partir da infec¸c˜ao por um deles tem-se imunidade permanente para o mesmo sorotipo.
Geralmente, a dengue ´e uma doen¸ca de evolu¸c˜ao benigna, mas pode evoluir ao ´obito (MARZOCHI 1991). ´E uma doen¸ca de notifica¸c˜ao compuls´oria e tem um grande impacto sobre a sa´ude p´ublica no Brasil. Devido ao n´umero cada vez maior de casos, a dengue tem se manifestado de diferentes formas e gravidades.
A dengue pode ser, ent˜ao, classificada de acordo com sua forma de apresenta¸c˜ao, como:
1. Forma Assintom´atica
N˜ao apresenta sintomas apesar do indiv´ıduo ter sido infectado pelo v´ırus. 2. Dengue Cl´assica (DC)
O quadro cl´ınico inicia-se abruptamente com febre alta (39o a 40oC), cefaleia, dores musculares e articulares, n´auseas e vˆomitos. Podem ocorrer algumas manifesta¸c˜oes hemorr´agicas e dura cerca de 5 a 7 dias.
1 Introdu¸c˜ao 10
Os sintomas s˜ao parecidos com os da DC, com febre intensa (40oa 41oC) que persiste por at´e 7 dias, evoluindo para manifesta¸c˜oes hemorr´agicas.
4. S´ındrome do Choque da Dengue (SCD)
Situa¸c˜ao de importante gravidade que surge, geralmente entre o 3o e o 7o dia de
doen¸ca. O choque ´e consequˆencia do aumento da permeabilidade vascular.
A ocorrˆencia das formas hemorr´agicas da dengue pode ser explicada pela presen¸ca de anticorpos por consequˆencia de infec¸c˜oes por distintos sorotipos do v´ırus. Sendo assim, com a presen¸ca de anticorpos de outros sorotipos, a resposta imunol´ogica do indiv´ıduo seria ampliada na infec¸c˜ao seguinte (BARRETO, 2008).
A dengue ´e mais comum nas grandes cidades, onde existe maior concentra¸c˜ao popula-cional. Os locais prop´ıcios ao desenvolvimento desses mosquitos s˜ao os focos de ac´umulo de ´
agua, principalmente se esta estiver limpa e parada. Segundo o Minist´erio da Sa´ude, 70% dos casos de dengue no nosso pa´ıs ocorrem de Janeiro a Maio, devido a maior ocorrˆencia de chuvas e aumento da temperatura.
Sendo assim, a doen¸ca ´e mais comum nos meses que chove mais que, aqui no Brasil,
s˜ao nas esta¸c˜oes mais quentes. Entretanto, surge o problema dos meses que n˜ao chove ou chove muito pouco e que, por consequˆencia, n˜ao existem casos de dengue. A indaga¸c˜ao que surge ´e como estudar uma doen¸ca cujo n´umero de casos, em diversos meses, ´e igual a zero. Temos, ent˜ao, o problema de excesso de zeros, que ´e a principal motiva¸c˜ao para este estudo.
Este trabalho consiste de um estudo espa¸co-temporal dos casos de dengue nos mu-nic´ıpos do Estado do Rio de Janeiro no per´ıodo de Janeiro de 2007 a Dezembro de
2011. A s´erie mensal do total de casos de dengue em cada munic´ıpio do Estado foi
obtida atrav´es do site do Sistema ´Unico de Sa´ude - DataSUS (Endere¸co Eletrˆonico: http://www2.datasus.gov.br/DATASUS/index.php).
Apesar de n˜ao haver dados faltantes no per´ıodo de estudo, foi poss´ıvel verificar que em diversos meses n˜ao se tiveram casos de dengue, ou seja, existem muitos meses em que
foram observados zero casos de dengue. Por´em, quando se tem um conjunto de dados
com muitos zeros, a an´alise deve ser tratada de maneira especial.
Estudos j´a foram desenvolvidos considerando o ponto de massa de probabilidade no
zero e alguns ser˜ao citados neste trabalho com o intuito de serem usados como ponto
1 Introdu¸c˜ao 11
No desenvolvimento do seu trabalho sobre processos espa¸co-temporais inflacionados
de zero, FERNANDES (2006) citou como exemplo dados de estudos epidemiol´ogicos com
evolu¸c˜ao temporal que s˜ao espacialmente referenciados, e, al´em disso, tem ponto de massa de probabilidade no zero, isto ´e, tem grande parte de seus dados igual a valor zero. A contagem da ocorrˆencia de determinada doen¸ca epidˆemica, pode conter excesso de zeros, pois existem per´ıodos em que se observam grandes n´umeros de casos, e outros per´ıodos em que existem poucos ou mesmo nenhum caso.
No estudo sobre precipita¸c˜ao pluviom´etrica, VELARDE (2000) faz referˆencia a algu-mas abordagens utilizadas na modelagem de chuva. Como por exemplo, a modelagem estat´ıstica de S´eries Temporais para o caso espacial, Cadeias de Markov, t´ecnicas de an´alises de dados espacialmente cont´ınuos e a abordagem Bayesiana usando efeitos autor-regressivos condicionais (CAR).
A precipita¸c˜ao pluviom´etrica semanal no Estado de Goi´as teve o valor zero como ponto de massa de probabilidade, o que impossibilitou a aplica¸c˜ao das metodologias citadas anteriormente. Isso porque as abordagens mencionadas atribuem distribui¸c˜oes conheci-das para a vari´avel de interesse sem necessariamente considerar massa de probabilidade diferenciada para o valor zero. Dois trabalhos tentaram contornar esse problema: o de
FEUERVERGER (1979) que modela a precipita¸c˜ao pluviom´etrica considerando dias com
e sem chuva e o de SANS ´O e GUENNI (1999) que utiliza a distribui¸c˜ao normal truncada. Alguns trabalhos contaram tamb´em com uma aplica¸c˜ao desses modelos como ´e o caso
de FAMOYE e SINGH (2006) que, no artigo sobre a violˆencia dom´estica na cidade de
Portland, no Oregon, no per´ıodo de 1996 a 1997, tentou contornar o problema de excesso de observa¸c˜oes iguais a zero utilizando o modelo Binomial inflado de zeros e modelo de Poisson inflado de zeros.
HOEP e JANSEN (2007) utilizaram o modelo ZIP (do inglˆes Zero Inflated Poison)
e inclu´ıram efeitos aleat´orios para modelar os dados sobre focas arrastadas para fora do
Gelo Glacial, no Alaska. O n´umero de focas arrastadas para fora foi contado em cada
c´elula em cada per´ıodo de tempo, gerando um total de 2489 observa¸c˜oes, entretanto, mais de 50% delas foram iguais a zero.
ARAB et al. (2008) tamb´em utilizaram o modelo ZIP para tratar os dados de captura
de peixes com diversos equipamentos de pesca no rio Missouri. Os dados continham 1477 observa¸c˜oes com grande propor¸c˜ao de zeros.
1.1 Objetivos 12
vamos verificar no decorrer deste trabalho, os dados de dengue do Estado do Rio de Janeiro apontam diversas observa¸c˜oes iguais a zero, ou seja, muitos meses n˜ao tiveram casos de dengue. Mas tamb´em foi poss´ıvel observar diversos meses com muitos casos da doen¸ca.
Neste trabalho sobre o estudo da dengue, pretende-se propor um modelo que se aplique ao conjunto de dados de dengue dada sua caracter´ıstica de ponto de massa de proba-bilidade no zero. Num contexto bayesiano, foram obtidas as distribui¸c˜oes a posteriori condicionais completas a partir das quais foi poss´ıvel fazer estima¸c˜oes para os parˆametros do modelo.
1.1
Objetivos
O presente trabalho tem como principais objetivos desenvolver um estudo espa¸co-temporal sobre a dengue e aplicar os modelos propostos por VELARDE (2000) e FER-NANDES (2006) sobre o estudo dos processos espa¸co-temporais com massa de
probabi-lidade no valor zero no estudo da evolu¸c˜ao da dengue de Janeiro de 2007 a Dezembro
de 2011 nos 92 munic´ıpios do Estado do Rio de Janeiro. Os modelos mencionados ser˜ao
explorados com mais detalhes posteriormente.
Pretende-se com este trabalho propor uma modelagem para dados espa¸co-temporais com ponto de massa de probabilidade no zero. A modelagem que se pretende utilizar
na elabora¸c˜ao deste trabalho ´e essencialmente a modelagem proposta por FERNANDES
(2006) no seu trabalho sobre processos espa¸co-temporais inflacionados de zero.
Em doen¸cas epidemiol´ogicas ´e muito comum haver per´ıodos com muitos casos da
doen¸ca. Em contra partida, existem per´ıodos em que n˜ao h´a casos da doen¸ca. Isso
porque existe uma grande variabilidade dos dados. Os modelos para vari´aveis espaciais n˜ao podem prever essa variabilidade, isto ´e, n˜ao consideram a existˆencia de massa de probabilidade no ponto zero, o que motivou o desenvolvimento do presente trabalho.
1.2
Fonte de Dados
Os dados utilizados neste trabalho foram obtidos atrav´es do site do DataSUS (http:
//www2.datasus.gov.br/DATASUS/index.php), onde ´e poss´ıvel tamb´em encontrar dados
de outras doen¸cas al´em da dengue. O site disponibiliza n´umeros de casos de dengue por local de interna¸c˜ao e por local de residˆencia. Entretanto, como este estudo tem, tamb´em, como finalidade aplicar uma an´alise espacial, os dados selecionados para an´alise foram de
1.2 Fonte de Dados 13
n´umero de casos de dengue por local de residˆencia. O n´umero de casos de dengue foram registrados mensalmente nos 92 munic´ıpios do Estado do Rio de Janeiro no per´ıodo de Janeiro de 2007 a Dezembro de 2011.
14
2
Alguns Modelos para Dados
com Excesso de Zero
Neste cap´ıtulo ser˜ao apresentados alguns trabalhos encontrados na literatura que li-dam com o problema de excesso de zeros, ainda que as ´areas de aplica¸c˜ao sejam muito diferentes.
2.1
Modelagem para Precipita¸
c˜
ao Pluviom´
etrica
A primeira proposta encontrada na literatura que considera o ponto de massa de probabilidade no zero ´e a de FEUERVERGER (1979) que consiste em atribuir 0 `a proba-bilidade do n´ıvel de chuva ser negativo, 1- θ de ser igual a zero e θ de ser positivo, assim θ ´e a probabilidade de chuva e p(y) ´e a densidade condicional `a ocorrˆencia de chuva. Ent˜ao, se tivermos n observa¸c˜oes, teremos a fun¸c˜ao de verossimilhan¸ca:
L(µ, ν) = Y D {1 − θ(Xi, µ)} Y R θ(Xi, µ)p(yi, Xi, ν)
onde o produt´orio para as observa¸c˜oes de dias sem chuva est´a em D, o produt´orio para as observa¸c˜oes com chuva est´a em R e Xi s˜ao regressores conhecidos. Assumindo que µ
e ν s˜ao independentes, a fun¸c˜ao de verossimilhan¸ca poderia ser expressa por L(µ, ν) = L1(µ)L2(ν), uma parte relacionada a acorrˆencia de chuva e outra parte relacionada aos
n´ıveis de chuva. Por´em, esse modelo n˜ao leva em considera¸c˜ao a dependˆencia espacial.
A outra proposta, que aparece em SANS ´O e GUENNI (1999) sugere acumular os
n´ıveis de chuva em um per´ıodo de tempo fixo utilizando uma fun¸c˜ao de correla¸c˜ao
expo-nencialmente decrescente que depende da distˆancia entre os pontos observados. Assim,
2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica 15 yj,t = ( ωβt j,t, ωj,t > 0 0, ωj,t ≤ 0
onde βt > 0 e ωj,t ´e uma vari´avel com distribui¸c˜ao normal.
Esta modelagem nos permite estimar as probabilidades de ter um per´ıodo de chuva ou sem chuva, e ainda, permite estimar os n´ıveis de chuva nos locais observados e n˜ao observados.
No trabalho sobre precipita¸c˜ao pluviom´etrica, VELARDE (2000) usou dados di´arios da quantidade de chuva em cento e vinte esta¸c˜oes no estado de Goi´as durante quinze anos. Vinte e cinco dessas esta¸c˜oes continham dados de quinze anos consecutivos e um pouco mais de cem esta¸c˜oes tinham dados de seis anos consecutivos.
O per´ıodo de observa¸c˜ao utilizado para a an´alise foi de sete dias, sendo assim, os dados di´arios foram transformados em dados semanais, j´a que o uso de dados di´arios ´e
muito impreciso. Mesmo assim, ainda foi poss´ıvel observar v´arias semanas sem chuva.
Vale ressaltar que as s´eries individuais de cada esta¸c˜ao pluviom´etrica desse Estado apre-sentaram um comportamento sazonal.
A an´alise dos histogramas dos n´ıveis de chuva das esta¸c˜oes com observa¸c˜oes diferentes
de zero sugeriu distribui¸c˜oes como as Exponencial, Lognormal, Gama e Weibull. Para
decidir qual dessas distribui¸c˜oes melhor se ajustavam aos dados foram feitos dois teste de hip´oteses: o de Kolmogorov-Smirnov e, em seguida, o das hip´oteses separadas de Cox. Realizados os testes, verificou-se que a distribui¸c˜ao que melhor se ajustou aos dados foi a Exponencial.
No trabalho sobre precipita¸c˜ao pluviom´erica, tamb´em foi utilizada a modelagem por Cadeia de Markov. Para a utiliza¸c˜ao desse tipo de modelagem, deve-se considerar que a ocorrˆencia de chuva depende apenas do tempo, ou seja, n˜ao sofre influˆencias de outros
fatores. Esse tipo de modelagem considera apenas se houve chuva ou n˜ao, sem levar em
considera¸c˜ao os n´ıveis de chuva. Entretanto, VELARDE(2000) observou que algumas
esta¸c˜oes tiveram matrizes de transi¸c˜ao similares, o que significa que existe um padr˜ao espacial na ocorrˆencia de chuva.
Outra abordagem proposta por VELARDE (2000) foi a modelagem em dois est´agios:
o primeiro est´agio consiste em verificar as chances de se obter n´ıveis de chuva diferentes de zero e o segundo consiste em modelar os n´ıveis de chuva dado que no local foi observado n´ıvel de chuva diferente de zero. Essa ´e uma alternativa que permite considerar tanto os
2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica 16
efeitos espaciais como os temporais. ´E importante observar que essa abordagem n˜ao se aplica apenas aos dados de chuva, mas tamb´em a qualquer vari´avel que possui ponto de massa de probabilidade no zero.
Digamos que temos uma vari´avel y com ponto de massa de probabilidade no zero,
uma fun¸c˜ao indicadora pode ser definida da seguinte forma:
I(yj,t > 0) =
(
1, se yj,t > 0
0, se yj,t = 0
(2.1) onde j s˜ao os locais (j = 1, ..., m) e t ´e o tempo (t = 1, ..., n). Essa vari´avel tem distribui¸c˜ao de Bernoulli, onde a probabilidade de ocorrˆencia de chuva no local j e no instante t ´e θj,t = P (I(yj,t > 0) = 1) que pode ser modelada atrav´es da fun¸c˜ao de liga¸c˜ao logit :
log θj,t 1 − θj,t
= Xj,t0 αj,t+ cj,t
onde cj,t ´e o efeito espacial que segue um modelo a priori CAR (autorregressivos
condi-cionais), Xj,t ´e o vetor de covari´aveis e αj,t ´e o correspondente vetor de parˆametros.
Para os coeficientes de regress˜ao αj,t podemos definir prioris normais e para o efeito
espacial cj,t tem-se que:
p(cj,t|...) ∝ 1 κ n×m 2 c exp ( − 1 2κc X i∼j (cj,t− ci,t)2 ) , cj,t ∈ R,
onde κc ´e desconhecido para o qual pode ser especificada como priori uma distribui¸c˜ao
Gama inversa.
O segundo est´agio dessa abordagem ´e modelar os n´ıveis da vari´avel nos locais onde o n´ıvel observado foi diferente de zero. Ent˜ao, podemos definir a fun¸c˜ao de liga¸c˜ao para o n´ıvel m´edio da vari´avel:
logλ−1j,t = Zj,t0 βj,t+ dj,t,
onde λ−1j,t ´e o n´ıvel m´edio da vari´avel sem considerar os zeros, Zj,t´e um vetor de covari´aveis,
βj,t ´e o vetor de coeficientes de regress˜ao e dj,t ´e o efeito espacial. Para os coeficientes de
regress˜ao βj,t podem ser assumidas prioris normais e para o efeito espacial dj,t tem-se a
2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de Probabilidade no Zero17 p(dj,t|...) ∝ 1 κ (n×m) 2 d exp ( − 1 2κd X i∼j (dj,t− di,t)2 ) , dj,t ∈ R
Agora, ser´a definida a verossimilhan¸ca de vari´aveis com ponto de massa no zero. Como foi mencionado anteriormente, a fun¸c˜ao indicadora dos n´ıveis de chuva maiores que zero segue uma distribui¸c˜ao de Bernoulli com parˆametro θj,t, logo,
p(I(yj,t > 0)|θj,t) =
(
θj,t se yj,t > 0
1 − θj,t se yj,t = 0.
(2.2)
No caso de dados de chuva foi dito tamb´em que os n´ıveis de chuva diferentes de zero seguem uma distribui¸c˜ao Exponencial com m´edia λ−1j,t, ent˜ao,
p(yj,t|λj,t) =
(
λj,texp(−λj,tyj,t) se yj,t > 0
0 caso contr´ario. (2.3)
A densidade para a quantidade de chuva pode ser dada, ent˜ao, pela mistura das
fun¸c˜oes 2.2 e 2.3. Isto ´e,
p(yj,t|θj,t, λj,t) =
(
θj,tλj,texp(−λj,tyj,t) se yj,t > 0
1 − θj,t se yj,t = 0
gerando a seguinte fun¸c˜ao de verossimilhan¸ca:
L(θj,t, λj,t; yj,t) = n Y t=1 m Y j=1 (1 − θj,t)1−I(yj,t>0)θ I(yj,t>0) j,t λ I(yj,t>0) j,t exp(−λj,tyj,t)
Com L(.) e as distribui¸c˜oes a priori j´a definidas VELARDE (2000) calculou as dis-tribui¸c˜oes a posteriori e, em seguida, estimou os parˆametros desse modelo via Monte Carlo em Cadeias de Markov (MCMC).
2.2
Modelos para Processos Espa¸
co-Temporais com
Ponto de Massa de Probabilidade no Zero
FERNANDES (2006) desenvolveu seu trabalho com objetivo de modelar dados com duas caracter´ısticas em especial: a dependˆencia espa¸co-temporal e o excesso de zeros. Baseado em algumas ideias propostas no trabalho de VELARDE (2000), FERNANDES
2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de Probabilidade no Zero18
(2006) trata o problema de excesso de zeros de maneira mais geral, desenvolvendo um modelo que pode ser aplicado em vari´aveis discretas, mistas e cont´ınuas.
No estudo de doen¸cas epidˆemicas, por exemplo, existem ´epocas em que o n´umero de casos ´e maior do que em outras ´epocas. Ou ainda, ´epocas em que n˜ao se observa casos da doen¸ca. Quando existe um excesso de valores iguais a zero, a super dispers˜ao faz com que a variabilidade dos dados seja t˜ao grande que a pr´opria distribui¸c˜ao utilizada n˜ao pode
prever. Uma classe de modelos muito utilizada para modelar esse tipo de dados s˜ao os
chamados modelos de Poisson com zero inflado.
Com intuito de contornar o problema de excesso de zeros, FERNANDES (2006) uti-lizou uma mistura de distribui¸c˜oes. Isso pode ser feito da seguinte maneira: primeiro usando a distribui¸c˜ao de Bernoulli com probabilidade 1 − θ de obtermos um valor igual a zero e, em seguida, com probabilidade θ, usamos um valor da distribui¸c˜ao p(y|.). Temos, considerando que em dados de contagem as vari´aveis s˜ao n˜ao-negativas, o seguinte modelo para yj,t: p(yj,t|θj,t, λj,t) = ( θj,tp(yj,t|λj,t) se yi,t > 0 (1 − θj,t) + θj,tp(yj,t = 0|λj,t) se yj,t = 0. (2.4)
Sendo assim, a probabilidade de se obter um valor igual a zero que n˜ao ´e da distribui¸c˜ao de Poisson ´e 1 − θj,t e a probabilidade de se obter um valor da distribui¸c˜ao de Poisson ´e
θj,t.
Agora, precisamos introduzir as covari´aveis e aplicar estruturas aos parˆametros θj,t e
λj,t. A fun¸c˜ao de liga¸c˜ao para o parˆametro da distribui¸c˜ao de Bernoulli para este caso ´e
dada por:
log θj,t 1 − θj,t
= F1j,t0 γj,t+ zj,t
onde F1j,t0 s˜ao as covari´aveis, γj,t s˜ao seus respectivos coeficientes de regress˜ao e zj,t s˜ao os
efeitos espaciais.
Para a distribui¸c˜ao p(yj,t|λj,t) temos a seguinte fun¸c˜ao de liga¸c˜ao:
g(E(yj,t|λj,t)) = g(λj,t) = F2j,t0 ρj,t+ sj,t,
onde F2j,t0 s˜ao as covari´aveis que podem ou n˜ao ser iguais as de F1j,t0 , ρj,ts˜ao seus respectivos
2.3 Casos de Estudo 19
A fun¸c˜ao de verossimilhan¸ca nesse caso ´e dada por:
L(θj,t, λj,t; yj,t) = n Y t=1 m Y j=1
[(1−θj,t)+θj,tp(yj,t = 0|λj,t)]1−I(yj,t>0)[θj,tp(yj,t|λj,t)]I(yj,t>0). (2.5)
onde I(yj,t > 0 ´e a Fun¸c˜ao Indicadora defina em 2.2.
Por´em, em 2.5 n˜ao existe independˆencia entre os parˆametros θj,t e λj,t. Sendo
as-sim, usou-se a vari´avel Wj,t para obter uma verossimilhan¸ca aumentada. Essa vari´avel ´e
chamada indicadora pois indica se o evento [yj,t = 0] veio de uma distribui¸c˜ao de Bernoulli
ou n˜ao. Temos ent˜ao, uma nova verossimilhan¸ca:
L(θj,t, λj,t; yj,t; wj,t) = n Y t=1 m Y j=1 θ1−wj,t j,t (1 − θj,t)wj,t n Y t=1 m Y j=1 p(yj,t|λj,t)1−wj,t.
Podemos notar que agora temos uma verossimilhan¸ca que facilita os procedimentos de inferˆencia que poder˜ao ser usados, pois agora os parˆametros θj,t e λj,t s˜ao independentes.
2.3
Casos de Estudo
2.3.1
Modelagem para Dados de Violˆ
encia Dom´
estica
No artigo sobre violˆencia dom´estica, FAMOUYE e SINGH (2006) utilizaram o modelo de regress˜ao de Poisson generalizada. A vari´avel violˆencia foi definida como o n´umero de comportamentos violentos sofridos pela v´ıtima. Nesse tipo de conjunto de dados chamados
dados de contagem tamb´em pode ocorrer excesso de observa¸c˜oes iguais a zero. Essa
caracter´ıstica, afirmam os autores, pode ser explicada pela super dispers˜ao dos dados. O artigo menciona o fato dessa super dispers˜ao possuir a tendˆencia de aumentar a propor¸c˜ao de zeros e quando existem muitos zeros relativos `a suposi¸c˜ao de Poisson, a regress˜ao binomial negativa e a regress˜ao de Poisson generalizada melhoram o ajuste dos dados.
Para o caso de dados de violˆencia dom´estica, foi testado se a quantidade de zeros era muito grande para que o modelo de Poisson generalizada fosse bem ajustado.
A vari´avel resposta, para este caso, ´e o n´umero de comportamentos violentos sofridos pela v´ıtima e as vari´aveis independentes utilizadas no modelo s˜ao tais como grau de escolaridade, situa¸c˜ao de emprego e renda. O modelo de regress˜ao de Poisson generalizada
2.3 Casos de Estudo 20 ´e dado por: p(yi|µi, α) = µi 1 + αµi yi (1 + yi)yi−1 yi! exp −µi(1 + αyi) 1 + αµi , yi = 0, 1, 2, ... (2.6)
onde µi = µi(xi) = exp(P xijβj), xi = (xi1= 1, xi2, ..., xik) ´e a i -´esima linha da matriz de
covari´aveis X e βββ = (β1, β2, ..., βk) ´e um vetor de parˆametros desconhecidos com k colunas.
A m´edia de yi ´e dada por µi(xi) e a variˆancia de yi ´e dada por V (yi|xi) = µi(1 + αµi)2.
No modelo descrito em 2.6, α ´e chamado de parˆametro de dispers˜ao. Quando α = 0, o modelo se reduz ao modelo de Poisson. Quando α < 0, o modelo representa dados com pequena dispers˜ao. E quando α > 0, o modelo representa dados com super dispers˜ao.
O modelo de regress˜ao de Poisson generalizado com excesso de zeros ´e definido como:
p(Y = yi|xi, zi) =
(
ϕi+ (1 − ϕi)p(yi = 0|µi, α) se yi = 0
(1 − ϕi)p(yi|µi, α) se yi > 0
(2.7) onde p(yi|µi; α), yi = 0, 1, 2, ... ´e dado pelo modelo descrito em 2.6 e 0 < ϕi < 1.
No modelo 2.7, as fun¸c˜oes µi = µi(xi) e ϕi = ϕi(zi) satisfazem log(µi) = k P i=1 xijβj e logit(ϕi) = log(ϕi[1 − ϕi]−1) = p P i=1
zijδj, onde zi = (zi1 = 1, zi2, ..., zip) ´e a i -´esima linha
da matriz de covari´aveis Z e δδδ = (δ1, δ2, ..., δp) ´e um vetor de parˆametros com p colunas.
Esse artigo foi desenvolvido considerando um modelo de regress˜ao o que n˜ao ´e o nosso caso, j´a que n˜ao contamos com covari´aveis. Por´em, o artigo foi muito ´util para o
entendimento de dados de contagem com excesso de zeros que ´e o tipo de dados que se
trata quando falamos em n´umero de casos de uma doen¸ca.
2.3.2
Modelagem para o Estudo de Focas Arrastadas para Fora
do Gelo Glacial no Alaska
HOEF e JANSEN (2007) usaram o modelo de Poisson inflado de zeros (ZIP) para desenvolver um estudo sobre as focas arrastadas para fora do Gelo Glacial no Alaska. Esse modelo se aplicou muito bem aos dados j´a que dados ambientais geralmente s˜ao espa¸co-temporais e tamb´em possuem muitos zeros. A ´area de estudo foi dividida em c´elulas (j ) e cada uma delas foi observada em 18 per´ıodos de tempo diferentes (t ). Para cada c´elula e para cada per´ıodo de tempo foi contado o n´umero de focas arrastada para fora do Gelo Glacial. Assim como o trabalho de FAMOUYE e SINGH (2006), esse trabalho utilizou
2.3 Casos de Estudo 21
algumas covari´aveis.
O modelo de regress˜ao espa¸co-temporal ZIP pode ser constru´ıdo usando efeitos au-toregressivos condicionais (CAR) e efeitos auau-toregressivos de primeira ordem (AR(1)). O modelo de regress˜ao ZIP ´e dado por:
Zj,t|Yj,t =
(
0 se Yj,t = 0,
P ois(λj,t) se Yj,t = 1
onde P ois(λj,t) ´e uma vari´avel aleat´oria com distribui¸c˜ao de Poisson condicionalmente
independente com m´edia λj,t e Yj,t ´e uma vari´avel aleat´oria com distribui¸c˜ao de Bernoulli
com m´edia pj,t para o tempo (t ) na localiza¸c˜ao espacial (j ). Eles usaram fun¸c˜oes de
liga¸c˜ao para relacionar as m´edias dessas distribui¸c˜oes com um modelo linear misto: log(λj,t) = νi+ x0j,tβ + j,t,
logit(pj,t) = µi+ x0j,tα + δj,t,
onde logit(a) = 1−aa , νt e µt s˜ao as m´edias em cada per´ıodo de tempo, β e α s˜ao vetores
de parˆametros da regress˜ao e xj,t s˜ao as covari´aveis do modelo. Os erros aleat´orios j,t e
δj,t foram assumidos espacialmente correlacionados para o tempo fixo t. Foram atribu´ıdas
distribui¸c˜oes a priori normais para esses efeitos em cada um dos per´ıodos: t ∼ N (0, σ2(I − ρC−1)M)
δt∼ N (0, σ2δ(I − ρδC−1)M)
onde cada linha de C cont´em zeros exceto para as colunas que indicam um vizinho e os
pesos s˜ao os n´umeros de vizinhos para essa amostra. A matriz M ´e uma matriz diagonal onde os elementos da diagonal cont´em o n´umero de vizinhos.
HOEF e JANSEN (2007) trataram νt e µt como modelos lineares separados por
co-vari´aveis temporais,
νt = ν0+ T0tη + ξt,
µt = µ0+ T0tγ + τt
onde Ti s˜ao as covari´aveis relacionadas ao tempo. Eles admitiram erros temporalmente
correlacionados que s˜ao modelados com modelos AR(1):
ξt = φξξt−1+ σξWξ,t; t > 1,
τt = φττt−1+ στWτ,t; t > 1,
onde Wξ,t e Wτ,t s˜ao vari´aveis aleat´orias independentes com distribui¸c˜ao normal padr˜ao.
2.3 Casos de Estudo 22
Cadeias de Markov (MCMC) no software WinBUGS. De in´ıcio, eles usaram 5000 itera¸c˜oes, e, em seguida, mais 50000 itera¸c˜oes. E, em seguida, foram obtidas as estimativas pontuais e intervalares (com 95% de confian¸ca) dos parˆametros.
2.3.3
Modelagem de Excesso de Zeros na Captura de Peixes
ARAB et al.(2008) consideraram o modelo de Poisson com excesso de zeros (ZIP) e efeitos aleat´orios para tratar o excesso de zeros no estudo de pesca com m´ultiplos equipamentos no rio Missouri, propondo, assim, um modelo para determinar os fatores relacionados `a ocorrˆencia de esp´ecies de peixes e os relacionados `as taxas de captura de peixes. Em estudos ecol´ogicos ´e muito comum obter grandes propor¸c˜oes de zeros nos dados, mas excluir os zeros da an´alise pode resultar em perda de informa¸c˜ao importante. Como por exemplo, uma alta propor¸c˜ao de zeros pode indicar que a esp´ecie ´e rara ou dif´ıcil de detectar.
As esp´ecies em estudo foram duas: o bagre (Ictalurus punctatus) e o esturj˜ao Sho -velnose (Scaphirhynchus platorynchus). Os pesquisadores dividiram o rio Missouri em 3 zonas: a superior ou zona menos alterada, a intermedi´aria ou zona do inter-reservat´orio e inferior ou zona canalizada. Cada zona foi dividida em segmentos, criando um total de 27 segmentos no rio inteiro. Os quatro macrohabitats encontrados no rio foram: entrada tribut´aria, canal secund´ario canalizado, canal secund´ario n˜ao-canalizado e curva. Para a captura dos peixes foram usados quatro equipamentos diferentes: rede bentˆonica, rede de praia, rede de gancho flutuante e pesca el´etrica. O processo de coleta e contagem de peixes foi repetido de 1996 a 1998. Isso deu origem a um conjunto de dados com 1477 observa¸c˜oes das quais grande parte foi igual a zero.
Foi definido yijklcomo o n´umero de peixes no segmento i, macrohabitat j, equipamento
k e ano l. Ent˜ao, yijkl = 0 com probabilidade pijkl e yijkl ∼ P ois(λijklaijkl) com
probabili-dade 1 − pijkl, onde λijkl representa a m´edia de pesca por unidade de ´area (CPUA) e aijkl
conta as diferentes ´areas envolvidas em cada medi¸c˜ao separada. O modelo foi definido por ARAB et.al.(2008) como:
P (yijkl = 0) = pijkl+ (1 − pijkl)e−λijklaijkl
P (yijkl = x) = (1 − pijkl)e−λijklaijkl
(λijklaijkl)x
x!
O modelo ZIP descrito ´e uma mistura de uma distribui¸c˜ao para o ponto de massa no zero com a distribui¸c˜ao de Poisson. Um valor diferente de zero segue uma distribui¸c˜ao
2.3 Casos de Estudo 23
Poisson com intensidade λijklaijkl.
ARAB et al.(2008) utilizaram uma abordagem Bayesiana, por ser mais flex´ıvel e por gerar resultados confi´aveis para as estima¸c˜oes dos parˆametros do modelo. Em seguida,
eles usaram o m´etodo de Monte Carlo em Cadeias de Markov (MCMC) com o objetivo
24
3
An´
alise Inicial dos Dados de
Dengue no Rio de Janeiro
Neste Cap´ıtulo, ser˜ao apresentadas an´alises descritivas que justifiquem o uso de um modelo espec´ıfico.
Os dados selecionados foram de n´umero de casos de dengue em cada munic´ıpio do
Estado do Rio de Janeiro por local de residˆencia no per´ıodo de Janeiro de 2008 a Dezembro de 2011. Observou-se, ent˜ao, que, nesse per´ıodo de estudo, a dengue foi caracterizada principalmente por meses com maiores ocorrˆencias da doen¸ca e outros meses com menores ocorrˆencias ou at´e mesmo zero. Essa caracter´ıstica em especial necessita de um tratamento diferencial dos dados.
Na Figura 1, temos, no lado esquerdo, a representa¸c˜ao do barplot de frequˆencias do n´umero de casos de dengue no munic´ıpio de Cabo Frio e, no lado direito, temos o boxplot
para o mesmo munic´ıpio. No barplot podemos observar que o n´umero que aparece com
maior frequˆencia ´e o zero. Logo, podemos dizer que o valor zero ´e um ponto com massa de probabilidade significativa. Na Figura 2, temos os mesmos gr´aficos, dessa vez para o munic´ıpio de Mag´e que apresenta caracter´ısticas semelhantes.
Para visualizar melhor as quantidades de zeros por ano, podemos observar a Tabela 1. Nessa Tabela temos cada um dos 92 munic´ıpios do Estado do Rio de Janeiro e os totais de zeros observados em cada ano. Assim, os n´umeros na Tabela est˜ao entre 0 e 12. Em que o 0 significa que, no per´ıodo de um ano, todos os meses tiveram pelo menos um caso de dengue. E o 12 significa que, no per´ıodo de um ano, todos os meses tiveram zero casos de dengue.
A evolu¸c˜ao temporal das quantidades de casos de dengue nos Munic´ıpios de Angra
dos Reis, Nova Friburgo e Rio das Ostras no per´ıodo estudado ´e mostrada na Figura 3.
Podemos notar alguns picos nas s´eries, mas, mesmo assim, apresentaram muitos zeros,
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 25
Figura 1: Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Cabo Frio
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 26
Tabela 1: Quantidade de Zeros em cada Munic´ıpio por Ano
Município 2007 2008 2009 2010 2011 Município 2007 2008 2009 2010 2011 Angra dos Reis 5 4 7 7 6 Nilópolis 7 3 6 3 4
Aperibé 12 5 5 5 2 Niterói 1 1 4 1 1
Araruama 6 6 12 8 4 Nova Friburgo 9 6 11 9 6
Areal 12 12 12 9 11 Nova Iguaçu 2 0 0 0 0
Armação dos Búzios 10 9 12 11 5 Paracambi 9 4 11 5 4 Arraial do Cabo 6 7 11 8 8 Paraíba do Sul 7 9 12 9 9
Barra do Piraí 4 2 4 6 0 Paraty 11 6 9 5 7
Barra Mansa 2 4 7 4 2 Paty do Alferes 12 11 11 12 9
Belford Roxo 4 0 2 0 0 Petrópolis 6 6 9 7 5
Bom Jardim 11 12 12 12 8 Pinheiral 12 9 12 12 7 Bom Jesus do Itabapoana 9 1 9 3 5 Piraí 9 11 11 10 10
Cabo Frio 1 5 8 2 2 Porciúncula 12 12 9 3 5
Cachoeiras de Macacu 5 6 11 3 3 Porto Real 10 12 12 10 8
Cambuci 11 10 11 2 1 Quatis 10 11 12 11 11
Campos dos Goytacazes 0 1 4 0 0 Queimados 6 3 9 1 1
Cantagalo 9 5 12 10 6 Quissamã 6 8 11 7 2
Carapebus 11 12 12 12 12 Resende 4 6 7 11 2
Cardoso Moreira 11 9 11 11 8 Rio Bonito 1 6 8 2 1
Carmo 10 7 10 12 6 Rio Claro 11 9 12 11 11
Casimiro de Abreu 6 9 11 4 6 Rio das Flores 12 11 12 12 7 Comendador Levy Gasparian 11 10 12 12 12 Rio das Ostras 12 11 12 1 1 Conceição de Macabu 11 10 11 12 8 Rio de Janeiro 0 0 0 0 0 Cordeiro 8 7 11 9 6 Santa Maria Madalena 12 12 12 12 9 Duas Barras 12 12 12 12 10 Santo Antônio de Pádua 4 3 6 2 0 Duque de Caxias 0 0 3 0 0 São Fidélis 3 4 7 1 1 Engenheiro Paulo de Frontin 8 8 11 9 6 São Francisco de Itabapoana 12 7 12 6 2
Guapimirim 9 7 11 6 7 São Gonçalo 0 0 2 0 0
Iguaba Grande 10 8 12 10 6 São João da Barra 11 7 12 4 1 Itaboraí 0 2 3 0 3 São João de Meriti 3 0 5 1 1 Itaguaí 7 1 9 3 4 São José de Ubá 12 12 12 12 11 Italva 11 11 12 8 5 São José do Vale do Rio Preto 12 9 11 9 6 Itaocara 9 5 3 2 1 São Pedro da Aldeia 9 5 12 9 4 Itaperuna 4 3 7 4 0 São Sebastião do Alto 11 10 11 11 7 Itatiaia 8 9 10 10 10 Sapucaia 12 12 10 12 11
Japeri 11 5 7 8 1 Saquarema 5 6 12 11 7
Laje do Muriaé 7 9 12 11 11 Seropédica 11 4 12 11 6
Macaé 5 2 1 2 6 Silva Jardim 10 7 6 7 6
Macuco 11 9 12 11 11 Sumidouro 12 9 12 12 12
Magé 0 0 4 1 2 Tanguá 8 6 7 4 6
Mangaratiba 8 3 8 4 3 Teresópolis 9 7 12 10 9 Maricá 4 5 10 2 6 Trajano de Moraes 10 12 12 12 10
Mendes 7 7 11 9 10 Três Rios 7 10 12 11 7
Mesquita 10 3 9 6 3 Valença 4 6 4 3 1
Miguel Pereira 12 12 12 11 9 Varre-Sai 12 12 12 12 11
Miracema 6 5 8 6 5 Vassouras 12 7 11 7 3
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 27
Figura 3: Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro entre Janeiro de 2007 a Dezembro de 2011
(a) Angra dos Reis
(b) Nova Friburgo
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 28
os trˆes Munic´ıpios.
Nas Figuras 4 e 5 s˜ao apresentados os mapas com as quantidades de casos de dengue
por mˆes em cada munic´ıpio do Estado do Rio de Janeiro ao longo do ano de 2008. A
observa¸c˜ao dos mapas deixa clara a dependˆencia espacial entre alguns munic´ıpios posto
que munic´ıpios com muitos casos de dengue tamb´em tem vizinhos com muitos casos e
munic´ıpios com poucos casos de dengue tamb´em tem vizinhan¸ca com poucos casos de
dengue.
A exposi¸c˜ao dessas caracter´ısticas deixa claro a necessidade de se utilizar um modelo espec´ıfico. Nesse caso em particular, o modelo deve levar em considera¸c˜ao que temos um conjunto de dados com excesso de zeros e que tamb´em existe uma correla¸c˜ao espacial entre munic´ıpios vizinhos.
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 29
Figura 4: Evolu¸c˜ao da Dengue de Janeiro de 2008 a Junho de 2008 no Estado do Rio de
Janeiro
(a) Janeiro (b) Fevereiro
(c) Mar¸co (d) Abril
3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 30
Figura 5: Evolu¸c˜ao da Dengue de Julho de 2008 a Dezembro de 2008 no Estado do Rio
de Janeiro
(a) Julho (b) Agosto
(c) Setembro (d) Outubro
31
4
Resultados e Discuss˜
ao
Nossa proposta ´e utilizar o trabalho de FERNANDES (2006) sobre o estudo
espa¸co-temporal em dados inflacionados de zero no conjunto de dados de dengue nos munic´ıpios do Estado do Rio de Janeiro.
4.1
Modelo Proposto
Usaremos um modelo que utiliza as ideias apresentadas por FERNANDES (2006):
p(yj,t|θj,t, λj,t) =
(
θj,tp(yj,t|λj,t) se yj,t > 0
(1 − θj,t) + θj,tp(yj,t = 0|λj,t) se yj,t = 0
Sendo assim, temos uma mistura de uma distribui¸c˜ao de Bernoulli com uma
dis-tribui¸c˜ao p(yj,t|λj,t). O parˆametro θj,t ´e a probabilidade de obtermos um valor da
dis-tribui¸c˜ao p(yj,t|λj,t), que, neste caso ´e uma distribui¸c˜ao de Poisson com m´edia λj,t. A
distribui¸c˜ao de Poisson ´e muito utilizada em dados de contagem. Cabe ressaltar que, nesses tipos de dados, n˜ao existem observa¸c˜oes menores que zero. Logo,
p(yj,t|θj,t, λj,t) = ( θj,t exp(−λj,t)λyj,tj,t yj,t! se yi,t > 0 (1 − θj,t) + θj,texp(−λj,t) se yj,t = 0,
obtendo, ent˜ao, a fun¸c˜ao de log-verossimilhan¸ca dada por:
logL(θj,t, λj,t|yj,t) = X X yj,t=0 log [(1 − θj,t) + θj,texp(−λj,t)] +X X yj,t>0 log " θj,t exp(−λj,t)λ yj,t j,t yj,t! # .
4.1 Modelo Proposto 32 temos: I(yj,t> 0) = ( 1, se yj,t > 0 0, se yj,t = 0. (4.1)
Assim, a fun¸c˜ao 4.1 indica se yj,t ´e maior ou igual a zero, isto ´e, se observamos pelo
menos um caso de dengue no mˆes t no munic´ıpio j ou observamos zero casos.
Ser˜ao propostos trˆes modelos. O primeiro modelo que ser´a apresentado ´e o mais completo por conter mais parˆametros. As fun¸c˜oes de liga¸c˜ao para os parˆametros θj,t e λj,t
s˜ao dadas, respectivamente, por:
log θj,t 1 − θj,t
= γ0+ γ1I(yj,t−1 > 0) + cj,t
logλj,t = α0+ dj,t
onde cj,t e dj,t s˜ao os efeitos espaciais dos parˆametros θj,t e λj,t, respectivamente. E
I(yj,t > 0) ´e a fun¸c˜ao indicadora definida em 4.1. A primeira equa¸c˜ao mostra que a
probabilidade de ter casos de dengue provenientes da Poisson depende de ter tido casos
no mˆes imediatamente anterior e tamb´em de um efeito espacial CAR que representa a
depedˆencia espacial entre munic´ıpios. A segunda equa¸c˜ao considera o n´umero m´edio de
casos de dengue comum a todos os munic´ıpios do Estado e meses e tamb´em um efeito
espacial associado ao n´umero de casos.
O outro modelo proposto tem a primeira fun¸c˜ao de liga¸c˜ao semelhante ao primeiro modelo, a diferen¸ca est´a na segunda fun¸c˜ao de liga¸c˜ao que indica que o n´umero de casos da doen¸ca ´e, em m´edia, constante para todos os munic´ıpios e meses estudados. Ent˜ao, temos as seguintes fun¸c˜oes de liga¸c˜ao:
log θj,t 1 − θj,t
= γ0+ γ1I(yj,t−1 > 0) + cj,t
logλj,t = α0
O ´ultimo modelo proposto leva em considera¸c˜ao que a m´edia λj,t depende apenas do
efeitos espacial dj,t, isto ´e, depende apenas da influˆencia espacial que cada munic´ıpio sofre
de seus vizinhos. As fun¸c˜oes de liga¸c˜ao para esse modelo s˜ao dadas por:
log θj,t 1 − θj,t
4.1 Modelo Proposto 33
logλj,t = dj,t
Para a estima¸c˜ao dos parˆametros do modelo foi utilizado o m´etodo de MCMC (Monte Carlo em Cadeias de Markov). O software usado na estima¸c˜ao e nas an´alises foi essen-cialmente o R vers˜ao 2.13.1.
4.2 Distribui¸c˜oes a Priori dos Parˆametros 34
4.2
Distribui¸
c˜
oes a Priori dos Parˆ
ametros
Seja Ψ = (γ0, γ1, cj,t, α0, dj,t) o vetor de parˆametros do primeiro modelo proposto,
definiremos as distribui¸c˜oes a priori para os parˆametros deste modelo, que s˜ao:
p(γ0|Ψ−γ0) = 1 √ 2πk1 exp − 1 2k1 (γ0− γ00)2 (4.2) p(γ1|Ψ−γ1) = 1 √ 2πk2 exp − 1 2k2 (γ1− γ10)2 (4.3) p(cj,t|Ψ−cj,t) = 1 q 2πk3 ηj exp − 1 2(k3/ηj) (cj,t− cj,t)2 (4.4) p(α0|Ψ−α0) = 1 √ 2πk4 exp − 1 2k4 (α0− α00)2 (4.5) p(dj,t|Ψ−dj,t) = 1 q 2πk5 ηj exp − 1 2(k5/ηj) (dj,t− dj,t)2 (4.6)
onde ηj ´e o n´umero de munic´ıpios que fazem fronteira com o munic´ıpio j.
Os outros dois modelos propostos tem distribui¸c˜oes a priori iguais as do primeiro modelo, dado que eles foram constru´ıdos com os mesmos parˆametros, entretanto o primeiro modelo considerando apenas o α0 e o segundo considerando apenas o efeito espacial dj,t.
4.3
Estima¸
c˜
ao dos Parˆ
ametros
Vamos definir, agora, a fun¸c˜ao de log-verossimilhan¸ca para os modelos descritos na se¸c˜ao 4.1. Para o modelo 1, a fun¸c˜ao de log-verossilhan¸ca ´e dada por:
logL(Ψ|y) = X X
yj,t−1=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0 + dj,t))]
−X X
yj,t−1≥0
log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t)]
+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(α0+ dj,t) +α0 X X yj,t>0 yj,t+ X X yj,t>0 yj,tdj,t− X X yj,t>0 log(yj,t!)
4.3 Estima¸c˜ao dos Parˆametros 35
onde κ ´e o n´umero total de observa¸c˜oes diferentes de zero e ψ ´e o n´umero de observa¸c˜oes diferentes de zero cujo mˆes anterior tamb´em teve pelo menos um caso de dengue.
A seguir temos as posterioris marginais completas na escala logar´ıtmica, que, para o modelo completo, s˜ao:
log p(γ0|Ψ−γ0, y) =
X X
yj,t=0
log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]
−X X
yj,t≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0
−(γ0− γ00) 2 k1 + wγ0 log p(γ1|Ψ−γ1, y) = X X yj,t−1=0
log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]
−X X
yj,t−1≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1
−(γ1− γ10) 2 k2 + wγ1 log p(cj,t|Ψ−cj,t, y) = X X yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]
− m X j=1 n X t=1
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +
X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(α0|Ψ−α0, y) = X X yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]
−X X yj,t>0 exp(α0+ dj,t) + α0 X X yj,t>0 yj,t− (α0 − α00)2 k4 + wα0
4.3 Estima¸c˜ao dos Parˆametros 36
log p(dj,t|Ψ−dj,t, y) =
X X
yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]
−X X yj,t>0 exp(α0+ dj,t) + X X yj,t>0 yj,tdj,t− (dj,t− dj,t)2 k5 ηj + wdj,t onde wγ0, wγ1, wcj,t, wα0 e wdj,t s˜ao constantes.
O modelo com m´edia comum a todos os munic´ıpios e meses tem a seguinte fun¸c˜ao de log-verossimilhan¸ca:
logL(Ψ|y) = X X
yj,t−1=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]
−X X
yj,t−1≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)]
+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(α0) +α0 X X yj,t>0 yj,t− X X yj,t>0 log(yj,t!)
E as posterioris marginais completas na escala logar´ıtmica s˜ao: log p(γ0|Ψ−γ0, y) =
X X
yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]
−X X
yj,t≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0
− −(γ0− γ00) 2 k1 + wγ0 log p(γ1|Ψ−γ1, y) = X X yj,t−1=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]
−X X
yj,t−1≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1
−(γ1 − γ10)
2
k2
4.3 Estima¸c˜ao dos Parˆametros 37
log p(cj,t|Ψ−cj,t, y) =
X X
yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]
− m X j=1 n X t=1
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +
X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(α0|Ψ−α0, y) = X X yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]
−X X yj,t>0 exp(α0) + α0 X X yj,t>0 yj,t− (α0− α00)2 k4 + wα0
O ´ultimo modelo proposto refere-se a utiliza¸c˜ao apenas dos efeitos espaciais dj,t e sua
fun¸c˜ao de log-verossimilhan¸ca ´e dada pela express˜ao:
logL(Ψ|y) = X X
yj,t−1=0
log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]
−X X
yj,t−1≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)]
+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(dj,t) +X X yj,t>0 yj,tdj,t− X X yj,t>0 log(yj,t!)
As posterioris marginais completas s˜ao, na escala logar´ıtmica: log p(γ0|Ψ−γ0, y) =
X X
yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]
−X X
yj,t≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0
−(γ0− γ00)
2
k1
4.3 Estima¸c˜ao dos Parˆametros 38
log p(γ1|Ψ−γ1, y) =
X X
yj,t−1=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]
−X X
yj,t−1≥0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1
−(γ1− γ10) 2 k2 + wγ1 log p(cj,t|Ψ−cj,t, y) = X X yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]
− m X j=1 n X t=1
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +
X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(dj,t|Ψ−dj,t, y) = X X yj,t=0
log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]
−X X yj,t>0 exp(dj,t) + X X yj,t>0 yj,tdj,t− (dj,t− dj,t)2 k5 ηj + wdj,t
Todos os modelos descritos s˜ao muito complexos por conter um grande n´umero parˆametros, por´em o modelo completo tem ainda mais parˆametros para serem estimados, logo, ´e o mais complexo em termos computacionais.
Definidas as posterioris marginais completas, pode-se iniciar a estima¸c˜ao dos parˆametros
via m´etodo Monte Carlo em Cadeias de Markov, usando o seguinte algoritmo para o
primeiro modelo cujo c´odigo em R pode ser visto no Anexo B:
1. Atribuir valores iniciais aos parˆametros γ0(0), γ1(0), c(0)j,t, α(0)0 e d(0)j,t 2. Para cada parˆametro
• Gerar proposta usando a priori • Avaliar a aceita¸c˜ao do valor proposta 3. Repetir o passo 2 at´e a convergˆencia
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 39
4.4
Compara¸
c˜
ao dos Modelos e Previs˜
ao
Posteriormente `a estima¸c˜ao dos parˆametros dos modelos descritos na se¸c˜ao anterior foi feito o c´alculo da M´edia dos Res´ıduos ao Quadrado (MRQ) de cada um dos modelos como forma de avaliar o ajuste dos modelos propostos usando a seguinte express˜ao:
M RQ(Yj,t) = m X j=1 n X t=1 (ˆyj,t− yj,t)2 mn (4.7)
onde ˆyj,t ´e o valor esperado para munic´ıpio j no mˆes t, m ´e o n´umero de munic´ıpios dos
quais temos os resultados da previs˜ao e n ´e o n´umero de meses.
O menor MRQ encontrado foi o do modelo que considera apenas o efeito espacial dj,t na segunda equa¸c˜ao, como observado na Tabela 2. Sendo assim, sugerimos utilizar
esse modelo nas previs˜oes de n´umero de casos de dengue em todos os munic´ıpios do
Rio de Janeiro no ano de 2011. Entretanto, mesmo tendo o menor MRQ, ele n˜ao ´e
necessariamente o modelo ideal. Sabe-se que a ocorrˆencia de chuva influencia o ciclo de
vida do mosquito, assim como a temperatura ambiental, densidade demogr´afica e outras
vari´aveis. Ent˜ao, poder´ıamos melhorar o modelo adicionando algumas dessas vari´aveis.
Tabela 2: M´edia dos Res´ıduos ao Quadrado dos Modelos Propostos
Modelos Propostos
Modelo Modelo com Modelo com Apenas
MRQ Completo M´edia Comum Efeito Espacial
60,24 699,41 52,77
Para fazer uma compara¸c˜ao visual entre os trˆes modelos propostos podemos observar a Figura 6 que representa a evolu¸c˜ao mensal no ano de 2011 da s´erie observada e da s´erie prevista atrav´es de cada um dos trˆes modelos. O modelo com o efeito espacial acompanha claramente a tendˆencia da s´erie observada. J´a o modelo com apenas α0 teve dificuldade
para retornar as s´eries originais, isto indica uma dependˆencia espacial entre os casos de dengue.
Os mapas das Figuras 7 8 representam a probabilidade de n˜ao ocorrer nenhum caso
de dengue nos meses do ano de 2011. A probabilidade de ocorrˆencia de zero ´e maior nos munic´ıpios marcados com cores mais escuras.
Nas Figuras 9 e 10 podemos observar os mapas com os valores esperados dos casos de dengue para o ano de 2011. Quanto mais escura estiver a cor maior ser´a a quantidade de
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 40
casos de dengue. Tanto as Figuras com as probabilidades de zero quanto as Figuras com os valores esperados para o ano de 2011 deixaram claro que o modelo sugerido conseguiu captar a dependˆencia espacial dos casos de dengue no Rio de Janeiro.
Na Figura 11 temos a representa¸c˜ao de um mapa com os valores observados e outro
mapa com os valores esperados a partir do modelo selecionado no mˆes de Dezembro de
2011. Como podemos notar, as previs˜oes recuperaram a dependˆencia espacial entre os
vizinhos, assim como, o excesso de zeros.
Os resultados encontrados indicam que o ajuste de um modelo em dois est´agios ´e muito adequado na modelagem para dados de dengue que, tem como principais caracter´ısticas o excesso de zeros e a dependˆencia espacial.
Ao rodar os programas de todos os trˆes modelos, a convergˆencia se deu depois de
aproximadamente 300 itera¸c˜oes nos parˆametros θj,t e λj,t de forma semelhante `a relatada
em VELARDE (2000). Das 500 itera¸c˜oes realizadas, usamos 400 itera¸c˜oes como ”aqueci-mento”e 100 para gerar as amostras.
Todos os modelos propostos s˜ao muito complexos em termos computacionais e o
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 41
Figura 6: Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro entre Janeiro de 2011 a Dezembro de 2011 e os Valores Esperados usando os Modelos Propostos
(a) Angra dos Reis
(b) Nova Friburgo
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 42
Figura 7: Probabilidade de Zero de Janeiro de 2011 a Junho de 2011
(a) Janeiro (b) Fevereiro
(c) Mar¸co (d) Abril
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 43
Figura 8: Probabilidade de Zero de Julho de 2011 a Dezembro de 2011
(a) Julho (b) Agosto
(c) Setembro (d) Outubro
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 44
Figura 9: Valores Esperados para o N´umero de Casos Dengue de Janeiro de 2011 a Junho
de 2011
(a) Janeiro (b) Fevereiro
(c) Mar¸co (d) Abril
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 45
Figura 10: Valores Esperados para o N´umero de Casos Dengue de Julho de 2011 a
Dezem-bro de 2011
(a) Julho (b) Agosto
(c) Setembro (d) Outubro
4.4 Compara¸c˜ao dos Modelos e Previs˜ao 46
Figura 11: Mapas dos Valores Observados e Esperados para o mˆes de Dezembro de 2011
47
5
Conclus˜
ao
As an´alises descritivas feitas neste trabalho evidenciaram que os dados de dengue no Rio de Janeiro tem massa de probabilidade no ponto zero e indicam que os dados possuem uma dependˆencia espacial, sendo, ent˜ao, necess´ario o uso de um modelo espec´ıfico. Os resultados obtidos sugerem que a nossa proposta de usar a modelagem em dois est´agio ´e bastante apropriada na modelagem de quantidade de casos de dengue no Rio de Janeiro. Entretanto, os resultados expostos neste trabalho dependem da qualidade dos dados, caso exista subnotifica¸c˜ao seria necess´ario adicionar algum efeito aleat´orio no ajuste do modelo. O modelo selecionado para fazer os c´alculos dos valores esperados foi o modelo com
menor m´edia dos res´ıduos ao quadrado que, como observamos na Tabela 2, ´e o modelo
que considera apenas os efeitos espaciais nas m´edias do n´umero de casos de dengue. O modelo com a m´edia comum α0 teve dificuldade em retornar a m´edia de casos da doen¸ca
em munic´ıpios com muitos casos indicando que o modelo precisa de um efeito espacial entre os munic´ıpios.
Vale ressaltar que o modelo selecionado para fazer o c´alculo dos valores esperados n˜ao ´e o mais adequado, dado que o modelo n˜ao leva em considera¸c˜ao outras vari´aveis que podem estar relacionados com a quantidade de casos de dengue como, temperatura, precipita¸c˜ao pluviom´etrica e densidade demogr´afica.
Finalmente, sugerimos a utiliza¸c˜ao de um modelo como o proposto neste trabalho
para analisar dados espa¸co-temporais que, como no caso da dengue, apresentam ponto de massa de probabilidade no valor zero.
48
Referˆ
encias
[1] Arab, Ali; Wildhaber, Mark L.; Wilke, Christopher K. e Gentry, Casey N.(2008). Zero-Inflated Modeling of Fish Catch per Unit Area Resulting from Multiple Gears: Application to Channel Catfish and Shovelnose Sturgeon in the Missouri River. North American Journal of Fisheries Management 28: 1044-1058.
[2] Barreto, Maur´ıcio R. e Teixeira, Maria Gl´oria (2008).Dengue no Brasil: situa¸c˜ao epidemiol´ogica e contribui¸c˜oes para uma agenda de pesquisa. Estudos Avan¸cados 22 (64).
[3] Brasil, Minist´erio da Sa´ude (2001). Dengue: Instru¸c˜oes para Pessoal de Combate ao Vetor. Bras´ılia: MS/FUNASA.
[4] Famoye, Felix e Singh, Karan P. (2006). Zero-Inflated Generalizes Poisson Model with an Application to Domestic Violence Data. Journal of Data Sciense 4(2006), p. 117-130.
[5] Fernandes, Marcus Vinicius M. (2006). Modelos para Processos Espa¸co-Temporais
Inflacionados de Zeros. Disserta¸c˜ao de Mestrado - Universidade Federal do Rio de Janeiro - UFRJ.
[6] Feuerverger, A. (1979). On some methods of analysis for weather experiments. Biometrika Vol.66, No. 3, p. 655-658.
[7] Hoef, Jay M. Ver e Jansen, John K. (2007). Space-time zero-inflated count models of Harbor Seals.Environmetrics 2007; 18: 697-712.
[8] Minist´erio da Sa´ude (2005). Doen¸cas Infecciosas e Parasit´arias - Guia de Bolso/ Minist´erio da Sa´ude, Secretaria de Vigilˆancia em Sa´ude. 6ed. rev. Bras´ılia: Minist´erio da Sa´ude. p. 89-94.
[9] Sans´o, B. e Guenni, L. (1999). Venezuelan rainfall data analysed by using a Bayesian space-time model. Applied Statistics Vol. 48, Part 3, pp. 345-362.
[10] Souza, Luiz Jos´e de; Gomes, C´esar Ronald P.; Lopes, Antonio Carlos; Filho, Jo˜ao Tadeu D. S.; Souza, Thiago F. de; Cˆortes, Vitor A.; Neto, Carlos G. e Bastos, Diogo A. (2002). Aspectos cl´ınicos da dengue: novos conceitos. Moreira JR Editora.
[11] Velarde, Luis Guillermo C. (2000). Modelagem Espa¸co Temporal de Vari´aveis N˜ao Negativas com Ponto de Massa no Zero. Tese - Universidade Federal do Rio de Janeiro, COPPE/UFRJ.
49
ANEXO A -- Programa Utilizado para
Leitura do Mapa do Estado do
Rio de Janeiro com os N´
umero
de Casos de Dengue no Mˆ
es de
Janeiro de 2008
library(spdep) require(RColorBrewer) rj<-readShapePoly("rj_municipios.shp") rj.dados <- attr(rj,"data")##? rj.dados$indice <- 1:dim(rj.dados)[1] dados<-read.csv2(’Dengue_v2.csv’) attach(dados) rj.dados$NOME<-as.character(rj.dados$NOME) rj.dados<-merge(rj.dados,dados) rj.dados<-rj.dados[order(rj.dados$indice),] names(rj) rj[[4]]<-X2008.Jan# Mudando a palheta de cores
rw.colors<-colorRampPalette(c("bisque","brown"))
# carregando o pacote maptolls require(maptools)
mapa <- readShapeSpatial(file.choose())
Anexo A -- Programa Utilizado para Leitura do Mapa do Estado do Rio de Janeiro com os N´umero de Casos de Dengue no Mˆes de Janeiro de 2008 50
cortes<-cut(rj$V4,intervalos,include.lowest=TRUE) niveis<-levels(cortes)
cores<-rw.colors(length(levels(cortes))) levels(cortes)<-cores
#Plotando o mapa com legenda
plot(mapa,lwd=.1,axes=FALSE,col=as.character(cortes)) legend("topleft",niveis,fill=cores,bty="n",cex=0.6)
51
ANEXO B -- Programa em R Utilizado para
Estimar os Parˆ
ametros do
Modelo Completo via MCMC
#Carrega os dados e transforma em serie temporal
dados<-read.csv2(’Dengue_v2.csv’,h=T) attach(dados)
n<-60 #n de meses
m<-92 # n de municipios
############################################################## ######## VETORES DE QUANTIDADE DE MUNICIPIOS VIZINHOS ######## ############## E POSICAO DE TODOS OS VIZINHOS ################ ############################################################## num_vizinhos<-c(0,3,6,9,13,14,18,25,32,36,40,44,49,56,63,72,78,81,84, 88,93,95,101,106,112,119,123,129,133,138,144,149,155,163,164,169,171, 177,181,184,187,192,197,202,209,213,217,220,222,231,240,248,255,256, 260,271,272,279,282,284,289,292,295,299,304,309,312,314,321,326,332, 339,341,345,347,352,356,362,369,375,379,383,387,398,399,403,410,418, 423,428,431,439,443) posicao_viz<-c(40,53,65,14,32,70,6,28,78,52,55,77,88,12,3,12,28,78, 8,48,56,57,89,91,92,57,59,60,63,65,89,92,25,43,50,75,23,24,49,87,
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 52 15,33,46,90,5,6,20,28,65,78,27,29,49,64,83,85,86,2,31,32,33,70,71,76, 11,18,22,31,62,69,71,72,74,19,23,24,32,38,79,22,37,62,15,31,71, 16,24,80,84,12,37,49,67,83,52,88,15,17,37,62,69,87,10,16,24,38,87, 10,16,19,23,49,84,9,39,44,50,55,68,75,42,44,51,91,13,31,39,55,73,86, 3,6,12,78,13,27,41,73,85,40,51,57,65,68,82,14,15,18,33,71,2,14,16,70, 71,79,11,14,31,36,45,46,58,76,63,44,50,51,61,82,33,45,17,20,22,49, 67,87,16,23,79,87,25,27,55,1,30,61,29,48,73,81,85,7,26,51,57,91,9,47, 50,68,75,25,26,50,51,54,55,91,33,36,70,76,11,33,58,90,43,68,75,41,73, 10,13,20,24,37,83,84,86,87,9,25,35,43,44,51,61,68,82,26,30,35,42,44,50, 57,82,4,21,54,55,66,88,91,1,44,52,55,91,4,25,27,39,44,52,54,77,86,7,57, 92,7,30,42,51,56,65,92,33,46,90,8,60,63,8,59,63,89,35,50,82,15,22,37, 8,34,59,60,13,29,78,81,83,1,8,30,40,57,52,89,91,20,37,25,30,43,47,50, 75,82,15,22,71,79,87,2,14,16,32,45,76,14,15,18,31,32,69,79,15,74, 27,29,41,48,15,72,9,25,43,47,68,14,33,45,70,4,55,80,84,86,88,3,6,12,28, 64,81,83,16,32,38,69,71,87,19,77,84,88,41,64,78,85,30,35,51,61,68, 13,20,49,64,78,19,24,49,77,80,86,13,29,41,64,81,13,27,49,55,80,84, 10,22,23,37,38,49,69,79,4,21,52,77,80,7,8,60,66,91,11,46,58,7,26, 42,44,52,54,66,89,7,8,56,57) ########################################################## ########### GERAR VALORES PARA OS EFEITOS ESPACIAIS ###### ##########################################################
C<-matrix(0,nrow=m,ncol=n) D<-matrix(0,nrow=m,ncol=n)
postac<-matrix(0,nrow=m,ncol=n) postad<-matrix(0,nrow=m,ncol=n)
# gerando os efeitos espaciais C e D
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 53 for(j in 1:m){ C[j,1]<-rnorm(1,mean=0,sd=10) postac[j,1]<--(log(2*pi)/2)-(log(100)/2)-(C[j,1]^2)/(2*100) D[j,1]<-rnorm(1,mean=0,sd=10) postad[j,1]<--(log(2*pi)/2)-(log(100)/2)-(D[j,1]^2)/(2*100) } for(t in 2:n){ for(j in 1:m){ somac<-0 somaquac<-0 somad<-0 somaquad<-0 num_viz<-num_vizinhos[j+1]-num_vizinhos[j] for(k in (num_vizinhos[j]+1):(num_vizinhos[j+1])){ somac<-somac+C[posicao_viz[k],t-1] somaquac<-somaquac+(C[posicao_viz[k],t-1])^2 somad<-somad+D[posicao_viz[k],t-1] somaquad<-somaquad+(D[posicao_viz[k],t-1])^2 } medespac<-somac/num_viz varespac<-abs((somaquac-(somac^2)/num_viz)/num_viz) medespad<-somad/num_viz varespad<-abs((somaquad-(somad^2)/num_viz)/num_viz) if(varespac==0){ varespac<-10 } if(varespad==0){ varespad<-10 } C[j,t]<-rnorm(1,mean=medespac,sd=sqrt(varespac)) postac[j,t]<--(log(2*pi)/2)-(log(varespac/num_viz)/2)-num_viz* (((C[j,t]-medespac)^2)/(2*varespac)) D[j,t]<-rnorm(1,mean=medespad,sd=sqrt(varespad)) postad[j,t]<--(log(2*pi)/2)-(log(varespad/num_viz)/2)-num_viz*
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 54
(((D[j,t]-medespad)^2)/(2*varespad)) }
}
#num de meses com pelo menos um caso de dengue casosdengue<-0
#num total de casos de dengue num_casos<-0
#num dias com casos antecedidos por dias com casos casosant<-0 for(j in 1:m){ for(t in 2:n){ if(dados[j,t]!=0){ casosdengue<-casosdengue+1 num_casos<-num_casos+dados[j,t] if(dados[j,t-1]!=0){ casosant<-casosant+1 } } } } ############################################################## #################### valores iniciais ######################## ############################################################## alfa0_ant<-rnorm(1,-1,10) gama0_ant<-rnorm(1,0,10) gama1_ant<-rnorm(1,0,10) alfa0_par<--1 gama0_par<-0 gama1_par<-1
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 55
#valores iniciais para a posteriori para gama0 e gama1 postag0<--log(10)-(gama0_ant-gama0_par)^2/(2*100) postag1<--log(10)-(gama1_ant-gama1_par)^2/(2*100) postaa0<--log(10)-(alfa0_ant-alfa0_par)^2/(2*100) acumulac<-0 acumulad<-0 ################################################################### ####################### PROGRAMA PRINCIPAL ######################## ################################################################### interacao<-500 converge<-100 inter_iniciais<-interacao-converge tetas<-matrix(0,nrow=m,ncol=12) media_tetas<-matrix(0,nrow=m,ncol=12) lambdas<-matrix(0,nrow=m,ncol=12) media_lambdas<-matrix(0,nrow=m,ncol=12) soma_previsao<-matrix(0,nrow=m,ncol=12) for(i in 1:interacao){ print(i) indicado<-0 auxiliar<-0 valor_min<-0
#gerando proposta para gama0 postajuda<--1000000
contador<-0 busca<-100
while(indicado==0 & contador<=busca){ gama0_novo<-rnorm(1,gama0_par,10)
priog0<--log(10)-((gama0_novo-gama0_par)^2)/(2*100) #avaliando a posteriori para gama0
Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 56 postg0<-priog0+casosdengue*gama0_novo for(t in 2:n){ for(j in 1:m){ if(dados[j,t]==0){ if(dados[j,t-1]==0){ postg0<-postg0+log(1+exp(gama0_novo+C[j,t]-exp(alfa0_ant+D[j,t]))) -log(1+exp(gama0_novo+C[j,t])) }else{ postg0<-postg0+log(1+exp(gama0_novo+gama1_ant+C[j,t]-exp(alfa0_ant+D[j,t]))) -log(1+exp(gama0_novo+gama1_ant+C[j,t])) } }else{ if(dados[j,t-1]==0){ postg0<-postg0-log(1+exp(gama0_novo+C[j,t])) }else{ postg0<-postg0-log(1+exp(gama0_novo+gama1_ant+C[j,t])) } } } }
#testando valor proposto para gama0 if(postg0>postajuda){ valor_min<-min(0,postg0-postag0) if(log(runif(1))<valor_min){ indicado=1 } } contador<-contador+1 } #fim do while if(indicado==1){ gama0_ant<-gama0_novo postag0<-postg0 }