• Nenhum resultado encontrado

Modelagem para processos espaço-temporais com ponto de massa de probabilidade no zero: Um estudo sobre a dengue

N/A
N/A
Protected

Academic year: 2021

Share "Modelagem para processos espaço-temporais com ponto de massa de probabilidade no zero: Um estudo sobre a dengue"

Copied!
92
0
0

Texto

(1)

Bruna Melo Guimar˜

aes

Modelagem para Processos

Espa¸

co-Temporais com Ponto de Massa de

Probabilidade no Zero: Um Estudo Sobre a

Dengue

Niter´oi - RJ, Brasil Agosto de 2013

(2)

Universidade Federal Fluminense

Bruna Melo Guimar˜

aes

Modelagem para Processos

Espa¸

co-Temporais com Ponto de

Massa de Probabilidade no Zero:

Um Estudo Sobre a Dengue

Trabalho de Conclus˜ao de Curso

Monografia apresentada para obten¸c˜ao do grau de Bacharel em Estat´ıstica pela Universidade Federal Fluminense.

Orientador: Prof. Luis Guillermo Coca Velarde

Niter´oi - RJ, Brasil Agosto de 2013

(3)

Universidade Federal Fluminense

Bruna Melo Guimar˜

aes

Modelagem para Processos

Espa¸

co-Temporais com Ponto de Massa de

Probabilidade no Zero: Um Estudo Sobre a

Dengue

Monografia de Projeto Final de Gradua¸c˜ao sob o t´ıtulo

“Mod-elagem para Processos Espa¸co-Temporais com Ponto de Massa

de Probabilidade no Zero: Um Estudo Sobre a Dengue”,

de-fendida por Bruna Melo Guimar˜aes e aprovada em Agosto de

2013, na cidade de Niter´oi, no Estado do Rio de Janeiro, pela banca examinadora constitu´ıda pelos professores:

Prof. Dr. Luis Guillermo Coca Velarde Orientador Departamento de Estat´ıstica – UFF

Profa. Dra. Lumilla da Silva Viana Jacobson Departamento de Estat´ıstica – UFF

Prof. Dr. Leonardo Soares Bastos Funda¸c˜ao Oswaldo Cruz – Fiocruz

(4)

Guimarães, Bruna Melo

Modelagem para Processos Espaço-Temporais com Ponto de Massa

de Probabilidade no Zero: Um Estudo Sobre a Dengue / Bruna

Melo Guimarães; Luis Guillermo Coca Velarde, orientador. Niterói, 2013.

91 f. : il.

Trabalho de Conclusão de Curso (Graduação em Estatísticaa ) – Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2013.

1. Processo de Poisson. 2. Processos espaço-temporais. 3. Excesso de zeros. 4. Dengue. I. Velarde, Luis Guillermo Coca, orientador. II. Universidade Federal Fluminense. Instituto de Matemática e Estatística. III. Título.

(5)

Resumo

A dengue ´e uma doen¸ca viral causada pelo mosquito Aedes aegypti que pode ser de

curso benigno ou grave de acordo com a forma que se apresente. Os principais sintomas s˜ao: febre, cefaleia, dores musculares e articulares. A doen¸ca ´e mais frequente nos meses mais chuvosos. Entretanto, nos meses que n˜ao chove ou chove muito pouco, temos poucas ocorrˆencias de dengue ou at´e mesmo nenhuma, isto ´e, meses em que n˜ao s˜ao observados casos de dengue.

Os dados de casos de dengue dos munic´ıpios do Estado do Rio de Janeiro mostraram diversos meses com nenhum caso da doen¸ca. Este estudo tem como foco principal propor um modelo que considera processos espa¸co-temporais com excesso de zeros. Ser˜ao apre-sentados alguns trabalhos encontrados na literatura que lidam com o problema de excesso de zeros.

Uma das conclus˜oes que se chegou foi que o conjunto de dados de dengue no Estado

do Rio de Janeiro realmente necessita do uso de um modelos espec´ıfico. Notou-se, ent˜ao, que a utiliza¸c˜ao de um modelo que considera dados inflacionados de zero apresenta bons resultados.

(6)

Agradecimentos

Agrade¸co em primeiro lugar, a Deus que me iluminou em toda esta longa caminhada. Aos meus pais, Marta e Geremias, irm˜ao, Felipe, e a toda minha fam´ılia que de forma especial e carinhosa me deram for¸ca e coragem.

Ao meu amigo e companheiro Victor Eduardo que sempre acreditou em mim e que me ajudou de todas as formas poss´ıveis.

Aos meus amigos de estudo Juliana, Fabio, Bruno, Evandro e Guilherme que come¸caram

essa caminhada comigo e que me incentivaram `as vezes sem perceberem.

As minhas amigas de sempre Suelen, Taila, Claudiane e Joseane pelo carinho, pelo apoio, pela compreens˜ao e pelas broncas.

Aos professores da UFF que foram t˜ao importantes na minha vida acadˆemica e em

especial ao Prof. Dr. Luis Guillermo Coca Velarde pela paciˆencia na orienta¸c˜ao e incentivo que tornaram poss´ıvel a conclus˜ao desta monografia.

A todos os amigos de curso na UFF que dividiram comigo seus estudos, suas d´uvidas, seus sofrimentos e seus sonhos.

(7)

Sum´

ario

Lista de Figuras Lista de Tabelas 1 Introdu¸c˜ao p. 9 1.1 Objetivos . . . p. 12 1.2 Fonte de Dados . . . p. 12

2 Alguns Modelos para Dados com Excesso de Zero p. 14

2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica . . . p. 14

2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de

Prob-abilidade no Zero . . . p. 17 2.3 Casos de Estudo . . . p. 19

2.3.1 Modelagem para Dados de Violˆencia Dom´estica . . . p. 19

2.3.2 Modelagem para o Estudo de Focas Arrastadas para Fora do Gelo

Glacial no Alaska . . . p. 20

2.3.3 Modelagem de Excesso de Zeros na Captura de Peixes . . . p. 22

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro p. 24

4 Resultados e Discuss˜ao p. 31

4.1 Modelo Proposto . . . p. 31 4.2 Distribui¸c˜oes a Priori dos Parˆametros . . . p. 34 4.3 Estima¸c˜ao dos Parˆametros . . . p. 34 4.4 Compara¸c˜ao dos Modelos e Previs˜ao . . . p. 39

(8)

5 Conclus˜ao p. 47

Referˆencias p. 48

Anexo A -- Programa Utilizado para Leitura do Mapa do Estado do Rio

de Janeiro com os N´umero de Casos de Dengue no Mˆes de Janeiro

de 2008 p. 49

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do

Modelo Completo via MCMC p. 51

Anexo C -- Programa em R Utilizado para Estimar os Parˆametros do

Modelo com M´edia Comum via MCMC p. 65

Anexo D -- Programa em R Utilizado para Estimar os Parˆametros do

(9)

Lista de Figuras

1 Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Cabo

Frio . . . p. 25

2 Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Mag´e p. 25

3 Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro

entre Janeiro de 2007 a Dezembro de 2011 . . . p. 27

4 Evolu¸c˜ao da Dengue de Janeiro de 2008 a Junho de 2008 no Estado do

Rio de Janeiro . . . p. 29

5 Evolu¸c˜ao da Dengue de Julho de 2008 a Dezembro de 2008 no Estado do

Rio de Janeiro . . . p. 30

6 Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro

entre Janeiro de 2011 a Dezembro de 2011 e os Valores Esperados usando

os Modelos Propostos . . . p. 41

7 Probabilidade de Zero de Janeiro de 2011 a Junho de 2011 . . . p. 42

8 Probabilidade de Zero de Julho de 2011 a Dezembro de 2011 . . . p. 43

9 Valores Esperados para o N´umero de Casos Dengue de Janeiro de 2011

a Junho de 2011 . . . p. 44

10 Valores Esperados para o N´umero de Casos Dengue de Julho de 2011 a

Dezembro de 2011 . . . p. 45

11 Mapas dos Valores Observados e Esperados para o mˆes de Dezembro de

(10)

Lista de Tabelas

1 Quantidade de Zeros em cada Munic´ıpio por Ano . . . p. 26

(11)

9

1

Introdu¸

ao

A dengue ´e uma doen¸ca infecciosa febril aguda, epidˆemica ou endˆemica, transmitida pelo mosquito Aedes aegypti e que ocorre principalmente nas ´areas tropicais e subtropicais do mundo, inclusive no Brasil. O Minist´erio da Sa´ude descreve o Aedes aegypti como sendo de cor escura e com listras brancas no corpo todo, entretanto apenas a fˆemea do mosquito

transmite a doen¸ca e costuma picar durante o dia, nas primeiras horas da manh˜a e ao

anoitecer (BRASIL, 2001). O v´ırus da doen¸ca persiste na natureza atrav´es do ciclo homem - mosquito - homem, isto ´e, a fˆemea do mosquito se contamina ao picar um indiv´ıduo

infectado tornando-se capaz de transmitir o v´ırus a outro indiv´ıduo (MINIST´ERIO DA

SA ´UDE, 2005).

O agente da dengue ´e o arbov´ırus do gˆenero Flaviv´ırus que pertence `a fam´ılia Fa-vilidade com quatro sorotipos conhecidos: DEN-1, DEN-2, DEN-3 e DEN-4. A partir da infec¸c˜ao por um deles tem-se imunidade permanente para o mesmo sorotipo.

Geralmente, a dengue ´e uma doen¸ca de evolu¸c˜ao benigna, mas pode evoluir ao ´obito (MARZOCHI 1991). ´E uma doen¸ca de notifica¸c˜ao compuls´oria e tem um grande impacto sobre a sa´ude p´ublica no Brasil. Devido ao n´umero cada vez maior de casos, a dengue tem se manifestado de diferentes formas e gravidades.

A dengue pode ser, ent˜ao, classificada de acordo com sua forma de apresenta¸c˜ao, como:

1. Forma Assintom´atica

N˜ao apresenta sintomas apesar do indiv´ıduo ter sido infectado pelo v´ırus. 2. Dengue Cl´assica (DC)

O quadro cl´ınico inicia-se abruptamente com febre alta (39o a 40oC), cefaleia, dores musculares e articulares, n´auseas e vˆomitos. Podem ocorrer algumas manifesta¸c˜oes hemorr´agicas e dura cerca de 5 a 7 dias.

(12)

1 Introdu¸c˜ao 10

Os sintomas s˜ao parecidos com os da DC, com febre intensa (40oa 41oC) que persiste por at´e 7 dias, evoluindo para manifesta¸c˜oes hemorr´agicas.

4. S´ındrome do Choque da Dengue (SCD)

Situa¸c˜ao de importante gravidade que surge, geralmente entre o 3o e o 7o dia de

doen¸ca. O choque ´e consequˆencia do aumento da permeabilidade vascular.

A ocorrˆencia das formas hemorr´agicas da dengue pode ser explicada pela presen¸ca de anticorpos por consequˆencia de infec¸c˜oes por distintos sorotipos do v´ırus. Sendo assim, com a presen¸ca de anticorpos de outros sorotipos, a resposta imunol´ogica do indiv´ıduo seria ampliada na infec¸c˜ao seguinte (BARRETO, 2008).

A dengue ´e mais comum nas grandes cidades, onde existe maior concentra¸c˜ao popula-cional. Os locais prop´ıcios ao desenvolvimento desses mosquitos s˜ao os focos de ac´umulo de ´

agua, principalmente se esta estiver limpa e parada. Segundo o Minist´erio da Sa´ude, 70% dos casos de dengue no nosso pa´ıs ocorrem de Janeiro a Maio, devido a maior ocorrˆencia de chuvas e aumento da temperatura.

Sendo assim, a doen¸ca ´e mais comum nos meses que chove mais que, aqui no Brasil,

s˜ao nas esta¸c˜oes mais quentes. Entretanto, surge o problema dos meses que n˜ao chove ou chove muito pouco e que, por consequˆencia, n˜ao existem casos de dengue. A indaga¸c˜ao que surge ´e como estudar uma doen¸ca cujo n´umero de casos, em diversos meses, ´e igual a zero. Temos, ent˜ao, o problema de excesso de zeros, que ´e a principal motiva¸c˜ao para este estudo.

Este trabalho consiste de um estudo espa¸co-temporal dos casos de dengue nos mu-nic´ıpos do Estado do Rio de Janeiro no per´ıodo de Janeiro de 2007 a Dezembro de

2011. A s´erie mensal do total de casos de dengue em cada munic´ıpio do Estado foi

obtida atrav´es do site do Sistema ´Unico de Sa´ude - DataSUS (Endere¸co Eletrˆonico: http://www2.datasus.gov.br/DATASUS/index.php).

Apesar de n˜ao haver dados faltantes no per´ıodo de estudo, foi poss´ıvel verificar que em diversos meses n˜ao se tiveram casos de dengue, ou seja, existem muitos meses em que

foram observados zero casos de dengue. Por´em, quando se tem um conjunto de dados

com muitos zeros, a an´alise deve ser tratada de maneira especial.

Estudos j´a foram desenvolvidos considerando o ponto de massa de probabilidade no

zero e alguns ser˜ao citados neste trabalho com o intuito de serem usados como ponto

(13)

1 Introdu¸c˜ao 11

No desenvolvimento do seu trabalho sobre processos espa¸co-temporais inflacionados

de zero, FERNANDES (2006) citou como exemplo dados de estudos epidemiol´ogicos com

evolu¸c˜ao temporal que s˜ao espacialmente referenciados, e, al´em disso, tem ponto de massa de probabilidade no zero, isto ´e, tem grande parte de seus dados igual a valor zero. A contagem da ocorrˆencia de determinada doen¸ca epidˆemica, pode conter excesso de zeros, pois existem per´ıodos em que se observam grandes n´umeros de casos, e outros per´ıodos em que existem poucos ou mesmo nenhum caso.

No estudo sobre precipita¸c˜ao pluviom´etrica, VELARDE (2000) faz referˆencia a algu-mas abordagens utilizadas na modelagem de chuva. Como por exemplo, a modelagem estat´ıstica de S´eries Temporais para o caso espacial, Cadeias de Markov, t´ecnicas de an´alises de dados espacialmente cont´ınuos e a abordagem Bayesiana usando efeitos autor-regressivos condicionais (CAR).

A precipita¸c˜ao pluviom´etrica semanal no Estado de Goi´as teve o valor zero como ponto de massa de probabilidade, o que impossibilitou a aplica¸c˜ao das metodologias citadas anteriormente. Isso porque as abordagens mencionadas atribuem distribui¸c˜oes conheci-das para a vari´avel de interesse sem necessariamente considerar massa de probabilidade diferenciada para o valor zero. Dois trabalhos tentaram contornar esse problema: o de

FEUERVERGER (1979) que modela a precipita¸c˜ao pluviom´etrica considerando dias com

e sem chuva e o de SANS ´O e GUENNI (1999) que utiliza a distribui¸c˜ao normal truncada. Alguns trabalhos contaram tamb´em com uma aplica¸c˜ao desses modelos como ´e o caso

de FAMOYE e SINGH (2006) que, no artigo sobre a violˆencia dom´estica na cidade de

Portland, no Oregon, no per´ıodo de 1996 a 1997, tentou contornar o problema de excesso de observa¸c˜oes iguais a zero utilizando o modelo Binomial inflado de zeros e modelo de Poisson inflado de zeros.

HOEP e JANSEN (2007) utilizaram o modelo ZIP (do inglˆes Zero Inflated Poison)

e inclu´ıram efeitos aleat´orios para modelar os dados sobre focas arrastadas para fora do

Gelo Glacial, no Alaska. O n´umero de focas arrastadas para fora foi contado em cada

c´elula em cada per´ıodo de tempo, gerando um total de 2489 observa¸c˜oes, entretanto, mais de 50% delas foram iguais a zero.

ARAB et al. (2008) tamb´em utilizaram o modelo ZIP para tratar os dados de captura

de peixes com diversos equipamentos de pesca no rio Missouri. Os dados continham 1477 observa¸c˜oes com grande propor¸c˜ao de zeros.

(14)

1.1 Objetivos 12

vamos verificar no decorrer deste trabalho, os dados de dengue do Estado do Rio de Janeiro apontam diversas observa¸c˜oes iguais a zero, ou seja, muitos meses n˜ao tiveram casos de dengue. Mas tamb´em foi poss´ıvel observar diversos meses com muitos casos da doen¸ca.

Neste trabalho sobre o estudo da dengue, pretende-se propor um modelo que se aplique ao conjunto de dados de dengue dada sua caracter´ıstica de ponto de massa de proba-bilidade no zero. Num contexto bayesiano, foram obtidas as distribui¸c˜oes a posteriori condicionais completas a partir das quais foi poss´ıvel fazer estima¸c˜oes para os parˆametros do modelo.

1.1

Objetivos

O presente trabalho tem como principais objetivos desenvolver um estudo espa¸co-temporal sobre a dengue e aplicar os modelos propostos por VELARDE (2000) e FER-NANDES (2006) sobre o estudo dos processos espa¸co-temporais com massa de

probabi-lidade no valor zero no estudo da evolu¸c˜ao da dengue de Janeiro de 2007 a Dezembro

de 2011 nos 92 munic´ıpios do Estado do Rio de Janeiro. Os modelos mencionados ser˜ao

explorados com mais detalhes posteriormente.

Pretende-se com este trabalho propor uma modelagem para dados espa¸co-temporais com ponto de massa de probabilidade no zero. A modelagem que se pretende utilizar

na elabora¸c˜ao deste trabalho ´e essencialmente a modelagem proposta por FERNANDES

(2006) no seu trabalho sobre processos espa¸co-temporais inflacionados de zero.

Em doen¸cas epidemiol´ogicas ´e muito comum haver per´ıodos com muitos casos da

doen¸ca. Em contra partida, existem per´ıodos em que n˜ao h´a casos da doen¸ca. Isso

porque existe uma grande variabilidade dos dados. Os modelos para vari´aveis espaciais n˜ao podem prever essa variabilidade, isto ´e, n˜ao consideram a existˆencia de massa de probabilidade no ponto zero, o que motivou o desenvolvimento do presente trabalho.

1.2

Fonte de Dados

Os dados utilizados neste trabalho foram obtidos atrav´es do site do DataSUS (http:

//www2.datasus.gov.br/DATASUS/index.php), onde ´e poss´ıvel tamb´em encontrar dados

de outras doen¸cas al´em da dengue. O site disponibiliza n´umeros de casos de dengue por local de interna¸c˜ao e por local de residˆencia. Entretanto, como este estudo tem, tamb´em, como finalidade aplicar uma an´alise espacial, os dados selecionados para an´alise foram de

(15)

1.2 Fonte de Dados 13

n´umero de casos de dengue por local de residˆencia. O n´umero de casos de dengue foram registrados mensalmente nos 92 munic´ıpios do Estado do Rio de Janeiro no per´ıodo de Janeiro de 2007 a Dezembro de 2011.

(16)

14

2

Alguns Modelos para Dados

com Excesso de Zero

Neste cap´ıtulo ser˜ao apresentados alguns trabalhos encontrados na literatura que li-dam com o problema de excesso de zeros, ainda que as ´areas de aplica¸c˜ao sejam muito diferentes.

2.1

Modelagem para Precipita¸

ao Pluviom´

etrica

A primeira proposta encontrada na literatura que considera o ponto de massa de probabilidade no zero ´e a de FEUERVERGER (1979) que consiste em atribuir 0 `a proba-bilidade do n´ıvel de chuva ser negativo, 1- θ de ser igual a zero e θ de ser positivo, assim θ ´e a probabilidade de chuva e p(y) ´e a densidade condicional `a ocorrˆencia de chuva. Ent˜ao, se tivermos n observa¸c˜oes, teremos a fun¸c˜ao de verossimilhan¸ca:

L(µ, ν) = Y D {1 − θ(Xi, µ)} Y R θ(Xi, µ)p(yi, Xi, ν)

onde o produt´orio para as observa¸c˜oes de dias sem chuva est´a em D, o produt´orio para as observa¸c˜oes com chuva est´a em R e Xi s˜ao regressores conhecidos. Assumindo que µ

e ν s˜ao independentes, a fun¸c˜ao de verossimilhan¸ca poderia ser expressa por L(µ, ν) = L1(µ)L2(ν), uma parte relacionada a acorrˆencia de chuva e outra parte relacionada aos

n´ıveis de chuva. Por´em, esse modelo n˜ao leva em considera¸c˜ao a dependˆencia espacial.

A outra proposta, que aparece em SANS ´O e GUENNI (1999) sugere acumular os

n´ıveis de chuva em um per´ıodo de tempo fixo utilizando uma fun¸c˜ao de correla¸c˜ao

expo-nencialmente decrescente que depende da distˆancia entre os pontos observados. Assim,

(17)

2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica 15 yj,t = ( ωβt j,t, ωj,t > 0 0, ωj,t ≤ 0

onde βt > 0 e ωj,t ´e uma vari´avel com distribui¸c˜ao normal.

Esta modelagem nos permite estimar as probabilidades de ter um per´ıodo de chuva ou sem chuva, e ainda, permite estimar os n´ıveis de chuva nos locais observados e n˜ao observados.

No trabalho sobre precipita¸c˜ao pluviom´etrica, VELARDE (2000) usou dados di´arios da quantidade de chuva em cento e vinte esta¸c˜oes no estado de Goi´as durante quinze anos. Vinte e cinco dessas esta¸c˜oes continham dados de quinze anos consecutivos e um pouco mais de cem esta¸c˜oes tinham dados de seis anos consecutivos.

O per´ıodo de observa¸c˜ao utilizado para a an´alise foi de sete dias, sendo assim, os dados di´arios foram transformados em dados semanais, j´a que o uso de dados di´arios ´e

muito impreciso. Mesmo assim, ainda foi poss´ıvel observar v´arias semanas sem chuva.

Vale ressaltar que as s´eries individuais de cada esta¸c˜ao pluviom´etrica desse Estado apre-sentaram um comportamento sazonal.

A an´alise dos histogramas dos n´ıveis de chuva das esta¸c˜oes com observa¸c˜oes diferentes

de zero sugeriu distribui¸c˜oes como as Exponencial, Lognormal, Gama e Weibull. Para

decidir qual dessas distribui¸c˜oes melhor se ajustavam aos dados foram feitos dois teste de hip´oteses: o de Kolmogorov-Smirnov e, em seguida, o das hip´oteses separadas de Cox. Realizados os testes, verificou-se que a distribui¸c˜ao que melhor se ajustou aos dados foi a Exponencial.

No trabalho sobre precipita¸c˜ao pluviom´erica, tamb´em foi utilizada a modelagem por Cadeia de Markov. Para a utiliza¸c˜ao desse tipo de modelagem, deve-se considerar que a ocorrˆencia de chuva depende apenas do tempo, ou seja, n˜ao sofre influˆencias de outros

fatores. Esse tipo de modelagem considera apenas se houve chuva ou n˜ao, sem levar em

considera¸c˜ao os n´ıveis de chuva. Entretanto, VELARDE(2000) observou que algumas

esta¸c˜oes tiveram matrizes de transi¸c˜ao similares, o que significa que existe um padr˜ao espacial na ocorrˆencia de chuva.

Outra abordagem proposta por VELARDE (2000) foi a modelagem em dois est´agios:

o primeiro est´agio consiste em verificar as chances de se obter n´ıveis de chuva diferentes de zero e o segundo consiste em modelar os n´ıveis de chuva dado que no local foi observado n´ıvel de chuva diferente de zero. Essa ´e uma alternativa que permite considerar tanto os

(18)

2.1 Modelagem para Precipita¸c˜ao Pluviom´etrica 16

efeitos espaciais como os temporais. ´E importante observar que essa abordagem n˜ao se aplica apenas aos dados de chuva, mas tamb´em a qualquer vari´avel que possui ponto de massa de probabilidade no zero.

Digamos que temos uma vari´avel y com ponto de massa de probabilidade no zero,

uma fun¸c˜ao indicadora pode ser definida da seguinte forma:

I(yj,t > 0) =

(

1, se yj,t > 0

0, se yj,t = 0

(2.1) onde j s˜ao os locais (j = 1, ..., m) e t ´e o tempo (t = 1, ..., n). Essa vari´avel tem distribui¸c˜ao de Bernoulli, onde a probabilidade de ocorrˆencia de chuva no local j e no instante t ´e θj,t = P (I(yj,t > 0) = 1) que pode ser modelada atrav´es da fun¸c˜ao de liga¸c˜ao logit :

log θj,t 1 − θj,t

= Xj,t0 αj,t+ cj,t

onde cj,t ´e o efeito espacial que segue um modelo a priori CAR (autorregressivos

condi-cionais), Xj,t ´e o vetor de covari´aveis e αj,t ´e o correspondente vetor de parˆametros.

Para os coeficientes de regress˜ao αj,t podemos definir prioris normais e para o efeito

espacial cj,t tem-se que:

p(cj,t|...) ∝ 1 κ n×m 2 c exp ( − 1 2κc X i∼j (cj,t− ci,t)2 ) , cj,t ∈ R,

onde κc ´e desconhecido para o qual pode ser especificada como priori uma distribui¸c˜ao

Gama inversa.

O segundo est´agio dessa abordagem ´e modelar os n´ıveis da vari´avel nos locais onde o n´ıvel observado foi diferente de zero. Ent˜ao, podemos definir a fun¸c˜ao de liga¸c˜ao para o n´ıvel m´edio da vari´avel:

logλ−1j,t = Zj,t0 βj,t+ dj,t,

onde λ−1j,t ´e o n´ıvel m´edio da vari´avel sem considerar os zeros, Zj,t´e um vetor de covari´aveis,

βj,t ´e o vetor de coeficientes de regress˜ao e dj,t ´e o efeito espacial. Para os coeficientes de

regress˜ao βj,t podem ser assumidas prioris normais e para o efeito espacial dj,t tem-se a

(19)

2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de Probabilidade no Zero17 p(dj,t|...) ∝ 1 κ (n×m) 2 d exp ( − 1 2κd X i∼j (dj,t− di,t)2 ) , dj,t ∈ R

Agora, ser´a definida a verossimilhan¸ca de vari´aveis com ponto de massa no zero. Como foi mencionado anteriormente, a fun¸c˜ao indicadora dos n´ıveis de chuva maiores que zero segue uma distribui¸c˜ao de Bernoulli com parˆametro θj,t, logo,

p(I(yj,t > 0)|θj,t) =

(

θj,t se yj,t > 0

1 − θj,t se yj,t = 0.

(2.2)

No caso de dados de chuva foi dito tamb´em que os n´ıveis de chuva diferentes de zero seguem uma distribui¸c˜ao Exponencial com m´edia λ−1j,t, ent˜ao,

p(yj,t|λj,t) =

(

λj,texp(−λj,tyj,t) se yj,t > 0

0 caso contr´ario. (2.3)

A densidade para a quantidade de chuva pode ser dada, ent˜ao, pela mistura das

fun¸c˜oes 2.2 e 2.3. Isto ´e,

p(yj,t|θj,t, λj,t) =

(

θj,tλj,texp(−λj,tyj,t) se yj,t > 0

1 − θj,t se yj,t = 0

gerando a seguinte fun¸c˜ao de verossimilhan¸ca:

L(θj,t, λj,t; yj,t) = n Y t=1 m Y j=1 (1 − θj,t)1−I(yj,t>0)θ I(yj,t>0) j,t λ I(yj,t>0) j,t exp(−λj,tyj,t)

Com L(.) e as distribui¸c˜oes a priori j´a definidas VELARDE (2000) calculou as dis-tribui¸c˜oes a posteriori e, em seguida, estimou os parˆametros desse modelo via Monte Carlo em Cadeias de Markov (MCMC).

2.2

Modelos para Processos Espa¸

co-Temporais com

Ponto de Massa de Probabilidade no Zero

FERNANDES (2006) desenvolveu seu trabalho com objetivo de modelar dados com duas caracter´ısticas em especial: a dependˆencia espa¸co-temporal e o excesso de zeros. Baseado em algumas ideias propostas no trabalho de VELARDE (2000), FERNANDES

(20)

2.2 Modelos para Processos Espa¸co-Temporais com Ponto de Massa de Probabilidade no Zero18

(2006) trata o problema de excesso de zeros de maneira mais geral, desenvolvendo um modelo que pode ser aplicado em vari´aveis discretas, mistas e cont´ınuas.

No estudo de doen¸cas epidˆemicas, por exemplo, existem ´epocas em que o n´umero de casos ´e maior do que em outras ´epocas. Ou ainda, ´epocas em que n˜ao se observa casos da doen¸ca. Quando existe um excesso de valores iguais a zero, a super dispers˜ao faz com que a variabilidade dos dados seja t˜ao grande que a pr´opria distribui¸c˜ao utilizada n˜ao pode

prever. Uma classe de modelos muito utilizada para modelar esse tipo de dados s˜ao os

chamados modelos de Poisson com zero inflado.

Com intuito de contornar o problema de excesso de zeros, FERNANDES (2006) uti-lizou uma mistura de distribui¸c˜oes. Isso pode ser feito da seguinte maneira: primeiro usando a distribui¸c˜ao de Bernoulli com probabilidade 1 − θ de obtermos um valor igual a zero e, em seguida, com probabilidade θ, usamos um valor da distribui¸c˜ao p(y|.). Temos, considerando que em dados de contagem as vari´aveis s˜ao n˜ao-negativas, o seguinte modelo para yj,t: p(yj,t|θj,t, λj,t) = ( θj,tp(yj,t|λj,t) se yi,t > 0 (1 − θj,t) + θj,tp(yj,t = 0|λj,t) se yj,t = 0. (2.4)

Sendo assim, a probabilidade de se obter um valor igual a zero que n˜ao ´e da distribui¸c˜ao de Poisson ´e 1 − θj,t e a probabilidade de se obter um valor da distribui¸c˜ao de Poisson ´e

θj,t.

Agora, precisamos introduzir as covari´aveis e aplicar estruturas aos parˆametros θj,t e

λj,t. A fun¸c˜ao de liga¸c˜ao para o parˆametro da distribui¸c˜ao de Bernoulli para este caso ´e

dada por:

log θj,t 1 − θj,t

= F1j,t0 γj,t+ zj,t

onde F1j,t0 s˜ao as covari´aveis, γj,t s˜ao seus respectivos coeficientes de regress˜ao e zj,t s˜ao os

efeitos espaciais.

Para a distribui¸c˜ao p(yj,t|λj,t) temos a seguinte fun¸c˜ao de liga¸c˜ao:

g(E(yj,t|λj,t)) = g(λj,t) = F2j,t0 ρj,t+ sj,t,

onde F2j,t0 s˜ao as covari´aveis que podem ou n˜ao ser iguais as de F1j,t0 , ρj,ts˜ao seus respectivos

(21)

2.3 Casos de Estudo 19

A fun¸c˜ao de verossimilhan¸ca nesse caso ´e dada por:

L(θj,t, λj,t; yj,t) = n Y t=1 m Y j=1

[(1−θj,t)+θj,tp(yj,t = 0|λj,t)]1−I(yj,t>0)[θj,tp(yj,t|λj,t)]I(yj,t>0). (2.5)

onde I(yj,t > 0 ´e a Fun¸c˜ao Indicadora defina em 2.2.

Por´em, em 2.5 n˜ao existe independˆencia entre os parˆametros θj,t e λj,t. Sendo

as-sim, usou-se a vari´avel Wj,t para obter uma verossimilhan¸ca aumentada. Essa vari´avel ´e

chamada indicadora pois indica se o evento [yj,t = 0] veio de uma distribui¸c˜ao de Bernoulli

ou n˜ao. Temos ent˜ao, uma nova verossimilhan¸ca:

L(θj,t, λj,t; yj,t; wj,t) = n Y t=1 m Y j=1 θ1−wj,t j,t (1 − θj,t)wj,t n Y t=1 m Y j=1 p(yj,t|λj,t)1−wj,t.

Podemos notar que agora temos uma verossimilhan¸ca que facilita os procedimentos de inferˆencia que poder˜ao ser usados, pois agora os parˆametros θj,t e λj,t s˜ao independentes.

2.3

Casos de Estudo

2.3.1

Modelagem para Dados de Violˆ

encia Dom´

estica

No artigo sobre violˆencia dom´estica, FAMOUYE e SINGH (2006) utilizaram o modelo de regress˜ao de Poisson generalizada. A vari´avel violˆencia foi definida como o n´umero de comportamentos violentos sofridos pela v´ıtima. Nesse tipo de conjunto de dados chamados

dados de contagem tamb´em pode ocorrer excesso de observa¸c˜oes iguais a zero. Essa

caracter´ıstica, afirmam os autores, pode ser explicada pela super dispers˜ao dos dados. O artigo menciona o fato dessa super dispers˜ao possuir a tendˆencia de aumentar a propor¸c˜ao de zeros e quando existem muitos zeros relativos `a suposi¸c˜ao de Poisson, a regress˜ao binomial negativa e a regress˜ao de Poisson generalizada melhoram o ajuste dos dados.

Para o caso de dados de violˆencia dom´estica, foi testado se a quantidade de zeros era muito grande para que o modelo de Poisson generalizada fosse bem ajustado.

A vari´avel resposta, para este caso, ´e o n´umero de comportamentos violentos sofridos pela v´ıtima e as vari´aveis independentes utilizadas no modelo s˜ao tais como grau de escolaridade, situa¸c˜ao de emprego e renda. O modelo de regress˜ao de Poisson generalizada

(22)

2.3 Casos de Estudo 20 ´e dado por: p(yi|µi, α) =  µi 1 + αµi yi (1 + yi)yi−1 yi! exp −µi(1 + αyi) 1 + αµi  , yi = 0, 1, 2, ... (2.6)

onde µi = µi(xi) = exp(P xijβj), xi = (xi1= 1, xi2, ..., xik) ´e a i -´esima linha da matriz de

covari´aveis X e βββ = (β1, β2, ..., βk) ´e um vetor de parˆametros desconhecidos com k colunas.

A m´edia de yi ´e dada por µi(xi) e a variˆancia de yi ´e dada por V (yi|xi) = µi(1 + αµi)2.

No modelo descrito em 2.6, α ´e chamado de parˆametro de dispers˜ao. Quando α = 0, o modelo se reduz ao modelo de Poisson. Quando α < 0, o modelo representa dados com pequena dispers˜ao. E quando α > 0, o modelo representa dados com super dispers˜ao.

O modelo de regress˜ao de Poisson generalizado com excesso de zeros ´e definido como:

p(Y = yi|xi, zi) =

(

ϕi+ (1 − ϕi)p(yi = 0|µi, α) se yi = 0

(1 − ϕi)p(yi|µi, α) se yi > 0

(2.7) onde p(yi|µi; α), yi = 0, 1, 2, ... ´e dado pelo modelo descrito em 2.6 e 0 < ϕi < 1.

No modelo 2.7, as fun¸c˜oes µi = µi(xi) e ϕi = ϕi(zi) satisfazem log(µi) = k P i=1 xijβj e logit(ϕi) = log(ϕi[1 − ϕi]−1) = p P i=1

zijδj, onde zi = (zi1 = 1, zi2, ..., zip) ´e a i -´esima linha

da matriz de covari´aveis Z e δδδ = (δ1, δ2, ..., δp) ´e um vetor de parˆametros com p colunas.

Esse artigo foi desenvolvido considerando um modelo de regress˜ao o que n˜ao ´e o nosso caso, j´a que n˜ao contamos com covari´aveis. Por´em, o artigo foi muito ´util para o

entendimento de dados de contagem com excesso de zeros que ´e o tipo de dados que se

trata quando falamos em n´umero de casos de uma doen¸ca.

2.3.2

Modelagem para o Estudo de Focas Arrastadas para Fora

do Gelo Glacial no Alaska

HOEF e JANSEN (2007) usaram o modelo de Poisson inflado de zeros (ZIP) para desenvolver um estudo sobre as focas arrastadas para fora do Gelo Glacial no Alaska. Esse modelo se aplicou muito bem aos dados j´a que dados ambientais geralmente s˜ao espa¸co-temporais e tamb´em possuem muitos zeros. A ´area de estudo foi dividida em c´elulas (j ) e cada uma delas foi observada em 18 per´ıodos de tempo diferentes (t ). Para cada c´elula e para cada per´ıodo de tempo foi contado o n´umero de focas arrastada para fora do Gelo Glacial. Assim como o trabalho de FAMOUYE e SINGH (2006), esse trabalho utilizou

(23)

2.3 Casos de Estudo 21

algumas covari´aveis.

O modelo de regress˜ao espa¸co-temporal ZIP pode ser constru´ıdo usando efeitos au-toregressivos condicionais (CAR) e efeitos auau-toregressivos de primeira ordem (AR(1)). O modelo de regress˜ao ZIP ´e dado por:

Zj,t|Yj,t =

(

0 se Yj,t = 0,

P ois(λj,t) se Yj,t = 1

onde P ois(λj,t) ´e uma vari´avel aleat´oria com distribui¸c˜ao de Poisson condicionalmente

independente com m´edia λj,t e Yj,t ´e uma vari´avel aleat´oria com distribui¸c˜ao de Bernoulli

com m´edia pj,t para o tempo (t ) na localiza¸c˜ao espacial (j ). Eles usaram fun¸c˜oes de

liga¸c˜ao para relacionar as m´edias dessas distribui¸c˜oes com um modelo linear misto: log(λj,t) = νi+ x0j,tβ + j,t,

logit(pj,t) = µi+ x0j,tα + δj,t,

onde logit(a) = 1−aa , νt e µt s˜ao as m´edias em cada per´ıodo de tempo, β e α s˜ao vetores

de parˆametros da regress˜ao e xj,t s˜ao as covari´aveis do modelo. Os erros aleat´orios j,t e

δj,t foram assumidos espacialmente correlacionados para o tempo fixo t. Foram atribu´ıdas

distribui¸c˜oes a priori normais para esses efeitos em cada um dos per´ıodos: t ∼ N (0, σ2(I − ρC−1)M)

δt∼ N (0, σ2δ(I − ρδC−1)M)

onde cada linha de C cont´em zeros exceto para as colunas que indicam um vizinho e os

pesos s˜ao os n´umeros de vizinhos para essa amostra. A matriz M ´e uma matriz diagonal onde os elementos da diagonal cont´em o n´umero de vizinhos.

HOEF e JANSEN (2007) trataram νt e µt como modelos lineares separados por

co-vari´aveis temporais,

νt = ν0+ T0tη + ξt,

µt = µ0+ T0tγ + τt

onde Ti s˜ao as covari´aveis relacionadas ao tempo. Eles admitiram erros temporalmente

correlacionados que s˜ao modelados com modelos AR(1):

ξt = φξξt−1+ σξWξ,t; t > 1,

τt = φττt−1+ στWτ,t; t > 1,

onde Wξ,t e Wτ,t s˜ao vari´aveis aleat´orias independentes com distribui¸c˜ao normal padr˜ao.

(24)

2.3 Casos de Estudo 22

Cadeias de Markov (MCMC) no software WinBUGS. De in´ıcio, eles usaram 5000 itera¸c˜oes, e, em seguida, mais 50000 itera¸c˜oes. E, em seguida, foram obtidas as estimativas pontuais e intervalares (com 95% de confian¸ca) dos parˆametros.

2.3.3

Modelagem de Excesso de Zeros na Captura de Peixes

ARAB et al.(2008) consideraram o modelo de Poisson com excesso de zeros (ZIP) e efeitos aleat´orios para tratar o excesso de zeros no estudo de pesca com m´ultiplos equipamentos no rio Missouri, propondo, assim, um modelo para determinar os fatores relacionados `a ocorrˆencia de esp´ecies de peixes e os relacionados `as taxas de captura de peixes. Em estudos ecol´ogicos ´e muito comum obter grandes propor¸c˜oes de zeros nos dados, mas excluir os zeros da an´alise pode resultar em perda de informa¸c˜ao importante. Como por exemplo, uma alta propor¸c˜ao de zeros pode indicar que a esp´ecie ´e rara ou dif´ıcil de detectar.

As esp´ecies em estudo foram duas: o bagre (Ictalurus punctatus) e o esturj˜ao Sho -velnose (Scaphirhynchus platorynchus). Os pesquisadores dividiram o rio Missouri em 3 zonas: a superior ou zona menos alterada, a intermedi´aria ou zona do inter-reservat´orio e inferior ou zona canalizada. Cada zona foi dividida em segmentos, criando um total de 27 segmentos no rio inteiro. Os quatro macrohabitats encontrados no rio foram: entrada tribut´aria, canal secund´ario canalizado, canal secund´ario n˜ao-canalizado e curva. Para a captura dos peixes foram usados quatro equipamentos diferentes: rede bentˆonica, rede de praia, rede de gancho flutuante e pesca el´etrica. O processo de coleta e contagem de peixes foi repetido de 1996 a 1998. Isso deu origem a um conjunto de dados com 1477 observa¸c˜oes das quais grande parte foi igual a zero.

Foi definido yijklcomo o n´umero de peixes no segmento i, macrohabitat j, equipamento

k e ano l. Ent˜ao, yijkl = 0 com probabilidade pijkl e yijkl ∼ P ois(λijklaijkl) com

probabili-dade 1 − pijkl, onde λijkl representa a m´edia de pesca por unidade de ´area (CPUA) e aijkl

conta as diferentes ´areas envolvidas em cada medi¸c˜ao separada. O modelo foi definido por ARAB et.al.(2008) como:

P (yijkl = 0) = pijkl+ (1 − pijkl)e−λijklaijkl

P (yijkl = x) = (1 − pijkl)e−λijklaijkl

(λijklaijkl)x

x!

O modelo ZIP descrito ´e uma mistura de uma distribui¸c˜ao para o ponto de massa no zero com a distribui¸c˜ao de Poisson. Um valor diferente de zero segue uma distribui¸c˜ao

(25)

2.3 Casos de Estudo 23

Poisson com intensidade λijklaijkl.

ARAB et al.(2008) utilizaram uma abordagem Bayesiana, por ser mais flex´ıvel e por gerar resultados confi´aveis para as estima¸c˜oes dos parˆametros do modelo. Em seguida,

eles usaram o m´etodo de Monte Carlo em Cadeias de Markov (MCMC) com o objetivo

(26)

24

3

An´

alise Inicial dos Dados de

Dengue no Rio de Janeiro

Neste Cap´ıtulo, ser˜ao apresentadas an´alises descritivas que justifiquem o uso de um modelo espec´ıfico.

Os dados selecionados foram de n´umero de casos de dengue em cada munic´ıpio do

Estado do Rio de Janeiro por local de residˆencia no per´ıodo de Janeiro de 2008 a Dezembro de 2011. Observou-se, ent˜ao, que, nesse per´ıodo de estudo, a dengue foi caracterizada principalmente por meses com maiores ocorrˆencias da doen¸ca e outros meses com menores ocorrˆencias ou at´e mesmo zero. Essa caracter´ıstica em especial necessita de um tratamento diferencial dos dados.

Na Figura 1, temos, no lado esquerdo, a representa¸c˜ao do barplot de frequˆencias do n´umero de casos de dengue no munic´ıpio de Cabo Frio e, no lado direito, temos o boxplot

para o mesmo munic´ıpio. No barplot podemos observar que o n´umero que aparece com

maior frequˆencia ´e o zero. Logo, podemos dizer que o valor zero ´e um ponto com massa de probabilidade significativa. Na Figura 2, temos os mesmos gr´aficos, dessa vez para o munic´ıpio de Mag´e que apresenta caracter´ısticas semelhantes.

Para visualizar melhor as quantidades de zeros por ano, podemos observar a Tabela 1. Nessa Tabela temos cada um dos 92 munic´ıpios do Estado do Rio de Janeiro e os totais de zeros observados em cada ano. Assim, os n´umeros na Tabela est˜ao entre 0 e 12. Em que o 0 significa que, no per´ıodo de um ano, todos os meses tiveram pelo menos um caso de dengue. E o 12 significa que, no per´ıodo de um ano, todos os meses tiveram zero casos de dengue.

A evolu¸c˜ao temporal das quantidades de casos de dengue nos Munic´ıpios de Angra

dos Reis, Nova Friburgo e Rio das Ostras no per´ıodo estudado ´e mostrada na Figura 3.

Podemos notar alguns picos nas s´eries, mas, mesmo assim, apresentaram muitos zeros,

(27)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 25

Figura 1: Barplot e Boxplot do total de casos de Dengue para o Munic´ıpio de Cabo Frio

(28)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 26

Tabela 1: Quantidade de Zeros em cada Munic´ıpio por Ano

Município 2007 2008 2009 2010 2011 Município 2007 2008 2009 2010 2011 Angra dos Reis 5 4 7 7 6 Nilópolis 7 3 6 3 4

Aperibé 12 5 5 5 2 Niterói 1 1 4 1 1

Araruama 6 6 12 8 4 Nova Friburgo 9 6 11 9 6

Areal 12 12 12 9 11 Nova Iguaçu 2 0 0 0 0

Armação dos Búzios 10 9 12 11 5 Paracambi 9 4 11 5 4 Arraial do Cabo 6 7 11 8 8 Paraíba do Sul 7 9 12 9 9

Barra do Piraí 4 2 4 6 0 Paraty 11 6 9 5 7

Barra Mansa 2 4 7 4 2 Paty do Alferes 12 11 11 12 9

Belford Roxo 4 0 2 0 0 Petrópolis 6 6 9 7 5

Bom Jardim 11 12 12 12 8 Pinheiral 12 9 12 12 7 Bom Jesus do Itabapoana 9 1 9 3 5 Piraí 9 11 11 10 10

Cabo Frio 1 5 8 2 2 Porciúncula 12 12 9 3 5

Cachoeiras de Macacu 5 6 11 3 3 Porto Real 10 12 12 10 8

Cambuci 11 10 11 2 1 Quatis 10 11 12 11 11

Campos dos Goytacazes 0 1 4 0 0 Queimados 6 3 9 1 1

Cantagalo 9 5 12 10 6 Quissamã 6 8 11 7 2

Carapebus 11 12 12 12 12 Resende 4 6 7 11 2

Cardoso Moreira 11 9 11 11 8 Rio Bonito 1 6 8 2 1

Carmo 10 7 10 12 6 Rio Claro 11 9 12 11 11

Casimiro de Abreu 6 9 11 4 6 Rio das Flores 12 11 12 12 7 Comendador Levy Gasparian 11 10 12 12 12 Rio das Ostras 12 11 12 1 1 Conceição de Macabu 11 10 11 12 8 Rio de Janeiro 0 0 0 0 0 Cordeiro 8 7 11 9 6 Santa Maria Madalena 12 12 12 12 9 Duas Barras 12 12 12 12 10 Santo Antônio de Pádua 4 3 6 2 0 Duque de Caxias 0 0 3 0 0 São Fidélis 3 4 7 1 1 Engenheiro Paulo de Frontin 8 8 11 9 6 São Francisco de Itabapoana 12 7 12 6 2

Guapimirim 9 7 11 6 7 São Gonçalo 0 0 2 0 0

Iguaba Grande 10 8 12 10 6 São João da Barra 11 7 12 4 1 Itaboraí 0 2 3 0 3 São João de Meriti 3 0 5 1 1 Itaguaí 7 1 9 3 4 São José de Ubá 12 12 12 12 11 Italva 11 11 12 8 5 São José do Vale do Rio Preto 12 9 11 9 6 Itaocara 9 5 3 2 1 São Pedro da Aldeia 9 5 12 9 4 Itaperuna 4 3 7 4 0 São Sebastião do Alto 11 10 11 11 7 Itatiaia 8 9 10 10 10 Sapucaia 12 12 10 12 11

Japeri 11 5 7 8 1 Saquarema 5 6 12 11 7

Laje do Muriaé 7 9 12 11 11 Seropédica 11 4 12 11 6

Macaé 5 2 1 2 6 Silva Jardim 10 7 6 7 6

Macuco 11 9 12 11 11 Sumidouro 12 9 12 12 12

Magé 0 0 4 1 2 Tanguá 8 6 7 4 6

Mangaratiba 8 3 8 4 3 Teresópolis 9 7 12 10 9 Maricá 4 5 10 2 6 Trajano de Moraes 10 12 12 12 10

Mendes 7 7 11 9 10 Três Rios 7 10 12 11 7

Mesquita 10 3 9 6 3 Valença 4 6 4 3 1

Miguel Pereira 12 12 12 11 9 Varre-Sai 12 12 12 12 11

Miracema 6 5 8 6 5 Vassouras 12 7 11 7 3

(29)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 27

Figura 3: Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro entre Janeiro de 2007 a Dezembro de 2011

(a) Angra dos Reis

(b) Nova Friburgo

(30)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 28

os trˆes Munic´ıpios.

Nas Figuras 4 e 5 s˜ao apresentados os mapas com as quantidades de casos de dengue

por mˆes em cada munic´ıpio do Estado do Rio de Janeiro ao longo do ano de 2008. A

observa¸c˜ao dos mapas deixa clara a dependˆencia espacial entre alguns munic´ıpios posto

que munic´ıpios com muitos casos de dengue tamb´em tem vizinhos com muitos casos e

munic´ıpios com poucos casos de dengue tamb´em tem vizinhan¸ca com poucos casos de

dengue.

A exposi¸c˜ao dessas caracter´ısticas deixa claro a necessidade de se utilizar um modelo espec´ıfico. Nesse caso em particular, o modelo deve levar em considera¸c˜ao que temos um conjunto de dados com excesso de zeros e que tamb´em existe uma correla¸c˜ao espacial entre munic´ıpios vizinhos.

(31)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 29

Figura 4: Evolu¸c˜ao da Dengue de Janeiro de 2008 a Junho de 2008 no Estado do Rio de

Janeiro

(a) Janeiro (b) Fevereiro

(c) Mar¸co (d) Abril

(32)

3 An´alise Inicial dos Dados de Dengue no Rio de Janeiro 30

Figura 5: Evolu¸c˜ao da Dengue de Julho de 2008 a Dezembro de 2008 no Estado do Rio

de Janeiro

(a) Julho (b) Agosto

(c) Setembro (d) Outubro

(33)

31

4

Resultados e Discuss˜

ao

Nossa proposta ´e utilizar o trabalho de FERNANDES (2006) sobre o estudo

espa¸co-temporal em dados inflacionados de zero no conjunto de dados de dengue nos munic´ıpios do Estado do Rio de Janeiro.

4.1

Modelo Proposto

Usaremos um modelo que utiliza as ideias apresentadas por FERNANDES (2006):

p(yj,t|θj,t, λj,t) =

(

θj,tp(yj,t|λj,t) se yj,t > 0

(1 − θj,t) + θj,tp(yj,t = 0|λj,t) se yj,t = 0

Sendo assim, temos uma mistura de uma distribui¸c˜ao de Bernoulli com uma

dis-tribui¸c˜ao p(yj,t|λj,t). O parˆametro θj,t ´e a probabilidade de obtermos um valor da

dis-tribui¸c˜ao p(yj,t|λj,t), que, neste caso ´e uma distribui¸c˜ao de Poisson com m´edia λj,t. A

distribui¸c˜ao de Poisson ´e muito utilizada em dados de contagem. Cabe ressaltar que, nesses tipos de dados, n˜ao existem observa¸c˜oes menores que zero. Logo,

p(yj,t|θj,t, λj,t) = ( θj,t exp(−λj,t)λyj,tj,t yj,t! se yi,t > 0 (1 − θj,t) + θj,texp(−λj,t) se yj,t = 0,

obtendo, ent˜ao, a fun¸c˜ao de log-verossimilhan¸ca dada por:

logL(θj,t, λj,t|yj,t) = X X yj,t=0 log [(1 − θj,t) + θj,texp(−λj,t)] +X X yj,t>0 log " θj,t exp(−λj,t)λ yj,t j,t yj,t! # .

(34)

4.1 Modelo Proposto 32 temos: I(yj,t> 0) = ( 1, se yj,t > 0 0, se yj,t = 0. (4.1)

Assim, a fun¸c˜ao 4.1 indica se yj,t ´e maior ou igual a zero, isto ´e, se observamos pelo

menos um caso de dengue no mˆes t no munic´ıpio j ou observamos zero casos.

Ser˜ao propostos trˆes modelos. O primeiro modelo que ser´a apresentado ´e o mais completo por conter mais parˆametros. As fun¸c˜oes de liga¸c˜ao para os parˆametros θj,t e λj,t

s˜ao dadas, respectivamente, por:

log θj,t 1 − θj,t

= γ0+ γ1I(yj,t−1 > 0) + cj,t

logλj,t = α0+ dj,t

onde cj,t e dj,t s˜ao os efeitos espaciais dos parˆametros θj,t e λj,t, respectivamente. E

I(yj,t > 0) ´e a fun¸c˜ao indicadora definida em 4.1. A primeira equa¸c˜ao mostra que a

probabilidade de ter casos de dengue provenientes da Poisson depende de ter tido casos

no mˆes imediatamente anterior e tamb´em de um efeito espacial CAR que representa a

depedˆencia espacial entre munic´ıpios. A segunda equa¸c˜ao considera o n´umero m´edio de

casos de dengue comum a todos os munic´ıpios do Estado e meses e tamb´em um efeito

espacial associado ao n´umero de casos.

O outro modelo proposto tem a primeira fun¸c˜ao de liga¸c˜ao semelhante ao primeiro modelo, a diferen¸ca est´a na segunda fun¸c˜ao de liga¸c˜ao que indica que o n´umero de casos da doen¸ca ´e, em m´edia, constante para todos os munic´ıpios e meses estudados. Ent˜ao, temos as seguintes fun¸c˜oes de liga¸c˜ao:

log θj,t 1 − θj,t

= γ0+ γ1I(yj,t−1 > 0) + cj,t

logλj,t = α0

O ´ultimo modelo proposto leva em considera¸c˜ao que a m´edia λj,t depende apenas do

efeitos espacial dj,t, isto ´e, depende apenas da influˆencia espacial que cada munic´ıpio sofre

de seus vizinhos. As fun¸c˜oes de liga¸c˜ao para esse modelo s˜ao dadas por:

log θj,t 1 − θj,t

(35)

4.1 Modelo Proposto 33

logλj,t = dj,t

Para a estima¸c˜ao dos parˆametros do modelo foi utilizado o m´etodo de MCMC (Monte Carlo em Cadeias de Markov). O software usado na estima¸c˜ao e nas an´alises foi essen-cialmente o R vers˜ao 2.13.1.

(36)

4.2 Distribui¸c˜oes a Priori dos Parˆametros 34

4.2

Distribui¸

oes a Priori dos Parˆ

ametros

Seja Ψ = (γ0, γ1, cj,t, α0, dj,t) o vetor de parˆametros do primeiro modelo proposto,

definiremos as distribui¸c˜oes a priori para os parˆametros deste modelo, que s˜ao:

p(γ0|Ψ−γ0) = 1 √ 2πk1 exp  − 1 2k1 (γ0− γ00)2  (4.2) p(γ1|Ψ−γ1) = 1 √ 2πk2 exp  − 1 2k2 (γ1− γ10)2  (4.3) p(cj,t|Ψ−cj,t) = 1 q 2πk3 ηj exp  − 1 2(k3/ηj) (cj,t− cj,t)2  (4.4) p(α0|Ψ−α0) = 1 √ 2πk4 exp  − 1 2k4 (α0− α00)2  (4.5) p(dj,t|Ψ−dj,t) = 1 q 2πk5 ηj exp  − 1 2(k5/ηj) (dj,t− dj,t)2  (4.6)

onde ηj ´e o n´umero de munic´ıpios que fazem fronteira com o munic´ıpio j.

Os outros dois modelos propostos tem distribui¸c˜oes a priori iguais as do primeiro modelo, dado que eles foram constru´ıdos com os mesmos parˆametros, entretanto o primeiro modelo considerando apenas o α0 e o segundo considerando apenas o efeito espacial dj,t.

4.3

Estima¸

ao dos Parˆ

ametros

Vamos definir, agora, a fun¸c˜ao de log-verossimilhan¸ca para os modelos descritos na se¸c˜ao 4.1. Para o modelo 1, a fun¸c˜ao de log-verossilhan¸ca ´e dada por:

logL(Ψ|y) = X X

yj,t−1=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0 + dj,t))]

−X X

yj,t−1≥0

log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t)]

+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(α0+ dj,t) +α0 X X yj,t>0 yj,t+ X X yj,t>0 yj,tdj,t− X X yj,t>0 log(yj,t!)

(37)

4.3 Estima¸c˜ao dos Parˆametros 35

onde κ ´e o n´umero total de observa¸c˜oes diferentes de zero e ψ ´e o n´umero de observa¸c˜oes diferentes de zero cujo mˆes anterior tamb´em teve pelo menos um caso de dengue.

A seguir temos as posterioris marginais completas na escala logar´ıtmica, que, para o modelo completo, s˜ao:

log p(γ0|Ψ−γ0, y) =

X X

yj,t=0

log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]

−X X

yj,t≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0

−(γ0− γ00) 2 k1 + wγ0 log p(γ1|Ψ−γ1, y) = X X yj,t−1=0

log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]

−X X

yj,t−1≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1

−(γ1− γ10) 2 k2 + wγ1 log p(cj,t|Ψ−cj,t, y) = X X yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]

− m X j=1 n X t=1

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +

X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(α0|Ψ−α0, y) = X X yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]

−X X yj,t>0 exp(α0+ dj,t) + α0 X X yj,t>0 yj,t− (α0 − α00)2 k4 + wα0

(38)

4.3 Estima¸c˜ao dos Parˆametros 36

log p(dj,t|Ψ−dj,t, y) =

X X

yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0+ dj,t))]

−X X yj,t>0 exp(α0+ dj,t) + X X yj,t>0 yj,tdj,t− (dj,t− dj,t)2 k5 ηj + wdj,t onde wγ0, wγ1, wcj,t, wα0 e wdj,t s˜ao constantes.

O modelo com m´edia comum a todos os munic´ıpios e meses tem a seguinte fun¸c˜ao de log-verossimilhan¸ca:

logL(Ψ|y) = X X

yj,t−1=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]

−X X

yj,t−1≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)]

+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(α0) +α0 X X yj,t>0 yj,t− X X yj,t>0 log(yj,t!)

E as posterioris marginais completas na escala logar´ıtmica s˜ao: log p(γ0|Ψ−γ0, y) =

X X

yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]

−X X

yj,t≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0

− −(γ0− γ00) 2 k1 + wγ0 log p(γ1|Ψ−γ1, y) = X X yj,t−1=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]

−X X

yj,t−1≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1

−(γ1 − γ10)

2

k2

(39)

4.3 Estima¸c˜ao dos Parˆametros 37

log p(cj,t|Ψ−cj,t, y) =

X X

yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]

− m X j=1 n X t=1

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +

X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(α0|Ψ−α0, y) = X X yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(α0))]

−X X yj,t>0 exp(α0) + α0 X X yj,t>0 yj,t− (α0− α00)2 k4 + wα0

O ´ultimo modelo proposto refere-se a utiliza¸c˜ao apenas dos efeitos espaciais dj,t e sua

fun¸c˜ao de log-verossimilhan¸ca ´e dada pela express˜ao:

logL(Ψ|y) = X X

yj,t−1=0

log [1 + exp(γ0 + γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]

−X X

yj,t−1≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)]

+κγ0+ ψγ1+ X X yj,t>0 cj,t− X X yj,t>0 exp(dj,t) +X X yj,t>0 yj,tdj,t− X X yj,t>0 log(yj,t!)

As posterioris marginais completas s˜ao, na escala logar´ıtmica: log p(γ0|Ψ−γ0, y) =

X X

yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]

−X X

yj,t≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + κγ0

−(γ0− γ00)

2

k1

(40)

4.3 Estima¸c˜ao dos Parˆametros 38

log p(γ1|Ψ−γ1, y) =

X X

yj,t−1=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]

−X X

yj,t−1≥0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] + ψγ1

−(γ1− γ10) 2 k2 + wγ1 log p(cj,t|Ψ−cj,t, y) = X X yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]

− m X j=1 n X t=1

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t)] +

X X yj,t>0 cj,t −(cj,t− cj,t) 2 k3 ηj + wcj,t log p(dj,t|Ψ−dj,t, y) = X X yj,t=0

log [1 + exp(γ0+ γ1I(yj,t−1 > 0) + cj,t− exp(dj,t))]

−X X yj,t>0 exp(dj,t) + X X yj,t>0 yj,tdj,t− (dj,t− dj,t)2 k5 ηj + wdj,t

Todos os modelos descritos s˜ao muito complexos por conter um grande n´umero parˆametros, por´em o modelo completo tem ainda mais parˆametros para serem estimados, logo, ´e o mais complexo em termos computacionais.

Definidas as posterioris marginais completas, pode-se iniciar a estima¸c˜ao dos parˆametros

via m´etodo Monte Carlo em Cadeias de Markov, usando o seguinte algoritmo para o

primeiro modelo cujo c´odigo em R pode ser visto no Anexo B:

1. Atribuir valores iniciais aos parˆametros γ0(0), γ1(0), c(0)j,t, α(0)0 e d(0)j,t 2. Para cada parˆametro

• Gerar proposta usando a priori • Avaliar a aceita¸c˜ao do valor proposta 3. Repetir o passo 2 at´e a convergˆencia

(41)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 39

4.4

Compara¸

ao dos Modelos e Previs˜

ao

Posteriormente `a estima¸c˜ao dos parˆametros dos modelos descritos na se¸c˜ao anterior foi feito o c´alculo da M´edia dos Res´ıduos ao Quadrado (MRQ) de cada um dos modelos como forma de avaliar o ajuste dos modelos propostos usando a seguinte express˜ao:

M RQ(Yj,t) = m X j=1 n X t=1 (ˆyj,t− yj,t)2 mn (4.7)

onde ˆyj,t ´e o valor esperado para munic´ıpio j no mˆes t, m ´e o n´umero de munic´ıpios dos

quais temos os resultados da previs˜ao e n ´e o n´umero de meses.

O menor MRQ encontrado foi o do modelo que considera apenas o efeito espacial dj,t na segunda equa¸c˜ao, como observado na Tabela 2. Sendo assim, sugerimos utilizar

esse modelo nas previs˜oes de n´umero de casos de dengue em todos os munic´ıpios do

Rio de Janeiro no ano de 2011. Entretanto, mesmo tendo o menor MRQ, ele n˜ao ´e

necessariamente o modelo ideal. Sabe-se que a ocorrˆencia de chuva influencia o ciclo de

vida do mosquito, assim como a temperatura ambiental, densidade demogr´afica e outras

vari´aveis. Ent˜ao, poder´ıamos melhorar o modelo adicionando algumas dessas vari´aveis.

Tabela 2: M´edia dos Res´ıduos ao Quadrado dos Modelos Propostos

Modelos Propostos

Modelo Modelo com Modelo com Apenas

MRQ Completo M´edia Comum Efeito Espacial

60,24 699,41 52,77

Para fazer uma compara¸c˜ao visual entre os trˆes modelos propostos podemos observar a Figura 6 que representa a evolu¸c˜ao mensal no ano de 2011 da s´erie observada e da s´erie prevista atrav´es de cada um dos trˆes modelos. O modelo com o efeito espacial acompanha claramente a tendˆencia da s´erie observada. J´a o modelo com apenas α0 teve dificuldade

para retornar as s´eries originais, isto indica uma dependˆencia espacial entre os casos de dengue.

Os mapas das Figuras 7 8 representam a probabilidade de n˜ao ocorrer nenhum caso

de dengue nos meses do ano de 2011. A probabilidade de ocorrˆencia de zero ´e maior nos munic´ıpios marcados com cores mais escuras.

Nas Figuras 9 e 10 podemos observar os mapas com os valores esperados dos casos de dengue para o ano de 2011. Quanto mais escura estiver a cor maior ser´a a quantidade de

(42)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 40

casos de dengue. Tanto as Figuras com as probabilidades de zero quanto as Figuras com os valores esperados para o ano de 2011 deixaram claro que o modelo sugerido conseguiu captar a dependˆencia espacial dos casos de dengue no Rio de Janeiro.

Na Figura 11 temos a representa¸c˜ao de um mapa com os valores observados e outro

mapa com os valores esperados a partir do modelo selecionado no mˆes de Dezembro de

2011. Como podemos notar, as previs˜oes recuperaram a dependˆencia espacial entre os

vizinhos, assim como, o excesso de zeros.

Os resultados encontrados indicam que o ajuste de um modelo em dois est´agios ´e muito adequado na modelagem para dados de dengue que, tem como principais caracter´ısticas o excesso de zeros e a dependˆencia espacial.

Ao rodar os programas de todos os trˆes modelos, a convergˆencia se deu depois de

aproximadamente 300 itera¸c˜oes nos parˆametros θj,t e λj,t de forma semelhante `a relatada

em VELARDE (2000). Das 500 itera¸c˜oes realizadas, usamos 400 itera¸c˜oes como ”aqueci-mento”e 100 para gerar as amostras.

Todos os modelos propostos s˜ao muito complexos em termos computacionais e o

(43)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 41

Figura 6: Evolu¸c˜ao da Dengue em alguns Munic´ıpios do Estado do Rio de Janeiro entre Janeiro de 2011 a Dezembro de 2011 e os Valores Esperados usando os Modelos Propostos

(a) Angra dos Reis

(b) Nova Friburgo

(44)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 42

Figura 7: Probabilidade de Zero de Janeiro de 2011 a Junho de 2011

(a) Janeiro (b) Fevereiro

(c) Mar¸co (d) Abril

(45)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 43

Figura 8: Probabilidade de Zero de Julho de 2011 a Dezembro de 2011

(a) Julho (b) Agosto

(c) Setembro (d) Outubro

(46)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 44

Figura 9: Valores Esperados para o N´umero de Casos Dengue de Janeiro de 2011 a Junho

de 2011

(a) Janeiro (b) Fevereiro

(c) Mar¸co (d) Abril

(47)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 45

Figura 10: Valores Esperados para o N´umero de Casos Dengue de Julho de 2011 a

Dezem-bro de 2011

(a) Julho (b) Agosto

(c) Setembro (d) Outubro

(48)

4.4 Compara¸c˜ao dos Modelos e Previs˜ao 46

Figura 11: Mapas dos Valores Observados e Esperados para o mˆes de Dezembro de 2011

(49)

47

5

Conclus˜

ao

As an´alises descritivas feitas neste trabalho evidenciaram que os dados de dengue no Rio de Janeiro tem massa de probabilidade no ponto zero e indicam que os dados possuem uma dependˆencia espacial, sendo, ent˜ao, necess´ario o uso de um modelo espec´ıfico. Os resultados obtidos sugerem que a nossa proposta de usar a modelagem em dois est´agio ´e bastante apropriada na modelagem de quantidade de casos de dengue no Rio de Janeiro. Entretanto, os resultados expostos neste trabalho dependem da qualidade dos dados, caso exista subnotifica¸c˜ao seria necess´ario adicionar algum efeito aleat´orio no ajuste do modelo. O modelo selecionado para fazer os c´alculos dos valores esperados foi o modelo com

menor m´edia dos res´ıduos ao quadrado que, como observamos na Tabela 2, ´e o modelo

que considera apenas os efeitos espaciais nas m´edias do n´umero de casos de dengue. O modelo com a m´edia comum α0 teve dificuldade em retornar a m´edia de casos da doen¸ca

em munic´ıpios com muitos casos indicando que o modelo precisa de um efeito espacial entre os munic´ıpios.

Vale ressaltar que o modelo selecionado para fazer o c´alculo dos valores esperados n˜ao ´e o mais adequado, dado que o modelo n˜ao leva em considera¸c˜ao outras vari´aveis que podem estar relacionados com a quantidade de casos de dengue como, temperatura, precipita¸c˜ao pluviom´etrica e densidade demogr´afica.

Finalmente, sugerimos a utiliza¸c˜ao de um modelo como o proposto neste trabalho

para analisar dados espa¸co-temporais que, como no caso da dengue, apresentam ponto de massa de probabilidade no valor zero.

(50)

48

Referˆ

encias

[1] Arab, Ali; Wildhaber, Mark L.; Wilke, Christopher K. e Gentry, Casey N.(2008). Zero-Inflated Modeling of Fish Catch per Unit Area Resulting from Multiple Gears: Application to Channel Catfish and Shovelnose Sturgeon in the Missouri River. North American Journal of Fisheries Management 28: 1044-1058.

[2] Barreto, Maur´ıcio R. e Teixeira, Maria Gl´oria (2008).Dengue no Brasil: situa¸c˜ao epidemiol´ogica e contribui¸c˜oes para uma agenda de pesquisa. Estudos Avan¸cados 22 (64).

[3] Brasil, Minist´erio da Sa´ude (2001). Dengue: Instru¸c˜oes para Pessoal de Combate ao Vetor. Bras´ılia: MS/FUNASA.

[4] Famoye, Felix e Singh, Karan P. (2006). Zero-Inflated Generalizes Poisson Model with an Application to Domestic Violence Data. Journal of Data Sciense 4(2006), p. 117-130.

[5] Fernandes, Marcus Vinicius M. (2006). Modelos para Processos Espa¸co-Temporais

Inflacionados de Zeros. Disserta¸c˜ao de Mestrado - Universidade Federal do Rio de Janeiro - UFRJ.

[6] Feuerverger, A. (1979). On some methods of analysis for weather experiments. Biometrika Vol.66, No. 3, p. 655-658.

[7] Hoef, Jay M. Ver e Jansen, John K. (2007). Space-time zero-inflated count models of Harbor Seals.Environmetrics 2007; 18: 697-712.

[8] Minist´erio da Sa´ude (2005). Doen¸cas Infecciosas e Parasit´arias - Guia de Bolso/ Minist´erio da Sa´ude, Secretaria de Vigilˆancia em Sa´ude. 6ed. rev. Bras´ılia: Minist´erio da Sa´ude. p. 89-94.

[9] Sans´o, B. e Guenni, L. (1999). Venezuelan rainfall data analysed by using a Bayesian space-time model. Applied Statistics Vol. 48, Part 3, pp. 345-362.

[10] Souza, Luiz Jos´e de; Gomes, C´esar Ronald P.; Lopes, Antonio Carlos; Filho, Jo˜ao Tadeu D. S.; Souza, Thiago F. de; Cˆortes, Vitor A.; Neto, Carlos G. e Bastos, Diogo A. (2002). Aspectos cl´ınicos da dengue: novos conceitos. Moreira JR Editora.

[11] Velarde, Luis Guillermo C. (2000). Modelagem Espa¸co Temporal de Vari´aveis N˜ao Negativas com Ponto de Massa no Zero. Tese - Universidade Federal do Rio de Janeiro, COPPE/UFRJ.

(51)

49

ANEXO A -- Programa Utilizado para

Leitura do Mapa do Estado do

Rio de Janeiro com os N´

umero

de Casos de Dengue no Mˆ

es de

Janeiro de 2008

library(spdep) require(RColorBrewer) rj<-readShapePoly("rj_municipios.shp") rj.dados <- attr(rj,"data")##? rj.dados$indice <- 1:dim(rj.dados)[1] dados<-read.csv2(’Dengue_v2.csv’) attach(dados) rj.dados$NOME<-as.character(rj.dados$NOME) rj.dados<-merge(rj.dados,dados) rj.dados<-rj.dados[order(rj.dados$indice),] names(rj) rj[[4]]<-X2008.Jan

# Mudando a palheta de cores

rw.colors<-colorRampPalette(c("bisque","brown"))

# carregando o pacote maptolls require(maptools)

mapa <- readShapeSpatial(file.choose())

(52)

Anexo A -- Programa Utilizado para Leitura do Mapa do Estado do Rio de Janeiro com os N´umero de Casos de Dengue no Mˆes de Janeiro de 2008 50

cortes<-cut(rj$V4,intervalos,include.lowest=TRUE) niveis<-levels(cortes)

cores<-rw.colors(length(levels(cortes))) levels(cortes)<-cores

#Plotando o mapa com legenda

plot(mapa,lwd=.1,axes=FALSE,col=as.character(cortes)) legend("topleft",niveis,fill=cores,bty="n",cex=0.6)

(53)

51

ANEXO B -- Programa em R Utilizado para

Estimar os Parˆ

ametros do

Modelo Completo via MCMC

#Carrega os dados e transforma em serie temporal

dados<-read.csv2(’Dengue_v2.csv’,h=T) attach(dados)

n<-60 #n de meses

m<-92 # n de municipios

############################################################## ######## VETORES DE QUANTIDADE DE MUNICIPIOS VIZINHOS ######## ############## E POSICAO DE TODOS OS VIZINHOS ################ ############################################################## num_vizinhos<-c(0,3,6,9,13,14,18,25,32,36,40,44,49,56,63,72,78,81,84, 88,93,95,101,106,112,119,123,129,133,138,144,149,155,163,164,169,171, 177,181,184,187,192,197,202,209,213,217,220,222,231,240,248,255,256, 260,271,272,279,282,284,289,292,295,299,304,309,312,314,321,326,332, 339,341,345,347,352,356,362,369,375,379,383,387,398,399,403,410,418, 423,428,431,439,443) posicao_viz<-c(40,53,65,14,32,70,6,28,78,52,55,77,88,12,3,12,28,78, 8,48,56,57,89,91,92,57,59,60,63,65,89,92,25,43,50,75,23,24,49,87,

(54)

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 52 15,33,46,90,5,6,20,28,65,78,27,29,49,64,83,85,86,2,31,32,33,70,71,76, 11,18,22,31,62,69,71,72,74,19,23,24,32,38,79,22,37,62,15,31,71, 16,24,80,84,12,37,49,67,83,52,88,15,17,37,62,69,87,10,16,24,38,87, 10,16,19,23,49,84,9,39,44,50,55,68,75,42,44,51,91,13,31,39,55,73,86, 3,6,12,78,13,27,41,73,85,40,51,57,65,68,82,14,15,18,33,71,2,14,16,70, 71,79,11,14,31,36,45,46,58,76,63,44,50,51,61,82,33,45,17,20,22,49, 67,87,16,23,79,87,25,27,55,1,30,61,29,48,73,81,85,7,26,51,57,91,9,47, 50,68,75,25,26,50,51,54,55,91,33,36,70,76,11,33,58,90,43,68,75,41,73, 10,13,20,24,37,83,84,86,87,9,25,35,43,44,51,61,68,82,26,30,35,42,44,50, 57,82,4,21,54,55,66,88,91,1,44,52,55,91,4,25,27,39,44,52,54,77,86,7,57, 92,7,30,42,51,56,65,92,33,46,90,8,60,63,8,59,63,89,35,50,82,15,22,37, 8,34,59,60,13,29,78,81,83,1,8,30,40,57,52,89,91,20,37,25,30,43,47,50, 75,82,15,22,71,79,87,2,14,16,32,45,76,14,15,18,31,32,69,79,15,74, 27,29,41,48,15,72,9,25,43,47,68,14,33,45,70,4,55,80,84,86,88,3,6,12,28, 64,81,83,16,32,38,69,71,87,19,77,84,88,41,64,78,85,30,35,51,61,68, 13,20,49,64,78,19,24,49,77,80,86,13,29,41,64,81,13,27,49,55,80,84, 10,22,23,37,38,49,69,79,4,21,52,77,80,7,8,60,66,91,11,46,58,7,26, 42,44,52,54,66,89,7,8,56,57) ########################################################## ########### GERAR VALORES PARA OS EFEITOS ESPACIAIS ###### ##########################################################

C<-matrix(0,nrow=m,ncol=n) D<-matrix(0,nrow=m,ncol=n)

postac<-matrix(0,nrow=m,ncol=n) postad<-matrix(0,nrow=m,ncol=n)

# gerando os efeitos espaciais C e D

(55)

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 53 for(j in 1:m){ C[j,1]<-rnorm(1,mean=0,sd=10) postac[j,1]<--(log(2*pi)/2)-(log(100)/2)-(C[j,1]^2)/(2*100) D[j,1]<-rnorm(1,mean=0,sd=10) postad[j,1]<--(log(2*pi)/2)-(log(100)/2)-(D[j,1]^2)/(2*100) } for(t in 2:n){ for(j in 1:m){ somac<-0 somaquac<-0 somad<-0 somaquad<-0 num_viz<-num_vizinhos[j+1]-num_vizinhos[j] for(k in (num_vizinhos[j]+1):(num_vizinhos[j+1])){ somac<-somac+C[posicao_viz[k],t-1] somaquac<-somaquac+(C[posicao_viz[k],t-1])^2 somad<-somad+D[posicao_viz[k],t-1] somaquad<-somaquad+(D[posicao_viz[k],t-1])^2 } medespac<-somac/num_viz varespac<-abs((somaquac-(somac^2)/num_viz)/num_viz) medespad<-somad/num_viz varespad<-abs((somaquad-(somad^2)/num_viz)/num_viz) if(varespac==0){ varespac<-10 } if(varespad==0){ varespad<-10 } C[j,t]<-rnorm(1,mean=medespac,sd=sqrt(varespac)) postac[j,t]<--(log(2*pi)/2)-(log(varespac/num_viz)/2)-num_viz* (((C[j,t]-medespac)^2)/(2*varespac)) D[j,t]<-rnorm(1,mean=medespad,sd=sqrt(varespad)) postad[j,t]<--(log(2*pi)/2)-(log(varespad/num_viz)/2)-num_viz*

(56)

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 54

(((D[j,t]-medespad)^2)/(2*varespad)) }

}

#num de meses com pelo menos um caso de dengue casosdengue<-0

#num total de casos de dengue num_casos<-0

#num dias com casos antecedidos por dias com casos casosant<-0 for(j in 1:m){ for(t in 2:n){ if(dados[j,t]!=0){ casosdengue<-casosdengue+1 num_casos<-num_casos+dados[j,t] if(dados[j,t-1]!=0){ casosant<-casosant+1 } } } } ############################################################## #################### valores iniciais ######################## ############################################################## alfa0_ant<-rnorm(1,-1,10) gama0_ant<-rnorm(1,0,10) gama1_ant<-rnorm(1,0,10) alfa0_par<--1 gama0_par<-0 gama1_par<-1

(57)

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 55

#valores iniciais para a posteriori para gama0 e gama1 postag0<--log(10)-(gama0_ant-gama0_par)^2/(2*100) postag1<--log(10)-(gama1_ant-gama1_par)^2/(2*100) postaa0<--log(10)-(alfa0_ant-alfa0_par)^2/(2*100) acumulac<-0 acumulad<-0 ################################################################### ####################### PROGRAMA PRINCIPAL ######################## ################################################################### interacao<-500 converge<-100 inter_iniciais<-interacao-converge tetas<-matrix(0,nrow=m,ncol=12) media_tetas<-matrix(0,nrow=m,ncol=12) lambdas<-matrix(0,nrow=m,ncol=12) media_lambdas<-matrix(0,nrow=m,ncol=12) soma_previsao<-matrix(0,nrow=m,ncol=12) for(i in 1:interacao){ print(i) indicado<-0 auxiliar<-0 valor_min<-0

#gerando proposta para gama0 postajuda<--1000000

contador<-0 busca<-100

while(indicado==0 & contador<=busca){ gama0_novo<-rnorm(1,gama0_par,10)

priog0<--log(10)-((gama0_novo-gama0_par)^2)/(2*100) #avaliando a posteriori para gama0

(58)

Anexo B -- Programa em R Utilizado para Estimar os Parˆametros do Modelo Completo via MCMC 56 postg0<-priog0+casosdengue*gama0_novo for(t in 2:n){ for(j in 1:m){ if(dados[j,t]==0){ if(dados[j,t-1]==0){ postg0<-postg0+log(1+exp(gama0_novo+C[j,t]-exp(alfa0_ant+D[j,t]))) -log(1+exp(gama0_novo+C[j,t])) }else{ postg0<-postg0+log(1+exp(gama0_novo+gama1_ant+C[j,t]-exp(alfa0_ant+D[j,t]))) -log(1+exp(gama0_novo+gama1_ant+C[j,t])) } }else{ if(dados[j,t-1]==0){ postg0<-postg0-log(1+exp(gama0_novo+C[j,t])) }else{ postg0<-postg0-log(1+exp(gama0_novo+gama1_ant+C[j,t])) } } } }

#testando valor proposto para gama0 if(postg0>postajuda){ valor_min<-min(0,postg0-postag0) if(log(runif(1))<valor_min){ indicado=1 } } contador<-contador+1 } #fim do while if(indicado==1){ gama0_ant<-gama0_novo postag0<-postg0 }

Referências

Documentos relacionados

O biogás gerado no tratamento de águas residuárias de suinocultura, quando reaproveitado como fonte energética, necessita passar por processos de purificação

Resumo: Tendo por base a ausência de estudos sobre o capital simbólico da profissão de Informação-Documentação, apresentam-se dez áreas de investigação

J- Desenvolver estratégia para convencer. Na intepretação do gráfico, é possível visualizar que “Aprender como e onde encontrar conhecimento revelante”

Em números absolutos, os resultados mostraram que as regiões médio-norte e nordeste apresentaram a maior amostragem de produtores rurais que expandiram a sua área agrícola através

CRES MUNICÍPIO INSTITUIÇÃO PROFISSIONAL CAPACITADO 10ª LIMOEIRO DO NORTE HOSP.. BENEFICIENTE SÃO CAMILO

Table 1- Atlantic and Pacific chub Mackerel metazoan parasites and its geographical distribution………..………….5 Table 2- Targeted gene, sequence of the

Este trabalho busca reconhecer as fragilidades e potencialidades do uso de produtos de sensoriamento remoto derivados do Satélite de Recursos Terrestres Sino-Brasileiro

Analisando agregadamente, o Gráfico 04 mostra que além de Araxá, os municípios de Sacramento e Ibiá dão contornos mais acabados ao grupo dos que mais contribuem para o valor