• Nenhum resultado encontrado

Análise espacial e temporal da tuberculose no Estado do Rio de Janeiro entre os anos de 2001 e 2010

N/A
N/A
Protected

Academic year: 2021

Share "Análise espacial e temporal da tuberculose no Estado do Rio de Janeiro entre os anos de 2001 e 2010"

Copied!
83
0
0

Texto

(1)

Universidade Federal Fluminense Instituto de Matem´atica e Estat´ıstica

Curso de Estat´ıstica

Evelyne Guimar˜aes dos Santos

An´

alise Espacial e Temporal da Tuberculose no Estado do

Rio de Janeiro entre os anos de 2001 e 2010

Niter´oi 2013

(2)

Evelyne Guimar˜aes dos Santos

An´

alise Espacial e Temporal da Tuberculose no Estado do

Rio de Janeiro entre os anos de 2001 e 2010

Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.

Orientadora: Ana Beatriz Monteiro Fonseca

D.Sc.

Co-orientador: Valentin Sisko

D.Sc.

Niter´oi 2013

(3)

Evelyne Guimar˜aes dos Santos

An´

alise Espacial e Temporal da Tuberculose no Estado do

Rio de Janeiro entre os anos de 2001 e 2010

Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.

Aprovado em mar¸co de 2013

BANCA EXAMINADORA

Ana Beatriz Monteiro Fonseca

D.Sc.

Valentin Sisko

D.Sc.

Jony Arrais Pinto Junior

(4)

Santos, Evelyne Guimarães dos

Análise espacial e temporal da tuberculose no Estado do Rio de Janeiro entre os anos de 2001 e 2010 / Evelyne Guimarães dos Santos; Ana Beatriz Monteiro Fonseca,

orientadora; Sisko, Valentin, coorientador. Niterói, 2012.

83 f. : il.

Trabalho de Conclusão de Curso (Graduação em Estatísticaa ) – Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2012.

1. Tuberculose. 2. Análise espacial. 3. Análise temporal. 4. Inferência bayesiana. 5. ARIMA I. Fonseca, Ana Beatriz

Monteiro, orientadora. II. Sisko, Valentin, coorientador. III. Universidade Federal Fluminense. Instituto de Matemática e Estatística. IV. Título.

(5)
(6)

Resumo

A tuberculose ´e uma doen¸ca infectocontagiosa e a probabilidade de que sua infec¸c˜ao evo-lua para a doen¸ca est´a associada `as condi¸c˜oes de vida da popula¸c˜ao. Segundo estimativas da OMS, um ter¸co da popula¸c˜ao mundial est´a infectada. Atualmente, o Brasil ocupa o d´ecimo nono lugar entre os 22 pa´ıses respons´aveis por 80% do total de casos de tuber-culose no mundo. O Estado do Rio de Janeiro est´a entre os que possuem maior n´umero de casos e maior taxa de incidˆencia no pa´ıs, sendo o estudo de sua difus˜ao muito ´util na tomada de decis˜oes da administra¸c˜ao p´ublica voltadas para a ´area de sa´ude. Este trabalho teve como objetivo verificar o comportamento da tuberculose no Estado do Rio de Janeiro durante os anos de 2001 e 2010, atrav´es de sua dinˆamica espacial e temporal. Para isso, foram realizadas uma an´alise espacial da taxa de incidˆencia de tuberculose dos munic´ıpios, utilizando dois estimadores pontuais (cl´assico e bayesiano), e uma an´alise de s´eries temporais para encontrar um modelo adequado aos dados e que fornecesse boas previs˜oes para o n´umero de casos novos da doen¸ca no Estado e em dois de seus munic´ıpios mais atingidos.

Palavras-chaves: tuberculose, an´alise espacial, an´alise temporal, inferˆencia bayesiana, ARIMA.

(7)
(8)

Agradecimentos

Aos meus pais, que mesmo distante sempre me apoiaram e procuraram estar presentes em todos esses anos.

`

A professora Ana Beatriz e ao Professor Valentin que me orientaram neste projeto.

Aos amigos de faculdade Keilane, Fernanda, Juliana F., Dani, Bruno, Gabriel, F´abio, Bruna, Pablo, Adriana, por terem compartilhado momentos de estudo, tens˜ao e descontra¸c˜ao.

A todas as pessoas que passaram pelo Centro Social Vicenta Maria, em especial a Irm˜a Doris, Clara, Maria Ot´avia, Juliana C., Tatiana e Renata, por todas as horas de conversas que certamente contribu´ıram para que esses quatro anos fossem melhores.

(9)

...

(10)

Sum´

ario

Lista de Figuras 8

Lista de Tabelas 10

1 Introdu¸c˜ao 11

1.1 A tuberculose . . . 11

1.1.1 A transmiss˜ao, os sintomas e a evolu¸c˜ao . . . 11

1.1.2 O diagn´ostico . . . 12

1.1.3 O tratamento e a cura . . . 12

1.1.4 O controle e a preven¸c˜ao . . . 15

1.2 A tuberculose no mundo . . . 15

1.3 A tuberculose no Brasil . . . 18

1.4 A tuberculose no Estado do Rio de Janeiro . . . 20

1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro . . . 21

2 Objetivos 24 2.1 Objetivos Gerais . . . 24 2.2 Objetivos Espec´ıficos . . . 24 3 Materiais e M´etodos 25 3.1 O Banco de Dados . . . 25 3.2 Nota¸c˜ao . . . 25

3.3 An´alise de dados espaciais . . . 26

3.3.1 Estimadores Espaciais . . . 27

(11)

3.4.1 Exemplos de Processos Estoc´asticos . . . 33

3.4.2 Processos Estacion´arios . . . 34

3.4.3 Modelos ARIMA . . . 37

3.4.4 Previs˜ao com modelos ARIMA . . . 40

3.4.5 Modelos Sazonais . . . 42

4 Resultados 44 4.1 An´alise Espacial . . . 44

4.1.1 Estimador Cl´assico . . . 44

4.1.2 Estimador Bayesiano . . . 47

4.2 An´alise Temporal . . . 49

5 Discuss˜ao de Resultados 64

6 Conclus˜ao 68

Apˆendices 72

(12)

Lista de Figuras

1.1 Mapa do Estado do Rio de Janeiro . . . 21

1.2 Distribui¸c˜ao da popula¸c˜ao por 10.000 habitantes em 2010 . . . 23

4.1 Mapas para a taxa bruta . . . 45

4.2 Mapas para a taxa bruta . . . 46

4.3 Mapas para o estimador Bayesiano . . . 47

4.4 Mapas para o estimador Bayesiano . . . 48

4.5 Mapas das diferen¸cas . . . 48

4.6 Notifica¸c˜oes anuais de tuberculose no estado do Rio de Janeiro . . . 50

4.7 Taxa de incidˆencia anual por 10.000 habitantes . . . 50

4.8 Gr´afico da S´erie RJ . . . 51

4.9 Autocorrela¸c˜oes da S´erie RJ . . . 52

4.10 Autocorrela¸c˜oes Parciais da S´erie RJ . . . 52

4.11 fac dos res´ıduos do modelo AR(2) para a s´erie RJ . . . 53

4.12 facp dos res´ıduos do modelo AR(2) para a s´erie RJ . . . 53

4.13 fac e facp dos res´ıduos do modelo . . . 54

4.14 s´erie RJ com previs˜ao . . . 55

4.15 Gr´afico da s´erie RIO . . . 56

4.16 Autocorrela¸c˜oes da s´erie RIO . . . 56

4.17 Autocorrela¸c˜oes parciais da s´erie RIO . . . 57

4.18 fac e facp dos res´ıduos do modelo AR(2) da s´erie RIO . . . 57

4.19 fac e facp dos res´ıduos do modelo para a s´erie RIO . . . 58

(13)

4.21 Gr´afico da s´erie CAXIAS . . . 60

4.22 autocorrela¸c˜oes da s´erie CAXIAS . . . 60

4.23 autocorrela¸c˜oes parciais da s´erie CAXIAS . . . 61

4.24 Previs˜oes CAXIAS . . . 62

A.1 Autocorrela¸c˜oes da S´erie RJ com uma diferencia¸c˜ao . . . 79

(14)

Lista de Tabelas

1.1 Os munic´ıpios menos e mais populosos do Estado do Rio de Janeiro em 2010 22

3.1 Comportamento das fac e facp de um processo ARM A(p, q) . . . 38

4.1 Descri¸c˜ao do tamanho da popula¸c˜ao entre os anos 2001 e 2010 . . . 44

4.2 Descri¸c˜ao do n´umero de casos entre os anos de 2001 e 2010 . . . 44

4.3 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos . . . 54

4.4 Valores previstos e observados da s´erie RJ . . . 55

4.5 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos . . . 58

4.6 Valores previstos e observados da s´erie RIO . . . 59

4.7 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos de 4.8 . . . 61

4.8 Valores previstos e observados da s´erie CAXIAS . . . 63

A.1 Munic´ıpios com maiores taxa de incidˆencia em 2001 . . . 74

A.2 Munic´ıpios com maiores taxa de incidˆencia em 2002 . . . 74

A.3 Munic´ıpios com maiores taxa de incidˆencia em 2003 . . . 75

A.4 Munic´ıpios com maiores taxa de incidˆencia em 2004 . . . 75

A.5 Munic´ıpios com maiores taxa de incidˆencia em 2005 . . . 76

A.6 Munic´ıpios com maiores taxa de incidˆencia em 2006 . . . 76

A.7 Munic´ıpios com maiores taxa de incidˆencia em 2007 . . . 77

A.8 Munic´ıpios com maiores taxa de incidˆencia em 2008 . . . 77

A.9 Munic´ıpios com maiores taxa de incidˆencia em 2009 . . . 78

A.10 Munic´ıpios com maiores taxa de incidˆencia em 2010 . . . 78

(15)

11

1 Introdu¸

ao

1.1

A tuberculose

A tuberculose (TB) ´e uma doen¸ca infectocontagiosa causada principalmente por um micro-organismo chamado Bacilo de Koch, cujo nome cientifico ´e Mycobacterium tuberculosis, respons´avel por mais de 98% dos casos [1]. ´E uma doen¸ca de notifica¸c˜ao compuls´oria, ou seja, est´a na listagem - estabelecida pelo Minist´erio da Sa´ude - das doen¸cas de maior relevˆancia sanit´aria do pa´ıs. A notifica¸c˜ao equivale `a comunica¸c˜ao da ocorrˆencia de de-terminada doen¸ca ou agravo `a sa´ude, feita neste caso pela unidade de sa´ude que descobre e inicia o tratamento. ´E a partir da notifica¸c˜ao compuls´oria que, na maioria das vezes, se desencadeia o processo informa¸c˜ao-decis˜ao-a¸c˜ao, que ´e feito pela vigilˆancia epidemiol´ogica. Os dados coletados s˜ao inclu´ıdos no Sistema Nacional de Agravos Notific´aveis (Sinan) [2]. A TB ´e uma doen¸ca milenar. Esqueletos com les˜oes ´osseas compat´ıveis com a tuberculose tˆem sido encontrados em v´arias regi˜oes, sendo o mais antigo com cerca de 5000 a.C. [1]. Atualmente, a forma mais comum da doen¸ca ´e a tuberculose pulmonar, mas outros ´org˜aos tamb´em podem ser atingidos.

1.1.1

A transmiss˜

ao, os sintomas e a evolu¸

ao

A TB ´e transmitida de pessoa para pessoa atrav´es da respira¸c˜ao, o que pode ocorrer quando algu´em com a doen¸ca pulmonar tosse, fala ou espirra e os bacilos s˜ao lan¸cados no ar. Os bacilos que ficam em roupas, len¸c´ois, copos e outros objetos n˜ao desempenham papel importante na transmiss˜ao da doen¸ca. Calcula-se que um indiv´ıduo infectado pelo Bacilo de Koch poder´a transmiti-lo para uma m´edia de 10 a 15 pessoas no per´ıodo de um ano [2]. Os principais sintomas da TB s˜ao tosse prolongada (por mais de trˆes semanas) com ou sem catarro, cansa¸co, emagrecimento e, febre e suor noturnos.

O per´ıodo de transmiss˜ao ocorre enquanto o doente estiver eliminando os ba-cilos e n˜ao iniciar o tratamento, depois deste, a transmiss˜ao ser´a reduzida gradativamente a n´ıveis insignificantes dentro de poucos dias ou semanas. As crian¸cas com tuberculose

(16)

1.1 A tuberculose 12 pulmonar geralmente n˜ao s˜ao infectantes [2].

A maior parte dos novos casos de TB pulmonar ocorre em torno de 12 meses ap´os a infec¸c˜ao inicial do bacilo [2]. A probabilidade desta infec¸c˜ao evoluir para a do-en¸ca, o que normalmente ocorre com baixa probabilidade [3], depende de v´arios fatores: idade avan¸cada, condi¸c˜oes s´ocio-econˆomicas e algumas condi¸c˜oes m´edicas [2], como por exemplo, pessoas infectadas com o v´ırus da imunodeficiˆencia humana adquirida (HIV) [3]. Atualmente a associa¸c˜ao do HIV/ TB ´e um s´erio problema de sa´ude p´ublica que pode levar ao aumento da morbidade e mortalidade em muitos pa´ıses [2]; a co-infec¸c˜ao HIV/TB faz com que o tempo da evolu¸c˜ao da AIDS diminua, o mesmo ocorre para a evolu¸c˜ao da tuberculose [1]. Normalmente nos infectados com Mycobacterium tuberculosis, o risco de desenvolver a tuberculose ativa ´e em torno de 0,2% ao ano e de 5% a 10% durante a vida. Nos infectados tamb´em pelo HIV esse risco sobe para 15% em um ano e para 50% ao longo da vida [1]. As pessoas expostas ao bacilo da tuberculose que n˜ao se infectaram ficam com os bacilos presentes no organismo, mas o sistema imune os mantˆem sob controle [2].

1.1.2

O diagn´

ostico

O m´etodo mais utilizado no mundo para o diagn´ostico da TB ´e a baciloscopia do escarro (desenvolvido h´a mais de 100 anos), em que bact´erias s˜ao observadas sob um microsc´opio atrav´es da amostra da expectora¸c˜ao [3]; ´e considerado um m´etodo extremamente pr´ a-tico e eficaz, com a capacidade de identificar os indiv´ıduos que eliminam os bacilos. A bacioloscopia ´e considerado um exame diagnosticador por excelˆencia em pa´ıses em desen-volvimento, onde os ´ındices da doen¸ca s˜ao significativos. O m´etodo consagrado para o exame bacilosc´opico ´e o de Ziehl-Neelsen [1]. Em pa´ıses com capacidade laboratorial mais desenvolvida, os casos de TB tamb´em podem ser diagnosticados atrav´es de m´etodos de cultura (o padr˜ao ouro atual) ou, utilizando m´etodos moleculares r´apidos [3].

1.1.3

O tratamento e a cura

At´e o final do s´eculo 19, os tratamentos da tuberculose eram irracionais: ingest˜ao de pre-paros ex´oticos, utiliza¸c˜ao de sangrias, indu¸c˜ao de vˆomitos; alguns pacientes eram proibidos de falar ou rir, outros ficavam deitados sem poder se movimentar. Depois o tratamento mais comum se tornou a mudan¸ca de clima, quando os pacientes se deslocavam para

(17)

1.1 A tuberculose 13 regi˜oes litorˆaneas ou montanhosas para se tratar, aqueles que n˜ao tinham for¸cas para a viagem passavam a dormir com travesseiros de folhas de pinheiro ou colocar algas ma-rinhas debaixo da cama. Em um momento da hist´oria era comum pacientes irem para sanat´orios receberem o tratamento, estes eram como pousadas e ficavam nas montanhas, tais lugares passaram a ser usados para isolamento dos doentes, tornando-se centros de tratamento para pessoas de qualquer classe social [4].

Com a descoberta do bacilo, surgiram os tratamentos com soros, ant´ıgenos bacilares, vacinas; mas todos sem efic´acia. At´e a d´ecada de 40, o tratamento universal utilizado era o pneumot´orax, que curava apenas cerca de 30 a 40% dos casos [1].

Foi a partir de 1940, com a descoberta de drogas destrutoras do bacilo da tuberculose, que surgiu a era moderna da quimioterapia. Este novo tratamento curava todas as formas de tuberculose. Assim, a letalidade da doen¸ca, que era alt´ıssima, caiu drasticamente, e tamb´em houve diminui¸c˜ao do cont´agio [1].

Atualmente, h´a cerca de doze f´armacos com atividade antituberculosa. O tratamento com a quimioterapia visa impedir o desenvolvimento da resistˆencia, obter a negativa¸c˜ao bacteriol´ogica, obter a cura e evitar reca´ıdas. Para atingir esses objetivos, algumas regras tˆem que ser rigorosamente seguidas [1].

O tratamento ´e dividido em duas partes; na primeira, a chamada “fase inicial intensiva” ou “fase de ataque”, h´a necessidade da utiliza¸c˜ao simultˆanea de pelo menos trˆes medicamentos, o uso destes tem importˆancia decisiva para o resultado final, pois ´

e imprescind´ıvel reduzir o mais r´apido poss´ıvel a popula¸c˜ao bacteriana; quando esta ´e reduzida at´e cerca de 103, a probabilidade de surgirem novos mutantes resistentes ´e baixa.

Esta primeira fase varia de um a trˆes meses [1]. Assim, os objetivos nesta fase s˜ao: reduzir a transmissibilidade, a morbidade e a resistˆencia adquirida [5]. Na segunda, a “fase de manuten¸c˜ao ou de continua¸c˜ao”, dado que a popula¸c˜ao bacilar nas les˜oes est´a muito reduzida, pode ser geralmente realizada com duas drogas [1]. A segunda fase tem como objetivo eliminar os bacilos persistentes proporcionando uma cura efetiva e duradoura da doen¸ca [5].

Quanto ao n´umero de medicamentos, a experiˆencia comprovou que a associa¸c˜ao de trˆes ´e suficiente para impedir a emergˆencia de bacilos resistentes, garantindo o ˆexito do tratamento. A administra¸c˜ao de uma droga ´unica mata os bacilos sens´ıveis e seleciona os germes resistentes a essa droga fazendo com que ocorra uma r´apida multiplica¸c˜ao

(18)

1.1 A tuberculose 14 dos restantes. Com a administra¸c˜ao de diversas drogas simultaneamente, os mutantes resistentes `a determinada droga, sendo sens´ıveis `a outra droga, acabam morrendo [1].

H´a trˆes tipos de resistˆencia a medicamentos que dificultam o tratamento da TB. O tratamento com uma droga, ou com v´arias drogas administradas irregularmente, gera a chamada resistˆencia adquirida. A resistˆencia prim´aria ocorre quando um caso novo de tuberculose, que nunca foi submetido `a quimioterapia elimina bacilos resistentes a uma ou mais drogas; esse cont´agio de tuberculose foi feito por germes que j´a eram resistentes `

as drogas. Para o doente com resistˆencia prim´aria, a quimioterapia padr˜ao ´e inoperante. A tuberculose multirresistente ´e o caso que tem resistˆencia conjunta aos dois principais medicamentos utilizados (rifampicina e isoniazida)[1].

Para evitar a resistˆencia adquirida, as drogas devem ser administradas em doses corretas e intervalos de tempo adequados, com toda a regularidade, garantindo sua concentra¸c˜ao no sangue e nas les˜oes em n´ıvel efetivo antibacteriano. Mesmo os efeitos ben´eficos de uma fase inicial intensiva correta podem ser anulados por irregularidade no per´ıodo de manuten¸c˜ao. A interrup¸c˜ao prematura do tratamento ´e tamb´em uma irregularidade que dificulta a cura e facilita as recidivas [1].

Por causa do not´avel aumento de cepas do M. tuberculosis resistentes `as dro-gas, os testes de sensibilidade tornaram-se ainda mais necess´arios e entraram na pr´atica comum nos servi¸cos de bacteriologia. Os m´etodos convencionais mais acess´ıveis fornecem os resultados com prazos relativamente longos. Outros m´etodos, cujos resultados s˜ao for-necidos com tempo mais curto, exigem equipamentos especializados, s˜ao de alto custo e s´o est˜ao ao alcance de laborat´orios mais aparelhados [1].

O conceito de “tempo suficiente” na quimioterapia da tuberculose modificou-se muito ao comparar os atuais crit´erios e os imperantes nos primeiros 20 anos de sua descoberta, quando o tratamento deveria ser de longa dura¸c˜ao, cerca de dois anos. Com o tempo, verificou-se que o tratamento pode ser encurtado para 12 meses usando alguns tipos espec´ıficos de medicamentos. Com alguns tipos de drogas, o tempo de tratamento pode ser encurtado para nove ou seis meses e h´a perspectivas de se tornar ainda mais curto [1].

A avalia¸c˜ao bacteriol´ogica ´e fundamental para o conceito de cura. A avalia¸c˜ao bacilosc´opica, havendo escarro, deve ser rotineiramente mensal. Depois do sexto mˆes de tratamento, com baciloscopia negativa, a cura, sempre que poss´ıvel, deve ser confirmada

(19)

1.2 A tuberculose no mundo 15 pela cultura. A maioria das reca´ıdas ocorre no primeiro ano ap´os o termino do tratamento, cerca de 70% no primeiro semestre; reduzem-se a 1% entre o terceiro e o quinto ano [1].

Apesar da existˆencia de um eficaz tratamento, com taxa de cura de cerca de 90% das pessoas submetidas a este [3], durante d´ecadas a TB continua sendo um importante problema de sa´ude global.

1.1.4

O controle e a preven¸

ao

O cont´agio da TB se agrava por circunstˆancias econˆomico-sociais desfavor´aveis, como pobreza, aglomera¸c˜oes, mobiliza¸c˜oes humanas, guerras. Para o seu controle as principais medidas s˜ao a r´apida descoberta dos casos novos e o tratamento imediato [1].

Uma das maneiras de prevenir as formas mais graves de tuberculose ´e atrav´es da vacina BCG [2], aplicada em crian¸cas, com exce¸c˜ao de casos de soropositivas, ou rec´em nascidas que apresentarem sinais ou sintomas de Aids. Outras formas de preven¸c˜ao incluem evitar aglomera¸c˜oes, principalmente em ambiente fechados, mal ventilados e sem ilumina¸c˜ao solar [4].

1.2

A tuberculose no mundo

A partir da d´ecada de 1940, com o inicio do tratamento com quimioterapia, a tuberculose praticamente foi eliminada nos pa´ıses desenvolvidos. Nos pa´ıses em desenvolvimento e subdesenvolvidos, a diminui¸c˜ao foi insignificante, mas a doen¸ca deixou de constituir um s´erio problema de sa´ude p´ublica. Por´em, a partir dos anos 80, a tuberculose aumentou em todas as ´areas, principalmente nos pa´ıses em desenvolvimento e subdesenvolvidos. V´arios fatores contribu´ıram para essa grave revers˜ao: a falta de aten¸c˜ao aos programas de controle da tuberculose, a epidemia do HIV, o crescimento de cepas do Mycobacterium tuberculosis resistentes `as drogas antituberculosas, o aumento geral da mis´eria entre outros [1]. Esse evento levou a Organiza¸c˜ao Mundial de Sa´ude (OMS), em mar¸co de 1993, declarar a tuberculose em estado de urgˆencia e emergˆencia no mundo; neste ano se estimava um n´umero entre 7 e 8 milh˜oes de casos e que entre 1,3 e 1,6 milh˜oes de pessoas morriam a cada ano ([1]; [6]).

(20)

trata-1.2 A tuberculose no mundo 16 mento da tuberculose nos ´ultimos programas de sa´ude p´ublica que eram piores em muitos pa´ıses em desenvolvimento. Dos 8 milh˜oes de casos novos notificados no mundo, 2,5 mi-lh˜oes n˜ao receberam qualquer tratamento; 5 milh˜oes tiveram quimioterapia irregular e apenas 500.000 haviam tido tratamento supervisionado. Pelas graves consequˆencias cl´ıni-cas e epidemiol´ogicas decorrentes da quimioterapia irregular, a Organiza¸c˜ao Mundial da Sa´ude em um de seus documentos fez afirma¸c˜ao de que o “tratamento da tuberculose mal supervisionado e incompleto ´e realmente pior do que n˜ao tratar de todo” [1].

Fundamentado nesses dados, a Uni˜ao Internacional Contra a Tuberculose e Doen¸cas Respirat´orias desenvolveu a estrat´egia do tratamento diretamente supervisio-nado, recomendado pela Organiza¸c˜ao Mundial da Sa´ude, o DOTS (Directly Observed Treatment Short-Course), o tratamento de curta dura¸c˜ao diretamente supervisionado. A estrat´egia DOTS transfere a responsabilidade do tratamento, que antes era do paciente, para os ´org˜aos oficiais da sa´ude. Estes destacam profissionais da sa´ude para diariamente verificarem pessoalmente a tomada dos medicamentos. Em alguns pa´ıses h´a o treinamento de volunt´arios, que se encarregam de alguns doentes de sua vizinhan¸ca, para aconselh´ a-los e esclarecˆe-los da necessidade do tratamento correto e principalmente para assistir a tomada dos medicamentos. O tratamento supervisionado di´ario ´e fundamental nos dois primeiros meses da fase de ataque, podendo na fase de continua¸c˜ao ser duas vezes ou at´e s´o uma vez na semana [1].

As principais vantagens da estrat´egia DOTS s˜ao: altos ´ındices de cura; a negativa¸c˜ao bacteriol´ogica mais r´apida, o que evita o cont´agio e o aparecimento de novos casos; as chances de ocorrer o desenvolvimento da resistˆencia dos bacilos `as drogas s˜ao praticamente nulas; o custo-benef´ıcio ´e baixo, o Banco Mundial coloca o DOTS como o procedimento mais barato de todas as a¸c˜oes de sa´ude [1].

H´a registros de v´arios pa´ıses mostrando que o DOTS pode elevar as curas para em torno de 85%, sendo comuns os ´ındices de 95%. Como exemplo, pode-se citar a China, que apresenta alta prevalˆencia de tuberculose e que em trˆes anos ap´os a ado¸c˜ao do DOTS elevou as curas de 50% a mais de 90%, e reduziu em 50% a propor¸c˜ao de retratamentos [1].

Apesar da maior aten¸c˜ao dada aos programas de controle da doen¸ca, atual-mente, casos de resistˆencias prim´aria e adquirida est˜ao aumentando em todos os pa´ıses em desenvolvimento e desenvolvidos, mais rapidamente nos primeiros. O problema mais

(21)

1.2 A tuberculose no mundo 17 preocupante ´e o crescimento da multidrogarresistˆencia, fato que amea¸ca a falˆencia do tratamento da tuberculose [1].

Atualmente, segundo estimativas da Organiza¸c˜ao Mundial da Sa´ude (OMS), um ter¸co da popula¸c˜ao mundial est´a infectada e assim, est´a sob risco de desenvolver a enfermidade. A maioria dos casos ocorre em pa´ıses em desenvolvimento [6], de onde se estima a ocorrˆencia de 95% dos casos e 98% das mortes causadas pela doen¸ca, atingindo toda a popula¸c˜ao, mas predominando em indiv´ıduos economicamente ativos, ou seja, pessoas com idade entre 15 e 54 anos [2]. Algumas caracter´ısticas sociais presentes em grandes centros urbanos nesses pa´ıses, como pobreza, baixa escolaridade, situa¸c˜oes de confinamento, utiliza¸c˜ao de drogas e a dificuldade de acesso aos servi¸cos de sa´ude, tornam os indiv´ıduos vulner´aveis, o que contribui para perpetuar a doen¸ca e a mis´eria [7]. Nos pa´ıses desenvolvidos a incidˆencia ´e mais frequente entre pessoas idosas, nas minorias ´

etnicas e em imigrantes estrangeiros [2]. Em geral, a TB ´e mais comum entre homens do que entre mulheres [3].

Em 2010, foram estimados 8,8 milh˜oes de casos novos ou recorrentes, equiva-lente a 128 casos por 100.000 pessoas. Entre esses casos, 5,7 milh˜oes foram diagnosticados e notificados por programas nacionais de controle da TB, entre os quais se estimou 290.000 casos de TB multirresistente dos quais apenas 53.000, o equivalente a 18%, foram diag-nosticados e direcionados ao tratamento adequado. Foram estimados 12 milh˜oes de casos prevalentes, isso equivale a 178 por 100.000 pessoas. [3].

H´a aproximadamente 1,1 milh˜oes de pessoas com a coinfec¸c˜ao TB/HIV, ou seja, aproximadamente 13% do total; desses casos, a ´Africa ´e respons´avel por 82% do total. A maior parte dos casos de TB encontra-se na ´Asia (59%) e na ´Africa (26%), em menores propor¸c˜oes est˜ao na regi˜ao do mediterrˆaneo (7%), Europa (5%) e Am´ericas (3%). A maioria dos casos notificados no mundo, 81%, est´a presente em apenas 22 pa´ıses. Os cinco pa´ıses com maior incidˆencia s˜ao: ´India (entre 2 milh˜oes e 2,5 milh˜oes, ou seja, aproximadamente 26% do total de casos), China (0,9 milh˜ao e 1,2 milh˜ao, ou seja, 12%),

´

Africa do Sul (0,4 milh˜ao – 0,59 milh˜ao), Indon´esia (0,37 milh˜ao – 0,54 milh˜ao) e Paquist˜ao (0,33 milh˜ao – 0,48 milh˜ao). Ao se observar a incidˆencia por sexo, segundo estimativas, h´a 3,2 milh˜oes de casos entre as mulheres, ou seja, 36% do total [3].

Como enfermidade reemergente, est´a entre as dez principais causas de morte no mundo, a 8a [3], levando 1,5 milh˜oes de pessoas a ´obito; e ´e a segunda maior por

(22)

1.3 A tuberculose no Brasil 18 doen¸ca infecciosa, ficando atr´as apenas do HIV, que causou aproximadamente 1,8 milh˜oes de mortes em 2008 [3].

Em 2010, estima-se que 1,1 milh˜oes de pessoas entre as que apresentavam HIV-negativo morreram, o equivalente a 15 mortes por 100.000 habitantes, entre as pessoas com HIV/TB, a estimativa ´e de 0,35 milh˜oes de mortes, mas esses casos s˜ao considerados pela CID-10 como morte por HIV. Se considerar o n´umero de mortes por tuberculose com HIV positivo e negativo, equivale a uma estimativa de 20 mortes por 100.000 habitantes [3].

Desde 2006, o n´umero absoluto de casos por ano de TB tem diminu´ıdo glo-balmente; e a taxa de incidˆencia (por 100.000 habitantes) diminui cerca de 1,3% ao ano desde 2002. As maiores taxas de decl´ınio foram nas Am´ericas, 3,7% ao ano, e na ´Africa, 1,8% ao ano. Em rela¸c˜ao aos 22 pa´ıses que concentram as maiores taxas de incidˆencia, a ´ultima avalia¸c˜ao realizada revelou que as taxas est˜ao diminuindo em 10 pa´ıses, est´avel em 11 e aumentando lentamente na ´Africa do Sul [3].

A tuberculose parece n˜ao apresentar varia¸c˜oes c´ıclicas ou sazonais. A prevalˆ en-cia observada ´e maior em ´areas de grande concentra¸c˜ao populacional, prec´arias condi¸c˜oes s´ocio-econˆomicas e sanit´arias [2].

1.3

A tuberculose no Brasil

Em 1996, visando controlar a TB no Brasil, o Minist´erio da Sa´ude lan¸cou o Plano Emer-gencial para o Controle da Tuberculose, que recomendava a implanta¸c˜ao da Estrat´egia do Tratamento Diretamente Observado (DOTS), esse plano foi oficializado em 1999 por interm´edio do Programa Nacional de Controle da Tuberculose (PNCT). Esta estrat´egia continua sendo uma das prioridades, a meta ´e curar 85% dos doentes e diminuir a taxa de abandono a menos de 5%, e assim evitar o surgimento de bacilos resistentes e possibilitar um controle efetivo da tuberculose no pa´ıs [8].

Segundo dados da OMS, atualmente, o Brasil ocupa o 19o lugar entre os 22

pa´ıses respons´aveis por 80% do total de casos de tuberculose no mundo, e se observado o coeficiente de incidˆencia ocupa a 104o posi¸c˜ao ([9]; [10]). No Brasil h´a aproximadamente

100 mil notifica¸c˜oes de casos de Tuberculose por ano e, destes 85 mil s˜ao novos. Cerca de 6 mil pacientes morrem por ano no pa´ıs, onde a doen¸ca tem sido a 4a causa de morte por

(23)

1.3 A tuberculose no Brasil 19 doen¸cas infecciosas [10] e a 1a causa de morte em pacientes com AIDS [9].

Em 2008, os estados com maior n´umero de casos foram: S˜ao Paulo com 15.371 casos, Rio de Janeiro com 10.975 casos e Pernambuco com 4.125 casos, e os estados com maior taxa de incidˆencia foram: Rio de Janeiro (69,14/100.000 habitantes), Amazonas (67,97/100.000 habitantes) e Pernambuco (47,22/100.000 habitantes) [9].

Os principais fatores que contribuem para a manuten¸c˜ao e agravamento do problema s˜ao a persistˆencia da pobreza na sociedade e a ocorrˆencia da AIDS nos grandes centros urbanos (Minist´erio da Sa´ude, 2009); as comunidades mais atingidas s˜ao as po-pula¸c˜oes em situa¸c˜ao de rua, popula¸c˜ao negra, privadas de liberdade, ind´ıgenas e pessoas vivendo com HIV/AIDS [10].

Nas popula¸c˜oes consideradas mais vulner´aveis, as taxas de incidˆencia s˜ao mai-ores do que a apresentada na m´edia nacional. Comparando tamb´em com a popula¸c˜ao geral, na popula¸c˜ao negra ´e duas vezes maior e na ind´ıgena, quatro vezes. Na popula¸c˜ao carcer´aria, a taxa de incidˆencia ´e 25 vezes maior, j´a entre os portadores de HIV ´e 30 vezes maior e na popula¸c˜ao vivendo em situa¸c˜ao de rua, essa diferen¸ca chega a ser de 67 vezes se comparada a m´edia nacional [9]. E, segundo o Guia de Vigilˆancia Epidemiol´ogica (2010), os homens adoecem duas vezes mais do que as mulheres.

A forma considerada mais preocupante da doen¸ca, a tuberculose multirresis-tente, foi medida no Brasil entre os anos de 1995 e 1997 e evidenciou baixa resistˆencia prim´aria, cerca de 1,1%. A multirresistˆencia adquirida teve percentual maior, cerca de 7,9%, o que evidencia tratamentos irregulares ou m´ultiplos abandonos de tratamento. Mas ´

e norma nacional a realiza¸c˜ao de teste de sensibilidade `as drogas em todos os pacientes que se submetem a algum tratamento [1].

A partir da padroniza¸c˜ao do tratamento - rifampicina, isoniazida, pirazinamida e etambutol [8] - e da garantia de gratuidade medicamentos, pˆode-se implantar um sistema de vigilˆancia de tuberculose multirresistente no pa´ıs. Assim, houve progressiva melhora do percentual de cura de casos e redu¸c˜ao do percentual de ´obitos entre esses casos, que era muito grande [1].

Para os casos multidrogarresistentes, esgotadas todas as possibilidades quimi-oter´apicas, h´a a aplica¸c˜ao de procedimentos cir´urgicos depois de rigorosa avalia¸c˜ao clinica do paciente. No Brasil h´a tendˆencia de considerar a multidrogarresistnˆencia como sendo a resistˆencia do M. tuberculosis a trˆes ou mais drogas [1].

(24)

1.4 A tuberculose no Estado do Rio de Janeiro 20 No Brasil, a vacina BCG - uma maneira de prevenir as formas mais graves da TB - ´e indicada para as crian¸cas de 0 a 4 anos de idade [2].

Com o objetivo de intensificar as a¸c˜oes voltadas para o controle da tuberculose, em 2009, o Minist´erio da Sa´ude, por meio do Programa Nacional de Controle da Tubercu-lose, estabeleceu novos crit´erios para prioriza¸c˜ao de munic´ıpios no controle da tuberculose no Brasil. Os atuais crit´erios levam em considera¸c˜ao as caracter´ısticas: capitais; muni-c´ıpios com popula¸c˜ao igual ou maior a 100.000 habitantes; taxa de incidˆencia superior a 80% da taxa nacional (32 novos casos por 100.000 habitantes em 2007); taxa de mor-talidade por tuberculose superior `a taxa nacional (2,5 ´obitos por 100.000 habitantes em 2007). Atualmente 181 munic´ıpios est˜ao inclu´ıdos nessa lista. A regi˜ao sudeste apresenta o maior n´umero de munic´ıpios considerados priorit´arios, seguida pela regi˜ao Nordeste e Sul. Os estados de S˜ao Paulo e Rio de Janeiro abrangem 76,5% dos munic´ıpios priorit´arios da regi˜ao sudeste [11].

1.4

A tuberculose no Estado do Rio de Janeiro

Em 2005, 54% dos casos do Estado eram de residentes do munic´ıpio do Rio de Janeiro. Em rele¸c˜ao ao tratamento, a taxa de cura foi 70,2%, e a taxa de abandono, que representa o maior obst´aculo para a efetividade do tratamento, foi de 14% [6].

O estado do Rio de janeiro apresenta uma das maiores taxas de incidˆencia da doen¸ca no pa´ıs. Em 2009 houve a notifica¸c˜ao de 11.778 casos novos de TB, com taxa de incidˆencia de 73,6 casos por 100.000 habitantes [6].

A taxa de incidˆencia da tuberculose na popula¸c˜ao e o ´ındice de mortalidade vˆem a cada ano sendo reduzidos no Estado. De 2001 a 2009 a taxa de incidˆencia passou de 91,1 para 71,1 casos por 100.000 habitantes. J´a quanto `a mortalidade, a taxa variou de 7,1 em 2001 para 5,0 em 2009 [12].

Grande parte de casos de TB no estado se encontram nos grandes centros urbanos, onde ´e poss´ıvel observar v´arios problemas sociais. Dentro de “comunidades” a incidˆencia de tuberculose ´e de quatro a cinco vezes maior do que a m´edia estadual, o que impacta fortemente o ´ındice global do Rio de Janeiro. Na comunidade Rocinha, onde moram 160 mil pessoas, encontra-se uma das piores taxas de tuberculose do mundo - em 2010 a incidˆencia foi de 386,7 casos por 100.000 habitantes. Entre os fatores que podem

(25)

1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 21 contribuir para a dissemina¸c˜ao de doen¸cas respirat´orias de comunidades est˜ao: o n´umero de cˆomodos e a concentra¸c˜ao humana intradomiciliar, e o processo de urbaniza¸c˜ao local, que n˜ao favorece o arejamento e entrada de luz solar nos domic´ılios [13].

Entre os munic´ıpios considerados priorit´arios para o controle da Tuberculose no Brasil, 21 s˜ao do Estado do Rio de Janeiro [11].

1.5

A distribui¸

ao da popula¸

ao do Estado do Rio de

Janeiro

O Estado do Rio de Janeiro situa-se na regi˜ao sudeste do Brasil e ocupa uma ´area de 43.780,157 km2, o tamanho da popula¸c˜ao ´e 15.989.929 e densidade demogr´afica 365,23

pessoas/km2 [14].

Figura 1.1: Mapa do Estado do Rio de Janeiro

Fonte:

http://mapasblog.blogspot.com.br/2011/11/mapas-do-estado-do-rio-de-janeiro.html

A Figura 1.1 apresenta o mapa dos munic´ıpios do estado, j´a a Figura 1.2 a distribui¸c˜ao da popula¸c˜ao em 2010. A Tabela 1.5 apresenta os cinco munic´ıpios com maior quantidade de habitantes e os cinco com menor quantidade.

(26)

1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 22 Tabela 1.1: Os munic´ıpios menos e mais populosos do Estado do Rio de Janeiro em 2010

Munic´ıpio Popula¸c˜ao Macuco 5.269 S˜ao Jos´e de Ub´a 7.003 Laje do Muria´e 7.491 Comendador Levy Gasparian 8.183 Rio das Flores 8.545

.. . ... Niter´oi 487.327 Nova Igua¸cu 795.212 Duque de Caxias 855.046 S˜ao Gon¸calo 999.901 Rio de Janeiro 6.323.037 Fonte:IBGE, 2010

de 70% dela concentrada na Regi˜ao Metropolitana e aproximadamente 40% no munic´ıpio do Rio de Janeiro. No per´ıodo entre 2001 e 2010, houve alto crescimento populacional em v´arias cidades, mas a que mais cresceu foi Rio das Ostras, cerca de 165,7% [14].

No Cap´ıtulo 2 s˜ao apresentados os objetivos geral e espec´ıficos do projeto. No Cap´ıtulo 3 ´e apresentado o banco de dados e a metodologia utilizada. Os resultados ser˜ao descritos no Cap´ıtulo 4. Os Cap´ıtulos 5 e 6 ser˜ao para discuss˜ao de resultados e conclus˜ao.

(27)

1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 23

Figura 1.2: Distribui¸c˜ao da popula¸c˜ao por 10.000 habitantes em 2010

0 100 200 300 400 500 600

(28)

24

2 Objetivos

2.1

Objetivos Gerais

Verificar a difus˜ao da tuberculose no Estado do Rio de Janeiro.

2.2

Objetivos Espec´ıficos

ˆ Observar a varia¸c˜ao espacial da taxa de incidˆencia em todos os munic´ıpios do Estado do Rio de Janeiro utilizando estimadores cl´assico e bayesiano;

ˆ Observar a evolu¸c˜ao dos casos novos de tuberculose no estado e em algumas cidades, e construir um modelo apropriado para encontrar a previs˜ao de valores futuros.

(29)

25

3 Materiais e M´

etodos

3.1

O Banco de Dados

O banco de dados a ser analisado ´e composto por todos os casos novos notificados de tuberculose ocorridos mensalmente nos munic´ıpios do Estado do Rio de Janeiro entre os anos de 2001 e 2010 [15]; e pelo tamanho popula¸c˜ao de cada munic´ıpio para estes anos [14]. Com rela¸c˜ao ao tamanho da popula¸c˜ao, os dados do ano 2006 s˜ao da contagem populacional, do ano 2010 s˜ao do Censo Demogr´afico e dos outros anos s˜ao de proje¸c˜oes populacionais realizadas pelo IBGE.

Os dados foram estruturados em planilhas do Excel e para gerar os gr´aficos foi utilizado o software R.

Para cumprir os objetivos deste trabalho, ser˜ao apresentadas, respectivamente, a abordagem referente `a an´alise espacial e outra referente `a an´alise de s´eries temporais. A se¸c˜ao 3.2 apresenta a nota¸c˜ao a ser utilizada ao longo do trabalho.

3.2

Nota¸

ao

Para fazer referˆencias a determinada unidade de ´area e ao instante de tempo define-se

i= ´ındice associado `a unidade de ´area; onde i = 1, 2, . . . , N ; t= ´ındice associado `a unidade de tempo; onde t = 1, 2, . . . , T .

Assim, para uma regi˜ao i e para o instante de tempo t, tem-se que

Yit= n´umero de ocorrˆencias do evento de interesse,

nit= tamanho da popula¸c˜ao sob risco,

(30)

3.3 An´alise de dados espaciais 26 Na Se¸c˜ao 3.3 a abordagem ser´a apenas espacial e o tempo ser´a considerado fixo e, assim, para simplificar a nota¸c˜ao o ´ındice t ser´a omitido. Na Se¸c˜ao 3.4 a abordagem ser´a apenas temporal, e neste caso o ´ındice omitido ser´a o i.

3.3

An´

alise de dados espaciais

Define-se an´alise espacial como o estudo quantitativo de fenˆomenos alocados no espa¸co. Dentro deste, mas com limita¸c˜oes, h´a a an´alise de dados espaciais, que ´e utilizada quando os dados s˜ao espacialmente localizados e ´e levado em considera¸c˜ao o arranjo espacial na an´alise ou na interpreta¸c˜ao dos resultados [16].

Existem v´arias maneiras de se tratar esses tipos de dados, neste trabalho ser˜ao utilizados dados de ´area, que consiste em dados espaciais que foram agregados em unidades de ´area, neste caso em cidades. Dados de ´area s˜ao comumente utilizados em epidemiologia, podendo oferecer alguma perspectiva para sugest˜oes de pol´ıticas para controlar poss´ıveis epidemias.

Em estudos epidemiol´ogicos, a analise espacial ´e utilizada para identificar pa-dr˜oes espaciais de morbidade e mortalidade e os fatores associados a esses padr˜oes; des-crever o processo de difus˜ao de doen¸cas e gerar conhecimento sobre as causas de doen¸cas, visando a predi¸c˜ao e o controle [17].

O requisito essencial em qualquer an´alise de dados ´e a habilidade de “ver” os dados que est˜ao sendo analisados, em dados espaciais essa visualiza¸c˜ao ´e feita atrav´es de mapas. Como qualquer t´ecnica gr´afica de apresenta¸c˜ao de dados, os mapas podem ser de diversas formas, para analisar dados de ´area s˜ao utilizados os “mapas zonalmente sombreados” ou coropl´eticos [16].

Em an´alise de dados espaciais, matematicamente, tem-se o processo {Y (Ai), Ai ∈

A1, . . . , AN}, onde (A1, . . . , AN) s˜ao sub regi˜oes de R, em que

SN

i=1Ai = R e

TN

i=1Ai = ∅.

Genericamente pode-se referir as vari´aveis aleat´orias Y (Ai) como Yi e o valor observado

denota-se por yi. Os dados constituem uma das poss´ıveis realiza¸c˜oes dos valores do

atri-buto em todos os locais [16]. Lembrando-se que os valores s˜ao agregados por ´area e n˜ao por medi¸c˜oes em locais espec´ıficos.

Neste trabalho, a varia¸c˜ao espacial dos atributos de interesse ser´a visualizada atrav´es de mapas coropl´eticos, onde a ´area Ai´e colorida de acordo com uma escala de cores

(31)

3.3 An´alise de dados espaciais 27 baseado no atributo de interesse dentro da ´area. O n´umero de classes e os correspondentes intervalos podem ser baseados em diferentes crit´erios, aqui os quintis ser˜ao utilizados.

3.3.1

Estimadores Espaciais

Para avaliar a ocorrˆencia de doen¸cas, os epidemiologistas costumam usar duas medidas b´asicas: a incidˆencia acumulada, ou seja, o n´umero total de novos casos durante o per´ıodo, que reflete o risco m´edio da doen¸ca em uma popula¸c˜ao ao longo de um per´ıodo de tempo especificado, e a taxa de incidˆencia, que reflete a taxa m´edia da ocorrˆencia da doen¸ca por unidade de pessoa-tempo [18].

Observar a varia¸c˜ao espacial das taxas de um determinado fenˆomeno ´e parte fundamental de estudos epidemiol´ogicos. Assim, a apresenta¸c˜ao dos valores obtidos para as estimativas atrav´es de sequˆencia de mapas torna poss´ıvel a compara¸c˜ao de padr˜oes e a identifica¸c˜ao de tendˆencias espa¸co-temporais.

A ocorrˆencia de eventos de sa´ude em uma popula¸c˜ao n˜ao pode ser considerada um valor fixo, por isso ´e poss´ıvel supor que o n´umero de casos ´e uma vari´avel aleat´oria e o que se observa ´e uma poss´ıvel realiza¸c˜ao entre os muitos valores que poderiam ocorrer. Entre as distribui¸c˜oes mais utilizadas para modelar esses tipos de eventos est˜ao a Binomial e a Poisson. A distribui¸c˜ao de Poisson ´e frequentemente utilizada quando os dados s˜ao relacionados a contagem de casos [18].

Ent˜ao, utilizando a distribui¸c˜ao Poisson, para cada regi˜ao i em um instante de tempo t tem-se que

Yi ∼ P oisson(niθi),

onde ni ´e o tamanho da popula¸c˜ao sob risco e θi ´e a taxa de incidˆencia para a regi˜ao i.

Um dos objetivos deste trabalho ´e inferir a taxa de incidˆencia, assim, nas se¸c˜oes seguintes ser˜ao apresentados m´etodos para realizar tal inferˆencia.

3.3.1.1.Estimador Cl´assico

Quando se utiliza a defini¸c˜ao de estat´ıstica cl´assica, a ´unica distribui¸c˜ao envolvida para se determinar estimativas dos parˆametros ´e a verossimilhan¸ca. Os parˆametros tˆem valores fixos e s˜ao estimados a partir da amostra que foi recolhida.

(32)

3.3 An´alise de dados espaciais 28 A fun¸c˜ao de verossimilhan¸ca ´e definida como a densidade conjunta de N va-ri´aveis aleat´orias independentes e ´e considerada como uma fun¸c˜ao do parˆametro [19]. Considerando-se o problema como um caso multiparam´etrico, seja θ um vetor de pa-rˆametros cuja dimens˜ao est´a relacionada ao n´umero de munic´ıpios do Estado, ou seja, θ = (θ1, . . . , θN), e seja o vetor y = (y1, . . . , yN) referente ao n´umero de casos em cada um

dos munic´ıpios do Estado, a fun¸c˜ao de verossimilhan¸ca ser´a dada por

L(θ; y) = f (y1, . . . , yN, θi) = N

Y

i=1

f (y, θ). (3.1)

O estimador de m´axima verossimilhan¸ca para a taxa de incidˆencia do munic´ıpio i ´e o valor de θi dentro do espa¸co param´etrico, Θ, que maximiza a fun¸c˜ao L(θ). Tanto

L(θ) quanto logL(θ) tˆem o mesmo valor de m´aximo para θi, assim, para facilitar as contas

costuma-se utilizar o logaritmo da verossimilhan¸ca.

Como a distribui¸c˜ao de Poisson foi adotada, o c´alculo ´e a partir da equa¸c˜ao

L(θ) = N Y i=1 θyie−θ yi! = θP yie−N θY 1 yi! (3.2) dlog(L(θ)) dθi = 0  onde d 2log(L(θ)) dθ2 i < 0  , (3.3) ˆ θi = ¯y. (3.4)

O valor estimado do parˆametro ´e igual `a taxa bruta, ou seja, o n´umero de casos com uma determinada caracter´ıstica dividido pelo tamanho da popula¸c˜ao sob estudo. Assim, o estimador para a taxa de incidˆencia da doen¸ca em estudo na regi˜ao i ´e dado por

T bi =

Yi

ni

i = 1, 2, . . . , N. (3.5)

Um problema observado nesse tipo de abordagem ´e que as taxas estimadas para as ´areas com popula¸c˜ao pequena e com poucos casos do evento estudado s˜ao altamente vari´aveis, j´a que neste caso o impacto de um caso a mais da doen¸ca causado na taxa de incidˆencia ´e grande se comparado a ´areas de grande tamanho populacional. Assim, como uma forma de resolver esse tipo de variabilidade, recorre-se `a Inferˆencia Bayesiana e utiliza-se estimadores onde s˜ao combinados valores observados com informa¸c˜oes subjetivas a priori para o comportamento da regi˜ao, o que tende a suavizar os valores das taxas estimadas [20]. Na se¸c˜ao seguinte ser˜ao apresentados dois tipos de estimadores Bayesianos.

(33)

3.3 An´alise de dados espaciais 29 3.3.1.2. Estimadores Bayesianos

Na inferˆencia Bayesiana os parˆametros s˜ao considerados vari´aveis aleat´orias e a distri-bui¸c˜ao a eles atribu´ıda ´e chamada de distribui¸c˜ao a priori, que descreve a cren¸ca que o parˆametro representa sobre as verdadeiras caracter´ısticas da popula¸c˜ao. Sua especifica-¸c˜ao ´e geralmente subjetiva, podendo ser baseada em estudos anteriores, em informa¸c˜oes levantadas junto a especialistas, em informa¸c˜oes da amostra. Certas caracter´ısticas do seu comportamento devem ser levadas em considera¸c˜ao, como, por exemplo, o espa¸co pa-ram´etrico e a simetria esperada. Os parˆametros que definem a distribui¸c˜ao a priori s˜ao chamados de hiperparˆametros [21].

Neste trabalho deseja-se inferir a taxa de incidˆencia, que ´e um valor maior ou igual a zero, por isso deve-se utilizar distribui¸c˜oes que tenham apenas esse intervalo de valores, como ´e o caso da distribui¸c˜ao Gama.

Outra motiva¸c˜ao para se utilizar essa distribui¸c˜ao ´e a defini¸c˜ao de conjuga¸c˜ao; a distribui¸c˜ao a priori para θi pertence a mesma fam´ılia da fun¸c˜ao de verossimilhan¸ca

da distribui¸c˜ao Poisson, ou seja, a parte da fun¸c˜ao que depende da vari´avel de interesse (kernel) possui express˜ao an´aloga, nos dois casos o kernel ´e do tipo

θir−1e−sθi (3.6)

para r e s espec´ıficos.

Assim, supondo-se que θi segue uma distribui¸c˜ao Gama com parˆametros α e

β, a distribui¸c˜ao a priori, que ser´a a mesma para todas as ´areas, ´e dada por P (θi|α, β) = βα Γ(α)θ α−1 i e −βθi, θ i, α, β > 0, (3.7)

onde θi tem como valor esperado α/β e variˆancia α/β2.

A partir da fun¸c˜ao de verossimilhan¸ca e da distribui¸c˜ao a priori pode-se atua-lizar a distribui¸c˜ao de θi atrav´es da aplica¸c˜ao do Teorema de Bayes, resultando na

distri-bui¸c˜ao a posteriori de θi, que incorpora toda a informa¸c˜ao dispon´ıvel sobre o parˆametro

(informa¸c˜ao inicial mais a informa¸c˜ao da experiˆencia ou da amostra). O Teorema de Bayes ´

e dado por

P (θi|Y ) =

P (Y |θi)P (θi)

P (Y ) , (3.8)

onde P (Y |θi) ´e fun¸c˜ao de verossimilhan¸ca, P (θi) ´e fun¸c˜ao de densidade de probabilidade

a priori, P (Y ) ´e fun¸c˜ao de verossimilhan¸ca marginal e P (θi|Y ) ´e fun¸c˜ao de densidade de

(34)

3.3 An´alise de dados espaciais 30 A fun¸c˜ao de verossimilhan¸ca marginal informa a chance de valores de Yi

acon-tecerem, independentemente do valor do parˆametro θi. Assim, 1/P (Y ) ´e uma constante

de proporcionalidade e o Teorema de Bayes pode ser escrito como

P (θi|Y ) ∝ P (Y |θi)P (θi). (3.9)

Com a an´alise conjugada, a distribui¸c˜ao a posteriori ter´a o mesmo kernel que a distribui¸c˜ao a priori e a fun¸c˜ao de verossimilhan¸ca, ou seja

P (θi|Y ) ∝ θiyie −niθi× θα−1 i e −βθi, (3.10) = θ(yi+α)−1 i e −(ni+β)θi. (3.11)

Assim distribui¸c˜ao a posteriori tamb´em seguir´a uma distribui¸c˜ao Gama - de-pender´a dos valores observados (atrav´es de yi) e dos parˆametros da priori (α e β) - com

parˆametros a e b, onde

a = α + yi, (3.12)

b = β + ni. (3.13)

A partir da distribui¸c˜ao a posteriori, pode-se obter estimativas atualizadas para a taxa de incidˆencia, o valor esperado para θi|Y ser´a a/b e a sua variˆancia a/b2.

O valor esperado da distribui¸c˜ao a posteriori ser´a a estimativa revisada para a taxa de incidˆencia do evento de interesse.

O problema agora passa a ser a determina¸c˜ao dos valores dos hiperparˆametros, que definir˜ao todo o comportamento da distribui¸c˜ao a priori. Existem v´arias maneiras de encontrar os valores de α e β; podem ser obtidos atrav´es de informa¸c˜oes levantadas junto a um especialista ou baseadas em dados coletados anteriormente sobre o mesmo fenˆomeno, se n˜ao for poss´ıvel nenhum tipo de informa¸c˜ao pr´evia, resta a alternativa de obter essas informa¸c˜oes a partir dos dados observados.

Uma das possibilidades ´e a partir do M´etodo da M´axima Verossimilhan¸ca Marginal onde as estimativas para os hiperparˆametros (α0 e β0) s˜ao os valores de α e β

que maximizam a fun¸c˜ao de verossimilhan¸ca marginal, P (Y ), ou seja

(α0, β0) = argmax[P (Y )]. (3.14)

(35)

3.3 An´alise de dados espaciais 31 Bayes, que tamb´em pode ser escrito da seguinte forma

P (Y ) = P (Y |θi)P (θi) P (θi|yi)

, (3.15)

que na an´alise conjugada determina a distribui¸c˜ao Binomial Negativa que tem a fun¸c˜ao de probabilidade dada por

P (Y ) =α + yi yi   β β + ni α 1 β + ni yi . (3.16)

Assim, ap´os encontrar os valores dos hiperparˆametros e os parˆametros da pos-teriori, ´e poss´ıvel calcular o valor estimado para a taxa de incidˆencia para cada regi˜ao i com o valor esperado da posteriori dado por

EBi =

α0 + yi

β0+ ni

, (3.17)

onde EBi ´e o estimador Bayesiano para a ´area i.

Outro meio de estimar a taxa de incidˆencia ´e atrav´es do M´etodo dos Momentos, que gera uma estimativa pontual para o parˆametro θi sem a necessidade de estipular uma

distribui¸c˜ao, mas apenas conhecendo seus momentos de primeira e segunda ordens. O estimador para a taxa de incidˆencia ´e dado por

Mi = mi+ Ci(ri− mi), (3.18) aqui Ci = Ai Ai+  mi ni  (3.19) ri = yi ni (3.20) onde para uma uma ´area i: Ci ´e a variˆancia da distribui¸c˜ao marginal da taxa bruta, ri´e a

taxa bruta, mi ´e o valor esperado da distribui¸c˜ao a priori, Ai ´e a variˆancia da distribui¸c˜ao

a priori e ni ´e o tamanho da popula¸c˜ao sob risco.

O valor de Ci varia entre 0 e 1, quando o tamanho populacional ni ´e pequeno,

Ci → 0 e o estimador Bayesiano se aproxima da m´edia a priori mi; se o tamanho da

popula¸c˜ao ´e grande, Ci → 1 e o estimador de Bayes se aproxima da taxa bruta [22].

Para cada valor do ´ındice i est´a associada uma ´area. Para facilitar, utiliza-se a mesma distribui¸c˜ao a priori para todas as ´areas (priori global), assim, os valores esperados

(36)

3.4 An´alise de S´eries Temporais 32 e as variˆancias para cada ´area ser˜ao os mesmos. Ao utilizar a priori global: mi = m e

Ai = A para toda unidade de ´area i.

Quando se trabalha com o modelo global, qualquer m´edia ponderada para o n´umero de ocorrˆencias ´e um estimador n˜ao viciado para m´edia [20]. Uma possibilidade ´e utilizar a incidˆencia global da regi˜ao a ser mapeada, definida como

mg = PN i=1Yi PN i=1ni , (3.21) ondePN

i=1ni´e o total de pessoas sob risco. Assim, o estimador pelo M´etodo dos Momentos

ser´a dado por

Mi = mg+ Ci(ri− mg). (3.22)

Na estima¸c˜ao da variˆancia a priori, utiliza-se o estimador n˜ao viciado

ˆ A =      s2mI η  , se s2 >mI η  , 0, caso contr´ario,

(3.23) onde s2 = PI i=1ni(ri − mg)2 PI i=1ni , (3.24)

η ´e o total da popula¸c˜ao ao longo das ´areas, N ´e o n´umero de unidades de ´areas existentes e s2 ´e uma variˆancia ponderada.

A partir da pr´oxima se¸c˜ao a abordagem ser´a apenas temporal e o objetivo ´e verificar a evolu¸c˜ao de novos casos de tuberculose mensalmente.

3.4

An´

alise de S´

eries Temporais

Uma s´erie temporal ´e um conjunto de observa¸c˜oes ordenadas em um determinado in-tervalo de tempo, geralmente regular durante um per´ıodo especifico, uma caracter´ıstica importante nesse tipo de dado ´e que observa¸c˜oes vizinhas s˜ao dependentes. A observa¸c˜ao Yt feita no instante t ´e uma vari´avel aleat´oria, assim, uma s´erie temporal ´e um processo

estoc´astico dado por Y = {Yt, t ∈ T } [23].

Alguns dos objetivos na an´alise de s´eries temporais s˜ao: investigar o mecanismo gerador da s´erie, fazer previs˜oes de valores futuros da s´erie, descrever o comportamento da s´erie, procurar periodicidades relevantes nos dados [23]. Neste trabalho, um dos objetivos ´

(37)

3.4 An´alise de S´eries Temporais 33 O primeiro passo antes de se realizar qualquer an´alise ´e fazer a representa¸c˜ao gr´afica dos dados sequencialmente ao longo do tempo, isso pode revelar padr˜oes de com-portamento importantes, como: a tendˆencia da s´erie, a existˆencia ou n˜ao de sazonalidade. A tendˆencia de uma s´erie est´a relacionada a um padr˜ao global de crescimento ou decres-cimento, que pode ser linear, exponencial; j´a a sazonalidade existe quando a s´erie exibe um comportamento que se repete a cada s per´ıodos de tempo [24].

A abordagem utilizada na parte de s´eries temporais ser´a a cl´assica, e neste caso existe a suposi¸c˜ao de estacionariedade. Dentro desse contexto, as se¸c˜oes seguintes apresentar˜ao algumas defini¸c˜oes importantes.

3.4.1

Exemplos de Processos Estoc´

asticos

Ru´ıdo Branco

Um processo {εt, t ∈ T } ´e um ru´ıdo branco se Cov(εt, εs) = 0 para todo t 6= s, ou seja, as

vari´aveis aleat´orias εt s˜ao n˜ao correlacionadas.

Processos de M´edias M´oveis

Um processo {Yt} ´e chamado de processo de m´edias m´oveis de ordem q, ou M A(q) se:

Yt= εt+ θ1εt−1+ · · · + θqεt−q, (3.25)

onde θi ∈ R, i = 1, · · · , q; {εt} ´e um ru´ıdo branco com m´edia zero e variˆancia σε2.

Processos Autoregressivos

Um processo {Yt} ´e chamado de processo autoregressivo de ordem p, ou AR(p) se:

Yt = φ1Yt−1+ φ2Yt−2+ · · · + φpYt−p+ εt, (3.26)

onde φi ∈ R, i = 1, . . . , p; {εt} ´e um ru´ıdo branco com m´edia zero e variˆancia σ2ε.

Modelos auto-regressivos e de m´edias m´oveis

Para muitas s´eries, a inclus˜ao de termos auto-regressivos e de m´edias m´oveis ´e a solu¸c˜ao adequada para encontrar um modelo com um n´umero n˜ao muito grande de parˆametros. Os modelos ARM A(p, q) s˜ao da forma:

˜

(38)

3.4 An´alise de S´eries Temporais 34 onde ˜Yt = Yt− µ.

Outra forma de escrever os modelos ARM A ´e utilizando o operador de trans-la¸c˜ao para o passado, denotado por B e definido por:

BZt= Zt−1; (3.28)

BmZt = Zt−m.

3.4.2

Processos Estacion´

arios

Para se trabalhar com uma s´erie temporal ´e necess´ario fazer algumas suposi¸c˜oes simpli-ficadoras; uma delas ´e a estacionariedade [23]. Intuitivamente uma s´erie ´e estacion´aria quando as caracter´ısticas de Yt+τ, para todo τ , s˜ao iguais as de Yt. Tecnicamente existem

dois tipos de estacionariedade: fraca (ou de segunda ordem) e estrita (ou forte). Na pr´ a-tica, ´e aceit´avel que as s´eries observadas sejam fracamente estacion´arias. Formalmente, um processo ´e dito estacion´ario de segunda ordem se e somente se:

(i) E[Yt] = µ, ∀t ∈ T ;

(ii) E[Y2

t ] < ∞, ∀t ∈ T ;

(iii) γt = Cov(Yt, Yt+τ), depende apenas de τ . Assim, se τ = 0 segue que V ar[Yt] = γ0,

ou seja, a variˆancia ´e constante.

Como exemplo de processo estacion´ario pode-se citar o ru´ıdo branco.

Caso n˜ao haja estacionariedade, ´e comum fazer modifica¸c˜oes na s´erie original. O primeiro passo ´e verificar se ´e preciso realizar algum tipo de transforma¸c˜ao, que tem o objetivo de estabilizar a variˆancia da s´erie e/ou tornar a distribui¸c˜ao dos dados mais sim´etrica e pr´oxima da normal; a seguir verifica-se se h´a algum tipo de tendˆencia na s´erie, em caso positivo ser´a necess´ario fazer diferen¸cas sucessivas na s´erie. A primeira diferen¸ca de Yt ´e definida por

4Yt= Yt− Yt−1. (3.29)

Em geral a n-´esima diferen¸ca de Yt ´e dada por

4nY

(39)

3.4 An´alise de S´eries Temporais 35 Na maioria das vezes a primeira diferencia¸c˜ao ´e sempre suficiente para que uma s´erie se torne estacion´aria. Segundo McLeod[25], um n´umero excessivo de diferencia¸c˜oes resulta em um valor negativo da correla¸c˜ao de ordem 1 da s´erie diferenciada e quando a s´erie ´e corretamente diferenciada, a variˆancia da s´erie transformada diminui, mas o excesso de diferen¸cas aumentar´a essa variˆancia.

Se Wt = 4dYtfor estacion´ario, poder´a ser representado por um modelo ARM A(p, q),

ou seja,

Wt= φ1Wt−1+ · · · + φpWt−p+ εt+ θ1εt−1+ · · · + θqεt−q. (3.31)

Neste caso, para obter Wt foram realizadas d diferen¸cas de Yt, ent˜ao pode-se

dizer que Ytsegue um modelo autoregressivo integrado de m´edias m´oveis, ARIM A(p, d, q).

A seguir ser˜ao apresentadas algumas defini¸c˜oes necess´arias para a an´alise de s´eries temporais.

Fun¸c˜ao de autocovariˆancia

A fun¸c˜ao de autocovariˆancia de um processo estacion´ario, com m´edia zero ´e dada por γτ = Cov{Yt, Yt+τ} = E[YtYt+τ]. (3.32)

E satisfaz as seguintes propriedades: (i) γ0 > 0 (γ0 ´e a variˆancia (σ2) de Yt);

(ii) γ−τ = γτ;

(iii) | γτ |≤ γ0;

(iv) γτ ´e n˜ao negativa definida, ou seja,

Pn j=1 Pn k=1ajakγτj−τk ≥ 0, para quaisquer n´ u-meros reais a1, · · · , an e τ1, · · · , τn de Y . Fun¸c˜ao de Autocorrela¸c˜ao

A fun¸c˜ao de autocorrela¸c˜ao te´orica (fac) de um processo estacion´ario ´e uma ferramenta extremamente importante para se identificar as propriedades de uma s´erie temporal, como por exemplo, a sua estacionariedade. Se um processo estoc´astico tem m´edia µ e variˆancia σ2, a correla¸c˜ao ser´a dada por

ρτ =

γτ

γ0

= γτ

(40)

3.4 An´alise de S´eries Temporais 36 Assim, ρ0 = 1. E essa fun¸c˜ao possui as seguintes propriedades:

(i) ρτ = ρ−τ;

(ii) −1 < ρτ < 1.

Estimadores pontuais de γτ e ρτ

Com base nas observa¸c˜oes Y1, · · · , Yn, a fac ρj ´e estimada por

rj =

cj

c0

, (3.34)

onde cj ´e a estimativa da fun¸c˜ao de autocovariˆancia γj,

cj = 1 n n−j X t=1 (zt− ¯z)(yt+j− ¯y), (3.35) onde ¯y = 1nPn t=1yt.

Fun¸c˜ao de Autocorrela¸c˜ao Parcial (facp)

Seja φk,j o j-´esimo coeficiente de um modelo AR(k) e o φk,k o ´ultimo coeficiente. Segue

que

ρj = φk,1ρj−1+ φk,2ρj−2+ · · · + φk,kρj−k, j = 1, . . . , k, (3.36)

a partir das quais obtˆem as equa¸c˜oes de Yule-Walker

        1 ρ1 ρ2 · · · ρk−1 ρ1 1 ρ1 · · · ρk−2 .. . ρk−1 ρk−2 ρk−3 · · · 1                 φk,1 φk,2 .. . φk,k         =         ρ1 ρ2 .. . ρk         . (3.37)

Resolvendo as equa¸c˜oes sucessivamente para k = 1, 2, 3, . . . obtˆem-se a quan-tidade φk,k, encarada como fun¸c˜ao de k, ´e chamada de fun¸c˜ao de autocorrela¸cao parcial e

tem como forma geral

φk,k =

| P∗ k |

| Pk |

, (3.38)

onde Pk ´e a matriz de autocorrela¸c˜oes e Pk∗ ´e a matriz Pk com a ´ultima linha substitu´ıda

pelo vetor de autocorrela¸c˜oes.

O coeficiente, φk,k mede a correla¸c˜ao remanescente entre Zt e Zt−k depois de

(41)

3.4 An´alise de S´eries Temporais 37 Correlograma

O gr´afico com os τ primeiros coeficientes de autocorrela¸c˜ao como fun¸c˜ao de τ ´e chamado de correlograma. ´E uma importante ferramenta para identificar caracter´ısticas de uma s´erie temporal atrav´es de seu padr˜ao [24].

Uma das caracter´ısticas poss´ıveis de se observar atrav´es do correlograma ´e a n˜ao estacionariedade da s´erie. Em uma s´erie temporal com tendˆencia, os valores das autocorrela¸c˜oes decaem lentamente e neste caso pouca ou nenhuma informa¸c˜ao pode ser retirada da s´erie, assim qualquer tendˆencia deve ser removida antes de continuar a an´alise.

3.4.3

Modelos ARIMA

Uma metodologia muito utilizada na an´alise de modelos param´etricos consiste em ajustar modelos auto-regressivos integrados de m´edias m´oveis, ARIM A(p, d, q), a um conjunto de dados. Esta metodologia ´e conhecida como abordagem de Box e Jenkins [23].

A estrat´egia para a constru¸c˜ao de um modelo ´e baseada em um ciclo iterativo onde a estrutura do modelo ´e baseada nos pr´oprios dados. Este ciclo cont´em quatro etapas: especifica¸c˜ao, identifica¸c˜ao, estima¸c˜ao e verifica¸c˜ao. Caso o modelo n˜ao seja adequado, o ciclo ´e repetido, retornando-se a etapa de identifica¸c˜ao. A fase cr´ıtica do m´etodo ´e a identifica¸c˜ao. ´E poss´ıvel que v´arios pesquisadores identifiquem modelos diferentes que se ajustem bem a mesma s´erie temporal.

A. Especifica¸c˜ao

Nesta fase uma classe geral de modelos ´e considerada, nesse caso o modelo ARIM A.

B. Identifica¸c˜ao

O objetivo da fase de identifica¸c˜ao ´e determinar o n´ıvel de diferencia¸c˜ao (d), a ordem dos termos autoregressivos (p) e a ordem dos termos m´edias m´oveis (q) do modelo ARIM A(p, d, q), e al´em disso fazer estimativas preliminares que ser˜ao utilizadas na fase de estima¸c˜ao. A escolha do modelo ´e feita principalmente com base nas autocorrela¸c˜oes e autocorrela¸c˜oes parciais estimadas.

(42)

3.4 An´alise de S´eries Temporais 38 Tabela 3.1: Comportamento das fac e facp de um processo ARM A(p, q)

Processo fac facp

AR(1), φ > 0 Decaimento exponencial somente φ116= 0 AR(1), φ < 0 Decaimento oscilat´orio somente φ116= 0

AR(p) Decaimento para zero 0 se k > p M A(1) Somente ρ 6= 0 Decaimento oscilat´orio ARM A(p, q) Decaimento a partir de q Decaimento a partir de p

da necessidade de transforma¸c˜ao da s´erie original, com o objetivo de estabilizar a variˆancia; a diferencia¸c˜ao da s´erie obtida na primeira parte quantas vezes forem necess´arias, o n´ u-mero de diferen¸cas, d, suficiente ´e alcan¸cado quando a fac amostral decresce rapidamente para zero; e a ´ultima parte ´e identificar o processo ARM A(p, q) resultante, atrav´es da an´ a-lise das autocorrela¸c˜oes e das autocorrela¸c˜oes parciais estimadas, cujos comportamentos devem imitar os comportamentos das respectivas quantidades te´oricas [23]. A Tabela 3.1 mostra o comportamento das fun¸c˜oes de autocorrela¸c˜ao e autocorrela¸c˜ao parcial te´oricas para alguns processos estacion´arios que podem auxiliar na fase de identifica¸c˜ao [24].

Seja o modelo ARM A(p, q) dado por

Yt = φ1Yt−1+ · · · + φpYt−p+ εt+ θ1εt−1+ · · · θqεt−q, (3.39)

Muitas vezes ´e dif´ıcil identificar o melhor modelo atrav´es da fac e facp, outra alternativa nesta fase de identifica¸c˜ao ´e testar modelos de baixa ordem e utilizar formas alternativas de identifica¸c˜ao. Um meio ´e atrav´es dos m´etodos baseados em uma fun¸c˜ao penalizadora, entre estes est´a o crit´erio de informa¸c˜ao de Akaike.

A id´eia ´e escolher as ordens k, l de um modelo ARM A(k, l) que minimizem a quantidade

P (k, l) = ln(ˆσk,l2 ) + (k + l)C(N )

N (3.40)

onde σ2

k,l´e uma estimativa da variˆancia residual obtida ajustando um modelo ARM A(k, l)

`

as N observa¸c˜oes da s´erie e C(N ) ´e uma fun¸c˜ao do tamanho da s´erie. A quantidade (k + l)C(N )N , denominada termo penalizador, aumenta quando o n´umero de parˆametros aumenta, enquanto que a variˆancia residual diminui. Assim, minimizar P (k, l) corres-ponde a identificar as ordens k e l que equilibrem seu comportamento. O crit´erio de informa¸c˜ao de Akaike ´e um dos procedimentos de identifica¸c˜ao que minimizam as fun¸c˜oes penalizadoras particulares. Neste caso, escolhe-se o modelo cujas ordens k e l minimizam

(43)

3.4 An´alise de S´eries Temporais 39 o crit´erio AIC(k, d, l) = N lnˆσ2ε+ N N − d2(k + l + 1 + δd0) + N ln2π + N (3.41) onde δd0 =    1, d = 0 0, d 6= 0 e ˆσε2 ´e o estimador de m´axima verossimilhan¸ca de σε2.

A seguir se estipula valores limites superiores K e L para k e l e calcula-se AIC(k, d, l) para todas as poss´ıveis combina¸c˜oes (k, l) com 0 ≤ k ≤ K e 0 ≤ l ≤ L. Em geral, K e L s˜ao fun¸c˜oes de N .

Ap´os ajustar alguns modelos, o melhor ser´a o que fornecer o menor valor AIC.

C. Estima¸c˜ao

Ap´os identificar o modelo provis´orio para a s´erie, o pr´oximo passo ´e fazer a estima¸c˜ao de seus parˆametros.

Considerando-se o modelo ARIM A(p, d, q), h´a p + q + 1 parˆametros para se estimar, ou seja, ξ=(φ,θ, σ2ε), onde φ=(φ1, · · · , φp), e θ = (θ1, · · · , θq), neste caso d > 0

e assim a m´edia ´e nula. Caso contr´ario, µ ´e inclu´ıdo como mais um parˆametro a ser estimado e assim p + q + 2 parˆametros ser˜ao estimados.

Uma das formas de encontrar os estimadores ´e atrav´es da maximiza¸c˜ao da fun¸c˜ao de verossimilhan¸ca exata dada por

p(y1, · · · , yn | ξ) = p(yn, · · · , yp | ξ) n

Y

t=p+1

(yt| yt−1, · · · , yt−p, ξ). (3.42)

D. Diagn´ostico de Modelos

Ap´os a etapa da estima¸c˜ao, deve-se verificar se o modelo representa adequadamente os dados antes de utiliz´a-lo, por exemplo, para fazer previs˜oes. A id´eia ´e verificar o compor-tamento dos res´ıduos onde

res´ıduo = valor observado-valor ajustado (3.43) Se o modelo estiver bom, os res´ıduos estar˜ao pr´oximos de zero com variˆancia constante e ser˜ao n˜ao correlacionados. Se a variˆancia dos res´ıduos n˜ao for constante ser´a necess´ario fazer uma transforma¸c˜ao nos dados.

(44)

3.4 An´alise de S´eries Temporais 40 A adequa¸c˜ao do modelo pode ser verificada atrav´es do gr´afico dos res´ıduos e de seu correlograma, que pode indicar poss´ıveis termos faltantes do modelo. Por exemplo, se as autocorrela¸c˜oes residuais sa´ırem do intervalo de confian¸ca nas defasagens 1 ou 2, ou em defasagens sazonais (ex.: 12 em dados mensais) ´e uma indica¸c˜ao de que mais termos de m´edias m´oveis devem ser inclu´ıdos no modelo. O mesmo vale para autocorrela¸c˜oes parciais dos res´ıduos para a inclus˜ao de termos autorregressivos [24].

Outra forma de se fazer a verifica¸c˜ao de adequa¸c˜ao do modelo, ao inv´es de olhar para as autocorrela¸c˜oes residuais individualmente, ´e a partir do Teste de Ljung-Box. Este ´e um teste para as autocorrela¸c˜oes dos res´ıduos estimados. As hip´oteses s˜ao definidas como    H0 : n˜ao h´a autocorrela¸c˜ao H1 : h´a autocorrela¸c˜ao

A estat´ıstica de teste utilizada ´e Q(K) = n(n + 2) K X j=1 ˆ rj2 (n − j), (3.44)

que segue distribui¸c˜ao χ2 com K − p − q (ou K-(nº de parˆametros estimados)) graus de liberdade. Sendo K n´umero de autocorrela¸c˜oes utilizadas, em geral, ´e suficiente usar as 10 ou 15 primeiras ˆrk.

Assim, hip´otese de ru´ıdo branco ´e rejeitada para valores grandes de Q(K).

3.4.4

Previs˜

ao com modelos ARIMA

Ap´os realizar todas as etapas do ciclo iterativo de especifica¸c˜ao, identifica¸c˜ao, estima¸c˜ao e verifica¸c˜ao e ter constru´ıdo o modelo ARIM A(p, d, q), o pr´oximo passo ser´a fazer previs˜oes de valores futuros da s´erie. O interesse aqui ´e prever um valor Yt+h, h ≥ 1, sendo as

observa¸c˜oes at´e o instante t conhecidas, assim, a previs˜ao de origem t e horizonte h ser´a denotada por ˆYt(h) e ´e definida como a esperan¸ca condicional de Yt+h dado os valores

passados, isto ´e

ˆ

yt(h) = E(Yt+h| yt, yt−1, . . .). (3.45)

Como uma forma de checar a qualidade de previs˜ao do modelo costuma-se fazer previs˜oes dentro do per´ıodo amostral, neste caso as ´ultimas observa¸c˜oes s˜ao omitidas e o modelo ´e feito com base nas observa¸c˜oes restantes, isso possibilita a compara¸c˜ao dos

(45)

3.4 An´alise de S´eries Temporais 41 valores previstos com os valores reais. A diferen¸ca entre os valores previstos e reais ´e chamada de erro de previs˜ao h passos `a frente e ´e denotado por

et+h= ˆyt(h) − yt+h. (3.46)

Para calcular o intervalo de confian¸ca para Yt+h´e necess´ario checar se os erros

seguem uma distribui¸c˜ao normal. Um dos testes utilizados para este fim ´e o teste de Shapiro-Wilk, as hip´oteses s˜ao definidas como

  

H0 : os dados vˆem de uma distribui¸c˜ao normal

H1 : caso contr´ario.

A estat´ıstica de teste utilizada ´e w = Pn b

i=1(y(i)− ¯y)2

, (3.47)

onde n ´e o n´umero total de observa¸c˜oes, y(i) representa as observa¸c˜oes em ordem crescente,

¯

y ´e a m´edia das observa¸c˜oes e b representa uma constante baseada na diferen¸ca entre as maiores observa¸c˜oes e as menores.

Para a classe de modelos ARIM A, as previs˜oes podem ser obtidas utilizando diretamente a equa¸c˜ao do modelo. A previs˜ao ´e obtida substituindo os valores futuros dos erros por zero, valores futuros da s´erie Yt+1, Yt+2, . . . pela esperan¸ca condicional, e

valores passados de Y e de ε pelos seus valores observados. Por exemplo, para um modelo ARM A(2, 1) cuja equa¸c˜ao ´e dada por

Yt= φ1Yt−1+ φ2Yt−2+ εt+ θ1εt−1, (3.48)

as previs˜oes 1 e 2 passos a frente ser˜ao ˆ

yt(1) = φ1yt+ φ2yt−1+ θ1εt (3.49)

ˆ

yt(2) = φ1yˆt(1) + φ2yt. (3.50)

Generalizando, para modelos AR(p) a fun¸c˜ao de previs˜ao ser´a ˆ yt(1) = φ1yt+ · · · + φpyt+1−p (3.51) ˆ yt(2) = φ1yˆt(1) + · · · + φpyt+2−p (3.52) .. . (3.53) ˆ yt(p + 1) = φ1yˆt(p) + · · · + φpyˆt(1). (3.54)

Referências

Documentos relacionados

Desta forma, tanto as decisões judiciais frutos de cognição sumária que categorizam as tutelas provisórias, quanto as sentenças ou acórdãos ainda em formação

Quando Goffman (1985) fala em palco e cenário, atores e platéia, papéis e rotinas de representação, necessidade, habilidades e estratégias dramatúrgicas,

São considerados custos e despesas ambientais, o valor dos insumos, mão- de-obra, amortização de equipamentos e instalações necessários ao processo de preservação, proteção

Seventy-one genetical- ly diverse genotypes of tall fescue were randomly selected from a broad-based population to evaluate LTS (leal tensile strength), itt vítra dry

Perelman e Olbrechts-Tyteca (ibdem) propõem uma tipologia e questionam o aspecto monológico dos estudos da argumentação até então. Isso abre espaço para os estudos dialógicos

Este trabalho tem como objetivo contribuir para o estudo de espécies de Myrtaceae, com dados de anatomia e desenvolvimento floral, para fins taxonômicos, filogenéticos e

de professores, contudo, os resultados encontrados dão conta de que este aspecto constitui-se em preocupação para gestores de escola e da sede da SEduc/AM, em

Para analisar as Componentes de Gestão foram utilizadas questões referentes à forma como o visitante considera as condições da ilha no momento da realização do