Universidade Federal Fluminense Instituto de Matem´atica e Estat´ıstica
Curso de Estat´ıstica
Evelyne Guimar˜aes dos Santos
An´
alise Espacial e Temporal da Tuberculose no Estado do
Rio de Janeiro entre os anos de 2001 e 2010
Niter´oi 2013
Evelyne Guimar˜aes dos Santos
An´
alise Espacial e Temporal da Tuberculose no Estado do
Rio de Janeiro entre os anos de 2001 e 2010
Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.
Orientadora: Ana Beatriz Monteiro Fonseca
D.Sc.
Co-orientador: Valentin Sisko
D.Sc.
Niter´oi 2013
Evelyne Guimar˜aes dos Santos
An´
alise Espacial e Temporal da Tuberculose no Estado do
Rio de Janeiro entre os anos de 2001 e 2010
Monografia apresentada ao Curso de Estat´ıstica da UFF, como requisito para a obten¸c˜ao do grau de BACHAREL em Estat´ıstica.
Aprovado em mar¸co de 2013
BANCA EXAMINADORA
Ana Beatriz Monteiro Fonseca
D.Sc.
Valentin Sisko
D.Sc.
Jony Arrais Pinto Junior
Santos, Evelyne Guimarães dos
Análise espacial e temporal da tuberculose no Estado do Rio de Janeiro entre os anos de 2001 e 2010 / Evelyne Guimarães dos Santos; Ana Beatriz Monteiro Fonseca,
orientadora; Sisko, Valentin, coorientador. Niterói, 2012.
83 f. : il.
Trabalho de Conclusão de Curso (Graduação em Estatísticaa ) – Universidade Federal Fluminense, Instituto de Matemática e Estatística, Niterói, 2012.
1. Tuberculose. 2. Análise espacial. 3. Análise temporal. 4. Inferência bayesiana. 5. ARIMA I. Fonseca, Ana Beatriz
Monteiro, orientadora. II. Sisko, Valentin, coorientador. III. Universidade Federal Fluminense. Instituto de Matemática e Estatística. IV. Título.
Resumo
A tuberculose ´e uma doen¸ca infectocontagiosa e a probabilidade de que sua infec¸c˜ao evo-lua para a doen¸ca est´a associada `as condi¸c˜oes de vida da popula¸c˜ao. Segundo estimativas da OMS, um ter¸co da popula¸c˜ao mundial est´a infectada. Atualmente, o Brasil ocupa o d´ecimo nono lugar entre os 22 pa´ıses respons´aveis por 80% do total de casos de tuber-culose no mundo. O Estado do Rio de Janeiro est´a entre os que possuem maior n´umero de casos e maior taxa de incidˆencia no pa´ıs, sendo o estudo de sua difus˜ao muito ´util na tomada de decis˜oes da administra¸c˜ao p´ublica voltadas para a ´area de sa´ude. Este trabalho teve como objetivo verificar o comportamento da tuberculose no Estado do Rio de Janeiro durante os anos de 2001 e 2010, atrav´es de sua dinˆamica espacial e temporal. Para isso, foram realizadas uma an´alise espacial da taxa de incidˆencia de tuberculose dos munic´ıpios, utilizando dois estimadores pontuais (cl´assico e bayesiano), e uma an´alise de s´eries temporais para encontrar um modelo adequado aos dados e que fornecesse boas previs˜oes para o n´umero de casos novos da doen¸ca no Estado e em dois de seus munic´ıpios mais atingidos.
Palavras-chaves: tuberculose, an´alise espacial, an´alise temporal, inferˆencia bayesiana, ARIMA.
Agradecimentos
Aos meus pais, que mesmo distante sempre me apoiaram e procuraram estar presentes em todos esses anos.
`
A professora Ana Beatriz e ao Professor Valentin que me orientaram neste projeto.
Aos amigos de faculdade Keilane, Fernanda, Juliana F., Dani, Bruno, Gabriel, F´abio, Bruna, Pablo, Adriana, por terem compartilhado momentos de estudo, tens˜ao e descontra¸c˜ao.
A todas as pessoas que passaram pelo Centro Social Vicenta Maria, em especial a Irm˜a Doris, Clara, Maria Ot´avia, Juliana C., Tatiana e Renata, por todas as horas de conversas que certamente contribu´ıram para que esses quatro anos fossem melhores.
...
Sum´
ario
Lista de Figuras 8
Lista de Tabelas 10
1 Introdu¸c˜ao 11
1.1 A tuberculose . . . 11
1.1.1 A transmiss˜ao, os sintomas e a evolu¸c˜ao . . . 11
1.1.2 O diagn´ostico . . . 12
1.1.3 O tratamento e a cura . . . 12
1.1.4 O controle e a preven¸c˜ao . . . 15
1.2 A tuberculose no mundo . . . 15
1.3 A tuberculose no Brasil . . . 18
1.4 A tuberculose no Estado do Rio de Janeiro . . . 20
1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro . . . 21
2 Objetivos 24 2.1 Objetivos Gerais . . . 24 2.2 Objetivos Espec´ıficos . . . 24 3 Materiais e M´etodos 25 3.1 O Banco de Dados . . . 25 3.2 Nota¸c˜ao . . . 25
3.3 An´alise de dados espaciais . . . 26
3.3.1 Estimadores Espaciais . . . 27
3.4.1 Exemplos de Processos Estoc´asticos . . . 33
3.4.2 Processos Estacion´arios . . . 34
3.4.3 Modelos ARIMA . . . 37
3.4.4 Previs˜ao com modelos ARIMA . . . 40
3.4.5 Modelos Sazonais . . . 42
4 Resultados 44 4.1 An´alise Espacial . . . 44
4.1.1 Estimador Cl´assico . . . 44
4.1.2 Estimador Bayesiano . . . 47
4.2 An´alise Temporal . . . 49
5 Discuss˜ao de Resultados 64
6 Conclus˜ao 68
Apˆendices 72
Lista de Figuras
1.1 Mapa do Estado do Rio de Janeiro . . . 21
1.2 Distribui¸c˜ao da popula¸c˜ao por 10.000 habitantes em 2010 . . . 23
4.1 Mapas para a taxa bruta . . . 45
4.2 Mapas para a taxa bruta . . . 46
4.3 Mapas para o estimador Bayesiano . . . 47
4.4 Mapas para o estimador Bayesiano . . . 48
4.5 Mapas das diferen¸cas . . . 48
4.6 Notifica¸c˜oes anuais de tuberculose no estado do Rio de Janeiro . . . 50
4.7 Taxa de incidˆencia anual por 10.000 habitantes . . . 50
4.8 Gr´afico da S´erie RJ . . . 51
4.9 Autocorrela¸c˜oes da S´erie RJ . . . 52
4.10 Autocorrela¸c˜oes Parciais da S´erie RJ . . . 52
4.11 fac dos res´ıduos do modelo AR(2) para a s´erie RJ . . . 53
4.12 facp dos res´ıduos do modelo AR(2) para a s´erie RJ . . . 53
4.13 fac e facp dos res´ıduos do modelo . . . 54
4.14 s´erie RJ com previs˜ao . . . 55
4.15 Gr´afico da s´erie RIO . . . 56
4.16 Autocorrela¸c˜oes da s´erie RIO . . . 56
4.17 Autocorrela¸c˜oes parciais da s´erie RIO . . . 57
4.18 fac e facp dos res´ıduos do modelo AR(2) da s´erie RIO . . . 57
4.19 fac e facp dos res´ıduos do modelo para a s´erie RIO . . . 58
4.21 Gr´afico da s´erie CAXIAS . . . 60
4.22 autocorrela¸c˜oes da s´erie CAXIAS . . . 60
4.23 autocorrela¸c˜oes parciais da s´erie CAXIAS . . . 61
4.24 Previs˜oes CAXIAS . . . 62
A.1 Autocorrela¸c˜oes da S´erie RJ com uma diferencia¸c˜ao . . . 79
Lista de Tabelas
1.1 Os munic´ıpios menos e mais populosos do Estado do Rio de Janeiro em 2010 22
3.1 Comportamento das fac e facp de um processo ARM A(p, q) . . . 38
4.1 Descri¸c˜ao do tamanho da popula¸c˜ao entre os anos 2001 e 2010 . . . 44
4.2 Descri¸c˜ao do n´umero de casos entre os anos de 2001 e 2010 . . . 44
4.3 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos . . . 54
4.4 Valores previstos e observados da s´erie RJ . . . 55
4.5 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos . . . 58
4.6 Valores previstos e observados da s´erie RIO . . . 59
4.7 Teste de Ljung-Box para as autocorrela¸c˜oes dos res´ıduos de 4.8 . . . 61
4.8 Valores previstos e observados da s´erie CAXIAS . . . 63
A.1 Munic´ıpios com maiores taxa de incidˆencia em 2001 . . . 74
A.2 Munic´ıpios com maiores taxa de incidˆencia em 2002 . . . 74
A.3 Munic´ıpios com maiores taxa de incidˆencia em 2003 . . . 75
A.4 Munic´ıpios com maiores taxa de incidˆencia em 2004 . . . 75
A.5 Munic´ıpios com maiores taxa de incidˆencia em 2005 . . . 76
A.6 Munic´ıpios com maiores taxa de incidˆencia em 2006 . . . 76
A.7 Munic´ıpios com maiores taxa de incidˆencia em 2007 . . . 77
A.8 Munic´ıpios com maiores taxa de incidˆencia em 2008 . . . 77
A.9 Munic´ıpios com maiores taxa de incidˆencia em 2009 . . . 78
A.10 Munic´ıpios com maiores taxa de incidˆencia em 2010 . . . 78
11
1 Introdu¸
c˜
ao
1.1
A tuberculose
A tuberculose (TB) ´e uma doen¸ca infectocontagiosa causada principalmente por um micro-organismo chamado Bacilo de Koch, cujo nome cientifico ´e Mycobacterium tuberculosis, respons´avel por mais de 98% dos casos [1]. ´E uma doen¸ca de notifica¸c˜ao compuls´oria, ou seja, est´a na listagem - estabelecida pelo Minist´erio da Sa´ude - das doen¸cas de maior relevˆancia sanit´aria do pa´ıs. A notifica¸c˜ao equivale `a comunica¸c˜ao da ocorrˆencia de de-terminada doen¸ca ou agravo `a sa´ude, feita neste caso pela unidade de sa´ude que descobre e inicia o tratamento. ´E a partir da notifica¸c˜ao compuls´oria que, na maioria das vezes, se desencadeia o processo informa¸c˜ao-decis˜ao-a¸c˜ao, que ´e feito pela vigilˆancia epidemiol´ogica. Os dados coletados s˜ao inclu´ıdos no Sistema Nacional de Agravos Notific´aveis (Sinan) [2]. A TB ´e uma doen¸ca milenar. Esqueletos com les˜oes ´osseas compat´ıveis com a tuberculose tˆem sido encontrados em v´arias regi˜oes, sendo o mais antigo com cerca de 5000 a.C. [1]. Atualmente, a forma mais comum da doen¸ca ´e a tuberculose pulmonar, mas outros ´org˜aos tamb´em podem ser atingidos.
1.1.1
A transmiss˜
ao, os sintomas e a evolu¸
c˜
ao
A TB ´e transmitida de pessoa para pessoa atrav´es da respira¸c˜ao, o que pode ocorrer quando algu´em com a doen¸ca pulmonar tosse, fala ou espirra e os bacilos s˜ao lan¸cados no ar. Os bacilos que ficam em roupas, len¸c´ois, copos e outros objetos n˜ao desempenham papel importante na transmiss˜ao da doen¸ca. Calcula-se que um indiv´ıduo infectado pelo Bacilo de Koch poder´a transmiti-lo para uma m´edia de 10 a 15 pessoas no per´ıodo de um ano [2]. Os principais sintomas da TB s˜ao tosse prolongada (por mais de trˆes semanas) com ou sem catarro, cansa¸co, emagrecimento e, febre e suor noturnos.
O per´ıodo de transmiss˜ao ocorre enquanto o doente estiver eliminando os ba-cilos e n˜ao iniciar o tratamento, depois deste, a transmiss˜ao ser´a reduzida gradativamente a n´ıveis insignificantes dentro de poucos dias ou semanas. As crian¸cas com tuberculose
1.1 A tuberculose 12 pulmonar geralmente n˜ao s˜ao infectantes [2].
A maior parte dos novos casos de TB pulmonar ocorre em torno de 12 meses ap´os a infec¸c˜ao inicial do bacilo [2]. A probabilidade desta infec¸c˜ao evoluir para a do-en¸ca, o que normalmente ocorre com baixa probabilidade [3], depende de v´arios fatores: idade avan¸cada, condi¸c˜oes s´ocio-econˆomicas e algumas condi¸c˜oes m´edicas [2], como por exemplo, pessoas infectadas com o v´ırus da imunodeficiˆencia humana adquirida (HIV) [3]. Atualmente a associa¸c˜ao do HIV/ TB ´e um s´erio problema de sa´ude p´ublica que pode levar ao aumento da morbidade e mortalidade em muitos pa´ıses [2]; a co-infec¸c˜ao HIV/TB faz com que o tempo da evolu¸c˜ao da AIDS diminua, o mesmo ocorre para a evolu¸c˜ao da tuberculose [1]. Normalmente nos infectados com Mycobacterium tuberculosis, o risco de desenvolver a tuberculose ativa ´e em torno de 0,2% ao ano e de 5% a 10% durante a vida. Nos infectados tamb´em pelo HIV esse risco sobe para 15% em um ano e para 50% ao longo da vida [1]. As pessoas expostas ao bacilo da tuberculose que n˜ao se infectaram ficam com os bacilos presentes no organismo, mas o sistema imune os mantˆem sob controle [2].
1.1.2
O diagn´
ostico
O m´etodo mais utilizado no mundo para o diagn´ostico da TB ´e a baciloscopia do escarro (desenvolvido h´a mais de 100 anos), em que bact´erias s˜ao observadas sob um microsc´opio atrav´es da amostra da expectora¸c˜ao [3]; ´e considerado um m´etodo extremamente pr´ a-tico e eficaz, com a capacidade de identificar os indiv´ıduos que eliminam os bacilos. A bacioloscopia ´e considerado um exame diagnosticador por excelˆencia em pa´ıses em desen-volvimento, onde os ´ındices da doen¸ca s˜ao significativos. O m´etodo consagrado para o exame bacilosc´opico ´e o de Ziehl-Neelsen [1]. Em pa´ıses com capacidade laboratorial mais desenvolvida, os casos de TB tamb´em podem ser diagnosticados atrav´es de m´etodos de cultura (o padr˜ao ouro atual) ou, utilizando m´etodos moleculares r´apidos [3].
1.1.3
O tratamento e a cura
At´e o final do s´eculo 19, os tratamentos da tuberculose eram irracionais: ingest˜ao de pre-paros ex´oticos, utiliza¸c˜ao de sangrias, indu¸c˜ao de vˆomitos; alguns pacientes eram proibidos de falar ou rir, outros ficavam deitados sem poder se movimentar. Depois o tratamento mais comum se tornou a mudan¸ca de clima, quando os pacientes se deslocavam para
1.1 A tuberculose 13 regi˜oes litorˆaneas ou montanhosas para se tratar, aqueles que n˜ao tinham for¸cas para a viagem passavam a dormir com travesseiros de folhas de pinheiro ou colocar algas ma-rinhas debaixo da cama. Em um momento da hist´oria era comum pacientes irem para sanat´orios receberem o tratamento, estes eram como pousadas e ficavam nas montanhas, tais lugares passaram a ser usados para isolamento dos doentes, tornando-se centros de tratamento para pessoas de qualquer classe social [4].
Com a descoberta do bacilo, surgiram os tratamentos com soros, ant´ıgenos bacilares, vacinas; mas todos sem efic´acia. At´e a d´ecada de 40, o tratamento universal utilizado era o pneumot´orax, que curava apenas cerca de 30 a 40% dos casos [1].
Foi a partir de 1940, com a descoberta de drogas destrutoras do bacilo da tuberculose, que surgiu a era moderna da quimioterapia. Este novo tratamento curava todas as formas de tuberculose. Assim, a letalidade da doen¸ca, que era alt´ıssima, caiu drasticamente, e tamb´em houve diminui¸c˜ao do cont´agio [1].
Atualmente, h´a cerca de doze f´armacos com atividade antituberculosa. O tratamento com a quimioterapia visa impedir o desenvolvimento da resistˆencia, obter a negativa¸c˜ao bacteriol´ogica, obter a cura e evitar reca´ıdas. Para atingir esses objetivos, algumas regras tˆem que ser rigorosamente seguidas [1].
O tratamento ´e dividido em duas partes; na primeira, a chamada “fase inicial intensiva” ou “fase de ataque”, h´a necessidade da utiliza¸c˜ao simultˆanea de pelo menos trˆes medicamentos, o uso destes tem importˆancia decisiva para o resultado final, pois ´
e imprescind´ıvel reduzir o mais r´apido poss´ıvel a popula¸c˜ao bacteriana; quando esta ´e reduzida at´e cerca de 103, a probabilidade de surgirem novos mutantes resistentes ´e baixa.
Esta primeira fase varia de um a trˆes meses [1]. Assim, os objetivos nesta fase s˜ao: reduzir a transmissibilidade, a morbidade e a resistˆencia adquirida [5]. Na segunda, a “fase de manuten¸c˜ao ou de continua¸c˜ao”, dado que a popula¸c˜ao bacilar nas les˜oes est´a muito reduzida, pode ser geralmente realizada com duas drogas [1]. A segunda fase tem como objetivo eliminar os bacilos persistentes proporcionando uma cura efetiva e duradoura da doen¸ca [5].
Quanto ao n´umero de medicamentos, a experiˆencia comprovou que a associa¸c˜ao de trˆes ´e suficiente para impedir a emergˆencia de bacilos resistentes, garantindo o ˆexito do tratamento. A administra¸c˜ao de uma droga ´unica mata os bacilos sens´ıveis e seleciona os germes resistentes a essa droga fazendo com que ocorra uma r´apida multiplica¸c˜ao
1.1 A tuberculose 14 dos restantes. Com a administra¸c˜ao de diversas drogas simultaneamente, os mutantes resistentes `a determinada droga, sendo sens´ıveis `a outra droga, acabam morrendo [1].
H´a trˆes tipos de resistˆencia a medicamentos que dificultam o tratamento da TB. O tratamento com uma droga, ou com v´arias drogas administradas irregularmente, gera a chamada resistˆencia adquirida. A resistˆencia prim´aria ocorre quando um caso novo de tuberculose, que nunca foi submetido `a quimioterapia elimina bacilos resistentes a uma ou mais drogas; esse cont´agio de tuberculose foi feito por germes que j´a eram resistentes `
as drogas. Para o doente com resistˆencia prim´aria, a quimioterapia padr˜ao ´e inoperante. A tuberculose multirresistente ´e o caso que tem resistˆencia conjunta aos dois principais medicamentos utilizados (rifampicina e isoniazida)[1].
Para evitar a resistˆencia adquirida, as drogas devem ser administradas em doses corretas e intervalos de tempo adequados, com toda a regularidade, garantindo sua concentra¸c˜ao no sangue e nas les˜oes em n´ıvel efetivo antibacteriano. Mesmo os efeitos ben´eficos de uma fase inicial intensiva correta podem ser anulados por irregularidade no per´ıodo de manuten¸c˜ao. A interrup¸c˜ao prematura do tratamento ´e tamb´em uma irregularidade que dificulta a cura e facilita as recidivas [1].
Por causa do not´avel aumento de cepas do M. tuberculosis resistentes `as dro-gas, os testes de sensibilidade tornaram-se ainda mais necess´arios e entraram na pr´atica comum nos servi¸cos de bacteriologia. Os m´etodos convencionais mais acess´ıveis fornecem os resultados com prazos relativamente longos. Outros m´etodos, cujos resultados s˜ao for-necidos com tempo mais curto, exigem equipamentos especializados, s˜ao de alto custo e s´o est˜ao ao alcance de laborat´orios mais aparelhados [1].
O conceito de “tempo suficiente” na quimioterapia da tuberculose modificou-se muito ao comparar os atuais crit´erios e os imperantes nos primeiros 20 anos de sua descoberta, quando o tratamento deveria ser de longa dura¸c˜ao, cerca de dois anos. Com o tempo, verificou-se que o tratamento pode ser encurtado para 12 meses usando alguns tipos espec´ıficos de medicamentos. Com alguns tipos de drogas, o tempo de tratamento pode ser encurtado para nove ou seis meses e h´a perspectivas de se tornar ainda mais curto [1].
A avalia¸c˜ao bacteriol´ogica ´e fundamental para o conceito de cura. A avalia¸c˜ao bacilosc´opica, havendo escarro, deve ser rotineiramente mensal. Depois do sexto mˆes de tratamento, com baciloscopia negativa, a cura, sempre que poss´ıvel, deve ser confirmada
1.2 A tuberculose no mundo 15 pela cultura. A maioria das reca´ıdas ocorre no primeiro ano ap´os o termino do tratamento, cerca de 70% no primeiro semestre; reduzem-se a 1% entre o terceiro e o quinto ano [1].
Apesar da existˆencia de um eficaz tratamento, com taxa de cura de cerca de 90% das pessoas submetidas a este [3], durante d´ecadas a TB continua sendo um importante problema de sa´ude global.
1.1.4
O controle e a preven¸
c˜
ao
O cont´agio da TB se agrava por circunstˆancias econˆomico-sociais desfavor´aveis, como pobreza, aglomera¸c˜oes, mobiliza¸c˜oes humanas, guerras. Para o seu controle as principais medidas s˜ao a r´apida descoberta dos casos novos e o tratamento imediato [1].
Uma das maneiras de prevenir as formas mais graves de tuberculose ´e atrav´es da vacina BCG [2], aplicada em crian¸cas, com exce¸c˜ao de casos de soropositivas, ou rec´em nascidas que apresentarem sinais ou sintomas de Aids. Outras formas de preven¸c˜ao incluem evitar aglomera¸c˜oes, principalmente em ambiente fechados, mal ventilados e sem ilumina¸c˜ao solar [4].
1.2
A tuberculose no mundo
A partir da d´ecada de 1940, com o inicio do tratamento com quimioterapia, a tuberculose praticamente foi eliminada nos pa´ıses desenvolvidos. Nos pa´ıses em desenvolvimento e subdesenvolvidos, a diminui¸c˜ao foi insignificante, mas a doen¸ca deixou de constituir um s´erio problema de sa´ude p´ublica. Por´em, a partir dos anos 80, a tuberculose aumentou em todas as ´areas, principalmente nos pa´ıses em desenvolvimento e subdesenvolvidos. V´arios fatores contribu´ıram para essa grave revers˜ao: a falta de aten¸c˜ao aos programas de controle da tuberculose, a epidemia do HIV, o crescimento de cepas do Mycobacterium tuberculosis resistentes `as drogas antituberculosas, o aumento geral da mis´eria entre outros [1]. Esse evento levou a Organiza¸c˜ao Mundial de Sa´ude (OMS), em mar¸co de 1993, declarar a tuberculose em estado de urgˆencia e emergˆencia no mundo; neste ano se estimava um n´umero entre 7 e 8 milh˜oes de casos e que entre 1,3 e 1,6 milh˜oes de pessoas morriam a cada ano ([1]; [6]).
trata-1.2 A tuberculose no mundo 16 mento da tuberculose nos ´ultimos programas de sa´ude p´ublica que eram piores em muitos pa´ıses em desenvolvimento. Dos 8 milh˜oes de casos novos notificados no mundo, 2,5 mi-lh˜oes n˜ao receberam qualquer tratamento; 5 milh˜oes tiveram quimioterapia irregular e apenas 500.000 haviam tido tratamento supervisionado. Pelas graves consequˆencias cl´ıni-cas e epidemiol´ogicas decorrentes da quimioterapia irregular, a Organiza¸c˜ao Mundial da Sa´ude em um de seus documentos fez afirma¸c˜ao de que o “tratamento da tuberculose mal supervisionado e incompleto ´e realmente pior do que n˜ao tratar de todo” [1].
Fundamentado nesses dados, a Uni˜ao Internacional Contra a Tuberculose e Doen¸cas Respirat´orias desenvolveu a estrat´egia do tratamento diretamente supervisio-nado, recomendado pela Organiza¸c˜ao Mundial da Sa´ude, o DOTS (Directly Observed Treatment Short-Course), o tratamento de curta dura¸c˜ao diretamente supervisionado. A estrat´egia DOTS transfere a responsabilidade do tratamento, que antes era do paciente, para os ´org˜aos oficiais da sa´ude. Estes destacam profissionais da sa´ude para diariamente verificarem pessoalmente a tomada dos medicamentos. Em alguns pa´ıses h´a o treinamento de volunt´arios, que se encarregam de alguns doentes de sua vizinhan¸ca, para aconselh´ a-los e esclarecˆe-los da necessidade do tratamento correto e principalmente para assistir a tomada dos medicamentos. O tratamento supervisionado di´ario ´e fundamental nos dois primeiros meses da fase de ataque, podendo na fase de continua¸c˜ao ser duas vezes ou at´e s´o uma vez na semana [1].
As principais vantagens da estrat´egia DOTS s˜ao: altos ´ındices de cura; a negativa¸c˜ao bacteriol´ogica mais r´apida, o que evita o cont´agio e o aparecimento de novos casos; as chances de ocorrer o desenvolvimento da resistˆencia dos bacilos `as drogas s˜ao praticamente nulas; o custo-benef´ıcio ´e baixo, o Banco Mundial coloca o DOTS como o procedimento mais barato de todas as a¸c˜oes de sa´ude [1].
H´a registros de v´arios pa´ıses mostrando que o DOTS pode elevar as curas para em torno de 85%, sendo comuns os ´ındices de 95%. Como exemplo, pode-se citar a China, que apresenta alta prevalˆencia de tuberculose e que em trˆes anos ap´os a ado¸c˜ao do DOTS elevou as curas de 50% a mais de 90%, e reduziu em 50% a propor¸c˜ao de retratamentos [1].
Apesar da maior aten¸c˜ao dada aos programas de controle da doen¸ca, atual-mente, casos de resistˆencias prim´aria e adquirida est˜ao aumentando em todos os pa´ıses em desenvolvimento e desenvolvidos, mais rapidamente nos primeiros. O problema mais
1.2 A tuberculose no mundo 17 preocupante ´e o crescimento da multidrogarresistˆencia, fato que amea¸ca a falˆencia do tratamento da tuberculose [1].
Atualmente, segundo estimativas da Organiza¸c˜ao Mundial da Sa´ude (OMS), um ter¸co da popula¸c˜ao mundial est´a infectada e assim, est´a sob risco de desenvolver a enfermidade. A maioria dos casos ocorre em pa´ıses em desenvolvimento [6], de onde se estima a ocorrˆencia de 95% dos casos e 98% das mortes causadas pela doen¸ca, atingindo toda a popula¸c˜ao, mas predominando em indiv´ıduos economicamente ativos, ou seja, pessoas com idade entre 15 e 54 anos [2]. Algumas caracter´ısticas sociais presentes em grandes centros urbanos nesses pa´ıses, como pobreza, baixa escolaridade, situa¸c˜oes de confinamento, utiliza¸c˜ao de drogas e a dificuldade de acesso aos servi¸cos de sa´ude, tornam os indiv´ıduos vulner´aveis, o que contribui para perpetuar a doen¸ca e a mis´eria [7]. Nos pa´ıses desenvolvidos a incidˆencia ´e mais frequente entre pessoas idosas, nas minorias ´
etnicas e em imigrantes estrangeiros [2]. Em geral, a TB ´e mais comum entre homens do que entre mulheres [3].
Em 2010, foram estimados 8,8 milh˜oes de casos novos ou recorrentes, equiva-lente a 128 casos por 100.000 pessoas. Entre esses casos, 5,7 milh˜oes foram diagnosticados e notificados por programas nacionais de controle da TB, entre os quais se estimou 290.000 casos de TB multirresistente dos quais apenas 53.000, o equivalente a 18%, foram diag-nosticados e direcionados ao tratamento adequado. Foram estimados 12 milh˜oes de casos prevalentes, isso equivale a 178 por 100.000 pessoas. [3].
H´a aproximadamente 1,1 milh˜oes de pessoas com a coinfec¸c˜ao TB/HIV, ou seja, aproximadamente 13% do total; desses casos, a ´Africa ´e respons´avel por 82% do total. A maior parte dos casos de TB encontra-se na ´Asia (59%) e na ´Africa (26%), em menores propor¸c˜oes est˜ao na regi˜ao do mediterrˆaneo (7%), Europa (5%) e Am´ericas (3%). A maioria dos casos notificados no mundo, 81%, est´a presente em apenas 22 pa´ıses. Os cinco pa´ıses com maior incidˆencia s˜ao: ´India (entre 2 milh˜oes e 2,5 milh˜oes, ou seja, aproximadamente 26% do total de casos), China (0,9 milh˜ao e 1,2 milh˜ao, ou seja, 12%),
´
Africa do Sul (0,4 milh˜ao – 0,59 milh˜ao), Indon´esia (0,37 milh˜ao – 0,54 milh˜ao) e Paquist˜ao (0,33 milh˜ao – 0,48 milh˜ao). Ao se observar a incidˆencia por sexo, segundo estimativas, h´a 3,2 milh˜oes de casos entre as mulheres, ou seja, 36% do total [3].
Como enfermidade reemergente, est´a entre as dez principais causas de morte no mundo, a 8a [3], levando 1,5 milh˜oes de pessoas a ´obito; e ´e a segunda maior por
1.3 A tuberculose no Brasil 18 doen¸ca infecciosa, ficando atr´as apenas do HIV, que causou aproximadamente 1,8 milh˜oes de mortes em 2008 [3].
Em 2010, estima-se que 1,1 milh˜oes de pessoas entre as que apresentavam HIV-negativo morreram, o equivalente a 15 mortes por 100.000 habitantes, entre as pessoas com HIV/TB, a estimativa ´e de 0,35 milh˜oes de mortes, mas esses casos s˜ao considerados pela CID-10 como morte por HIV. Se considerar o n´umero de mortes por tuberculose com HIV positivo e negativo, equivale a uma estimativa de 20 mortes por 100.000 habitantes [3].
Desde 2006, o n´umero absoluto de casos por ano de TB tem diminu´ıdo glo-balmente; e a taxa de incidˆencia (por 100.000 habitantes) diminui cerca de 1,3% ao ano desde 2002. As maiores taxas de decl´ınio foram nas Am´ericas, 3,7% ao ano, e na ´Africa, 1,8% ao ano. Em rela¸c˜ao aos 22 pa´ıses que concentram as maiores taxas de incidˆencia, a ´ultima avalia¸c˜ao realizada revelou que as taxas est˜ao diminuindo em 10 pa´ıses, est´avel em 11 e aumentando lentamente na ´Africa do Sul [3].
A tuberculose parece n˜ao apresentar varia¸c˜oes c´ıclicas ou sazonais. A prevalˆ en-cia observada ´e maior em ´areas de grande concentra¸c˜ao populacional, prec´arias condi¸c˜oes s´ocio-econˆomicas e sanit´arias [2].
1.3
A tuberculose no Brasil
Em 1996, visando controlar a TB no Brasil, o Minist´erio da Sa´ude lan¸cou o Plano Emer-gencial para o Controle da Tuberculose, que recomendava a implanta¸c˜ao da Estrat´egia do Tratamento Diretamente Observado (DOTS), esse plano foi oficializado em 1999 por interm´edio do Programa Nacional de Controle da Tuberculose (PNCT). Esta estrat´egia continua sendo uma das prioridades, a meta ´e curar 85% dos doentes e diminuir a taxa de abandono a menos de 5%, e assim evitar o surgimento de bacilos resistentes e possibilitar um controle efetivo da tuberculose no pa´ıs [8].
Segundo dados da OMS, atualmente, o Brasil ocupa o 19o lugar entre os 22
pa´ıses respons´aveis por 80% do total de casos de tuberculose no mundo, e se observado o coeficiente de incidˆencia ocupa a 104o posi¸c˜ao ([9]; [10]). No Brasil h´a aproximadamente
100 mil notifica¸c˜oes de casos de Tuberculose por ano e, destes 85 mil s˜ao novos. Cerca de 6 mil pacientes morrem por ano no pa´ıs, onde a doen¸ca tem sido a 4a causa de morte por
1.3 A tuberculose no Brasil 19 doen¸cas infecciosas [10] e a 1a causa de morte em pacientes com AIDS [9].
Em 2008, os estados com maior n´umero de casos foram: S˜ao Paulo com 15.371 casos, Rio de Janeiro com 10.975 casos e Pernambuco com 4.125 casos, e os estados com maior taxa de incidˆencia foram: Rio de Janeiro (69,14/100.000 habitantes), Amazonas (67,97/100.000 habitantes) e Pernambuco (47,22/100.000 habitantes) [9].
Os principais fatores que contribuem para a manuten¸c˜ao e agravamento do problema s˜ao a persistˆencia da pobreza na sociedade e a ocorrˆencia da AIDS nos grandes centros urbanos (Minist´erio da Sa´ude, 2009); as comunidades mais atingidas s˜ao as po-pula¸c˜oes em situa¸c˜ao de rua, popula¸c˜ao negra, privadas de liberdade, ind´ıgenas e pessoas vivendo com HIV/AIDS [10].
Nas popula¸c˜oes consideradas mais vulner´aveis, as taxas de incidˆencia s˜ao mai-ores do que a apresentada na m´edia nacional. Comparando tamb´em com a popula¸c˜ao geral, na popula¸c˜ao negra ´e duas vezes maior e na ind´ıgena, quatro vezes. Na popula¸c˜ao carcer´aria, a taxa de incidˆencia ´e 25 vezes maior, j´a entre os portadores de HIV ´e 30 vezes maior e na popula¸c˜ao vivendo em situa¸c˜ao de rua, essa diferen¸ca chega a ser de 67 vezes se comparada a m´edia nacional [9]. E, segundo o Guia de Vigilˆancia Epidemiol´ogica (2010), os homens adoecem duas vezes mais do que as mulheres.
A forma considerada mais preocupante da doen¸ca, a tuberculose multirresis-tente, foi medida no Brasil entre os anos de 1995 e 1997 e evidenciou baixa resistˆencia prim´aria, cerca de 1,1%. A multirresistˆencia adquirida teve percentual maior, cerca de 7,9%, o que evidencia tratamentos irregulares ou m´ultiplos abandonos de tratamento. Mas ´
e norma nacional a realiza¸c˜ao de teste de sensibilidade `as drogas em todos os pacientes que se submetem a algum tratamento [1].
A partir da padroniza¸c˜ao do tratamento - rifampicina, isoniazida, pirazinamida e etambutol [8] - e da garantia de gratuidade medicamentos, pˆode-se implantar um sistema de vigilˆancia de tuberculose multirresistente no pa´ıs. Assim, houve progressiva melhora do percentual de cura de casos e redu¸c˜ao do percentual de ´obitos entre esses casos, que era muito grande [1].
Para os casos multidrogarresistentes, esgotadas todas as possibilidades quimi-oter´apicas, h´a a aplica¸c˜ao de procedimentos cir´urgicos depois de rigorosa avalia¸c˜ao clinica do paciente. No Brasil h´a tendˆencia de considerar a multidrogarresistnˆencia como sendo a resistˆencia do M. tuberculosis a trˆes ou mais drogas [1].
1.4 A tuberculose no Estado do Rio de Janeiro 20 No Brasil, a vacina BCG - uma maneira de prevenir as formas mais graves da TB - ´e indicada para as crian¸cas de 0 a 4 anos de idade [2].
Com o objetivo de intensificar as a¸c˜oes voltadas para o controle da tuberculose, em 2009, o Minist´erio da Sa´ude, por meio do Programa Nacional de Controle da Tubercu-lose, estabeleceu novos crit´erios para prioriza¸c˜ao de munic´ıpios no controle da tuberculose no Brasil. Os atuais crit´erios levam em considera¸c˜ao as caracter´ısticas: capitais; muni-c´ıpios com popula¸c˜ao igual ou maior a 100.000 habitantes; taxa de incidˆencia superior a 80% da taxa nacional (32 novos casos por 100.000 habitantes em 2007); taxa de mor-talidade por tuberculose superior `a taxa nacional (2,5 ´obitos por 100.000 habitantes em 2007). Atualmente 181 munic´ıpios est˜ao inclu´ıdos nessa lista. A regi˜ao sudeste apresenta o maior n´umero de munic´ıpios considerados priorit´arios, seguida pela regi˜ao Nordeste e Sul. Os estados de S˜ao Paulo e Rio de Janeiro abrangem 76,5% dos munic´ıpios priorit´arios da regi˜ao sudeste [11].
1.4
A tuberculose no Estado do Rio de Janeiro
Em 2005, 54% dos casos do Estado eram de residentes do munic´ıpio do Rio de Janeiro. Em rele¸c˜ao ao tratamento, a taxa de cura foi 70,2%, e a taxa de abandono, que representa o maior obst´aculo para a efetividade do tratamento, foi de 14% [6].
O estado do Rio de janeiro apresenta uma das maiores taxas de incidˆencia da doen¸ca no pa´ıs. Em 2009 houve a notifica¸c˜ao de 11.778 casos novos de TB, com taxa de incidˆencia de 73,6 casos por 100.000 habitantes [6].
A taxa de incidˆencia da tuberculose na popula¸c˜ao e o ´ındice de mortalidade vˆem a cada ano sendo reduzidos no Estado. De 2001 a 2009 a taxa de incidˆencia passou de 91,1 para 71,1 casos por 100.000 habitantes. J´a quanto `a mortalidade, a taxa variou de 7,1 em 2001 para 5,0 em 2009 [12].
Grande parte de casos de TB no estado se encontram nos grandes centros urbanos, onde ´e poss´ıvel observar v´arios problemas sociais. Dentro de “comunidades” a incidˆencia de tuberculose ´e de quatro a cinco vezes maior do que a m´edia estadual, o que impacta fortemente o ´ındice global do Rio de Janeiro. Na comunidade Rocinha, onde moram 160 mil pessoas, encontra-se uma das piores taxas de tuberculose do mundo - em 2010 a incidˆencia foi de 386,7 casos por 100.000 habitantes. Entre os fatores que podem
1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 21 contribuir para a dissemina¸c˜ao de doen¸cas respirat´orias de comunidades est˜ao: o n´umero de cˆomodos e a concentra¸c˜ao humana intradomiciliar, e o processo de urbaniza¸c˜ao local, que n˜ao favorece o arejamento e entrada de luz solar nos domic´ılios [13].
Entre os munic´ıpios considerados priorit´arios para o controle da Tuberculose no Brasil, 21 s˜ao do Estado do Rio de Janeiro [11].
1.5
A distribui¸
c˜
ao da popula¸
c˜
ao do Estado do Rio de
Janeiro
O Estado do Rio de Janeiro situa-se na regi˜ao sudeste do Brasil e ocupa uma ´area de 43.780,157 km2, o tamanho da popula¸c˜ao ´e 15.989.929 e densidade demogr´afica 365,23
pessoas/km2 [14].
Figura 1.1: Mapa do Estado do Rio de Janeiro
Fonte:
http://mapasblog.blogspot.com.br/2011/11/mapas-do-estado-do-rio-de-janeiro.html
A Figura 1.1 apresenta o mapa dos munic´ıpios do estado, j´a a Figura 1.2 a distribui¸c˜ao da popula¸c˜ao em 2010. A Tabela 1.5 apresenta os cinco munic´ıpios com maior quantidade de habitantes e os cinco com menor quantidade.
1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 22 Tabela 1.1: Os munic´ıpios menos e mais populosos do Estado do Rio de Janeiro em 2010
Munic´ıpio Popula¸c˜ao Macuco 5.269 S˜ao Jos´e de Ub´a 7.003 Laje do Muria´e 7.491 Comendador Levy Gasparian 8.183 Rio das Flores 8.545
.. . ... Niter´oi 487.327 Nova Igua¸cu 795.212 Duque de Caxias 855.046 S˜ao Gon¸calo 999.901 Rio de Janeiro 6.323.037 Fonte:IBGE, 2010
de 70% dela concentrada na Regi˜ao Metropolitana e aproximadamente 40% no munic´ıpio do Rio de Janeiro. No per´ıodo entre 2001 e 2010, houve alto crescimento populacional em v´arias cidades, mas a que mais cresceu foi Rio das Ostras, cerca de 165,7% [14].
No Cap´ıtulo 2 s˜ao apresentados os objetivos geral e espec´ıficos do projeto. No Cap´ıtulo 3 ´e apresentado o banco de dados e a metodologia utilizada. Os resultados ser˜ao descritos no Cap´ıtulo 4. Os Cap´ıtulos 5 e 6 ser˜ao para discuss˜ao de resultados e conclus˜ao.
1.5 A distribui¸c˜ao da popula¸c˜ao do Estado do Rio de Janeiro 23
Figura 1.2: Distribui¸c˜ao da popula¸c˜ao por 10.000 habitantes em 2010
0 100 200 300 400 500 600
24
2 Objetivos
2.1
Objetivos Gerais
Verificar a difus˜ao da tuberculose no Estado do Rio de Janeiro.
2.2
Objetivos Espec´ıficos
Observar a varia¸c˜ao espacial da taxa de incidˆencia em todos os munic´ıpios do Estado do Rio de Janeiro utilizando estimadores cl´assico e bayesiano;
Observar a evolu¸c˜ao dos casos novos de tuberculose no estado e em algumas cidades, e construir um modelo apropriado para encontrar a previs˜ao de valores futuros.
25
3 Materiais e M´
etodos
3.1
O Banco de Dados
O banco de dados a ser analisado ´e composto por todos os casos novos notificados de tuberculose ocorridos mensalmente nos munic´ıpios do Estado do Rio de Janeiro entre os anos de 2001 e 2010 [15]; e pelo tamanho popula¸c˜ao de cada munic´ıpio para estes anos [14]. Com rela¸c˜ao ao tamanho da popula¸c˜ao, os dados do ano 2006 s˜ao da contagem populacional, do ano 2010 s˜ao do Censo Demogr´afico e dos outros anos s˜ao de proje¸c˜oes populacionais realizadas pelo IBGE.
Os dados foram estruturados em planilhas do Excel e para gerar os gr´aficos foi utilizado o software R.
Para cumprir os objetivos deste trabalho, ser˜ao apresentadas, respectivamente, a abordagem referente `a an´alise espacial e outra referente `a an´alise de s´eries temporais. A se¸c˜ao 3.2 apresenta a nota¸c˜ao a ser utilizada ao longo do trabalho.
3.2
Nota¸
c˜
ao
Para fazer referˆencias a determinada unidade de ´area e ao instante de tempo define-se
i= ´ındice associado `a unidade de ´area; onde i = 1, 2, . . . , N ; t= ´ındice associado `a unidade de tempo; onde t = 1, 2, . . . , T .
Assim, para uma regi˜ao i e para o instante de tempo t, tem-se que
Yit= n´umero de ocorrˆencias do evento de interesse,
nit= tamanho da popula¸c˜ao sob risco,
3.3 An´alise de dados espaciais 26 Na Se¸c˜ao 3.3 a abordagem ser´a apenas espacial e o tempo ser´a considerado fixo e, assim, para simplificar a nota¸c˜ao o ´ındice t ser´a omitido. Na Se¸c˜ao 3.4 a abordagem ser´a apenas temporal, e neste caso o ´ındice omitido ser´a o i.
3.3
An´
alise de dados espaciais
Define-se an´alise espacial como o estudo quantitativo de fenˆomenos alocados no espa¸co. Dentro deste, mas com limita¸c˜oes, h´a a an´alise de dados espaciais, que ´e utilizada quando os dados s˜ao espacialmente localizados e ´e levado em considera¸c˜ao o arranjo espacial na an´alise ou na interpreta¸c˜ao dos resultados [16].
Existem v´arias maneiras de se tratar esses tipos de dados, neste trabalho ser˜ao utilizados dados de ´area, que consiste em dados espaciais que foram agregados em unidades de ´area, neste caso em cidades. Dados de ´area s˜ao comumente utilizados em epidemiologia, podendo oferecer alguma perspectiva para sugest˜oes de pol´ıticas para controlar poss´ıveis epidemias.
Em estudos epidemiol´ogicos, a analise espacial ´e utilizada para identificar pa-dr˜oes espaciais de morbidade e mortalidade e os fatores associados a esses padr˜oes; des-crever o processo de difus˜ao de doen¸cas e gerar conhecimento sobre as causas de doen¸cas, visando a predi¸c˜ao e o controle [17].
O requisito essencial em qualquer an´alise de dados ´e a habilidade de “ver” os dados que est˜ao sendo analisados, em dados espaciais essa visualiza¸c˜ao ´e feita atrav´es de mapas. Como qualquer t´ecnica gr´afica de apresenta¸c˜ao de dados, os mapas podem ser de diversas formas, para analisar dados de ´area s˜ao utilizados os “mapas zonalmente sombreados” ou coropl´eticos [16].
Em an´alise de dados espaciais, matematicamente, tem-se o processo {Y (Ai), Ai ∈
A1, . . . , AN}, onde (A1, . . . , AN) s˜ao sub regi˜oes de R, em que
SN
i=1Ai = R e
TN
i=1Ai = ∅.
Genericamente pode-se referir as vari´aveis aleat´orias Y (Ai) como Yi e o valor observado
denota-se por yi. Os dados constituem uma das poss´ıveis realiza¸c˜oes dos valores do
atri-buto em todos os locais [16]. Lembrando-se que os valores s˜ao agregados por ´area e n˜ao por medi¸c˜oes em locais espec´ıficos.
Neste trabalho, a varia¸c˜ao espacial dos atributos de interesse ser´a visualizada atrav´es de mapas coropl´eticos, onde a ´area Ai´e colorida de acordo com uma escala de cores
3.3 An´alise de dados espaciais 27 baseado no atributo de interesse dentro da ´area. O n´umero de classes e os correspondentes intervalos podem ser baseados em diferentes crit´erios, aqui os quintis ser˜ao utilizados.
3.3.1
Estimadores Espaciais
Para avaliar a ocorrˆencia de doen¸cas, os epidemiologistas costumam usar duas medidas b´asicas: a incidˆencia acumulada, ou seja, o n´umero total de novos casos durante o per´ıodo, que reflete o risco m´edio da doen¸ca em uma popula¸c˜ao ao longo de um per´ıodo de tempo especificado, e a taxa de incidˆencia, que reflete a taxa m´edia da ocorrˆencia da doen¸ca por unidade de pessoa-tempo [18].
Observar a varia¸c˜ao espacial das taxas de um determinado fenˆomeno ´e parte fundamental de estudos epidemiol´ogicos. Assim, a apresenta¸c˜ao dos valores obtidos para as estimativas atrav´es de sequˆencia de mapas torna poss´ıvel a compara¸c˜ao de padr˜oes e a identifica¸c˜ao de tendˆencias espa¸co-temporais.
A ocorrˆencia de eventos de sa´ude em uma popula¸c˜ao n˜ao pode ser considerada um valor fixo, por isso ´e poss´ıvel supor que o n´umero de casos ´e uma vari´avel aleat´oria e o que se observa ´e uma poss´ıvel realiza¸c˜ao entre os muitos valores que poderiam ocorrer. Entre as distribui¸c˜oes mais utilizadas para modelar esses tipos de eventos est˜ao a Binomial e a Poisson. A distribui¸c˜ao de Poisson ´e frequentemente utilizada quando os dados s˜ao relacionados a contagem de casos [18].
Ent˜ao, utilizando a distribui¸c˜ao Poisson, para cada regi˜ao i em um instante de tempo t tem-se que
Yi ∼ P oisson(niθi),
onde ni ´e o tamanho da popula¸c˜ao sob risco e θi ´e a taxa de incidˆencia para a regi˜ao i.
Um dos objetivos deste trabalho ´e inferir a taxa de incidˆencia, assim, nas se¸c˜oes seguintes ser˜ao apresentados m´etodos para realizar tal inferˆencia.
3.3.1.1.Estimador Cl´assico
Quando se utiliza a defini¸c˜ao de estat´ıstica cl´assica, a ´unica distribui¸c˜ao envolvida para se determinar estimativas dos parˆametros ´e a verossimilhan¸ca. Os parˆametros tˆem valores fixos e s˜ao estimados a partir da amostra que foi recolhida.
3.3 An´alise de dados espaciais 28 A fun¸c˜ao de verossimilhan¸ca ´e definida como a densidade conjunta de N va-ri´aveis aleat´orias independentes e ´e considerada como uma fun¸c˜ao do parˆametro [19]. Considerando-se o problema como um caso multiparam´etrico, seja θ um vetor de pa-rˆametros cuja dimens˜ao est´a relacionada ao n´umero de munic´ıpios do Estado, ou seja, θ = (θ1, . . . , θN), e seja o vetor y = (y1, . . . , yN) referente ao n´umero de casos em cada um
dos munic´ıpios do Estado, a fun¸c˜ao de verossimilhan¸ca ser´a dada por
L(θ; y) = f (y1, . . . , yN, θi) = N
Y
i=1
f (y, θ). (3.1)
O estimador de m´axima verossimilhan¸ca para a taxa de incidˆencia do munic´ıpio i ´e o valor de θi dentro do espa¸co param´etrico, Θ, que maximiza a fun¸c˜ao L(θ). Tanto
L(θ) quanto logL(θ) tˆem o mesmo valor de m´aximo para θi, assim, para facilitar as contas
costuma-se utilizar o logaritmo da verossimilhan¸ca.
Como a distribui¸c˜ao de Poisson foi adotada, o c´alculo ´e a partir da equa¸c˜ao
L(θ) = N Y i=1 θyie−θ yi! = θP yie−N θY 1 yi! (3.2) dlog(L(θ)) dθi = 0 onde d 2log(L(θ)) dθ2 i < 0 , (3.3) ˆ θi = ¯y. (3.4)
O valor estimado do parˆametro ´e igual `a taxa bruta, ou seja, o n´umero de casos com uma determinada caracter´ıstica dividido pelo tamanho da popula¸c˜ao sob estudo. Assim, o estimador para a taxa de incidˆencia da doen¸ca em estudo na regi˜ao i ´e dado por
T bi =
Yi
ni
i = 1, 2, . . . , N. (3.5)
Um problema observado nesse tipo de abordagem ´e que as taxas estimadas para as ´areas com popula¸c˜ao pequena e com poucos casos do evento estudado s˜ao altamente vari´aveis, j´a que neste caso o impacto de um caso a mais da doen¸ca causado na taxa de incidˆencia ´e grande se comparado a ´areas de grande tamanho populacional. Assim, como uma forma de resolver esse tipo de variabilidade, recorre-se `a Inferˆencia Bayesiana e utiliza-se estimadores onde s˜ao combinados valores observados com informa¸c˜oes subjetivas a priori para o comportamento da regi˜ao, o que tende a suavizar os valores das taxas estimadas [20]. Na se¸c˜ao seguinte ser˜ao apresentados dois tipos de estimadores Bayesianos.
3.3 An´alise de dados espaciais 29 3.3.1.2. Estimadores Bayesianos
Na inferˆencia Bayesiana os parˆametros s˜ao considerados vari´aveis aleat´orias e a distri-bui¸c˜ao a eles atribu´ıda ´e chamada de distribui¸c˜ao a priori, que descreve a cren¸ca que o parˆametro representa sobre as verdadeiras caracter´ısticas da popula¸c˜ao. Sua especifica-¸c˜ao ´e geralmente subjetiva, podendo ser baseada em estudos anteriores, em informa¸c˜oes levantadas junto a especialistas, em informa¸c˜oes da amostra. Certas caracter´ısticas do seu comportamento devem ser levadas em considera¸c˜ao, como, por exemplo, o espa¸co pa-ram´etrico e a simetria esperada. Os parˆametros que definem a distribui¸c˜ao a priori s˜ao chamados de hiperparˆametros [21].
Neste trabalho deseja-se inferir a taxa de incidˆencia, que ´e um valor maior ou igual a zero, por isso deve-se utilizar distribui¸c˜oes que tenham apenas esse intervalo de valores, como ´e o caso da distribui¸c˜ao Gama.
Outra motiva¸c˜ao para se utilizar essa distribui¸c˜ao ´e a defini¸c˜ao de conjuga¸c˜ao; a distribui¸c˜ao a priori para θi pertence a mesma fam´ılia da fun¸c˜ao de verossimilhan¸ca
da distribui¸c˜ao Poisson, ou seja, a parte da fun¸c˜ao que depende da vari´avel de interesse (kernel) possui express˜ao an´aloga, nos dois casos o kernel ´e do tipo
θir−1e−sθi (3.6)
para r e s espec´ıficos.
Assim, supondo-se que θi segue uma distribui¸c˜ao Gama com parˆametros α e
β, a distribui¸c˜ao a priori, que ser´a a mesma para todas as ´areas, ´e dada por P (θi|α, β) = βα Γ(α)θ α−1 i e −βθi, θ i, α, β > 0, (3.7)
onde θi tem como valor esperado α/β e variˆancia α/β2.
A partir da fun¸c˜ao de verossimilhan¸ca e da distribui¸c˜ao a priori pode-se atua-lizar a distribui¸c˜ao de θi atrav´es da aplica¸c˜ao do Teorema de Bayes, resultando na
distri-bui¸c˜ao a posteriori de θi, que incorpora toda a informa¸c˜ao dispon´ıvel sobre o parˆametro
(informa¸c˜ao inicial mais a informa¸c˜ao da experiˆencia ou da amostra). O Teorema de Bayes ´
e dado por
P (θi|Y ) =
P (Y |θi)P (θi)
P (Y ) , (3.8)
onde P (Y |θi) ´e fun¸c˜ao de verossimilhan¸ca, P (θi) ´e fun¸c˜ao de densidade de probabilidade
a priori, P (Y ) ´e fun¸c˜ao de verossimilhan¸ca marginal e P (θi|Y ) ´e fun¸c˜ao de densidade de
3.3 An´alise de dados espaciais 30 A fun¸c˜ao de verossimilhan¸ca marginal informa a chance de valores de Yi
acon-tecerem, independentemente do valor do parˆametro θi. Assim, 1/P (Y ) ´e uma constante
de proporcionalidade e o Teorema de Bayes pode ser escrito como
P (θi|Y ) ∝ P (Y |θi)P (θi). (3.9)
Com a an´alise conjugada, a distribui¸c˜ao a posteriori ter´a o mesmo kernel que a distribui¸c˜ao a priori e a fun¸c˜ao de verossimilhan¸ca, ou seja
P (θi|Y ) ∝ θiyie −niθi× θα−1 i e −βθi, (3.10) = θ(yi+α)−1 i e −(ni+β)θi. (3.11)
Assim distribui¸c˜ao a posteriori tamb´em seguir´a uma distribui¸c˜ao Gama - de-pender´a dos valores observados (atrav´es de yi) e dos parˆametros da priori (α e β) - com
parˆametros a e b, onde
a = α + yi, (3.12)
b = β + ni. (3.13)
A partir da distribui¸c˜ao a posteriori, pode-se obter estimativas atualizadas para a taxa de incidˆencia, o valor esperado para θi|Y ser´a a/b e a sua variˆancia a/b2.
O valor esperado da distribui¸c˜ao a posteriori ser´a a estimativa revisada para a taxa de incidˆencia do evento de interesse.
O problema agora passa a ser a determina¸c˜ao dos valores dos hiperparˆametros, que definir˜ao todo o comportamento da distribui¸c˜ao a priori. Existem v´arias maneiras de encontrar os valores de α e β; podem ser obtidos atrav´es de informa¸c˜oes levantadas junto a um especialista ou baseadas em dados coletados anteriormente sobre o mesmo fenˆomeno, se n˜ao for poss´ıvel nenhum tipo de informa¸c˜ao pr´evia, resta a alternativa de obter essas informa¸c˜oes a partir dos dados observados.
Uma das possibilidades ´e a partir do M´etodo da M´axima Verossimilhan¸ca Marginal onde as estimativas para os hiperparˆametros (α0 e β0) s˜ao os valores de α e β
que maximizam a fun¸c˜ao de verossimilhan¸ca marginal, P (Y ), ou seja
(α0, β0) = argmax[P (Y )]. (3.14)
3.3 An´alise de dados espaciais 31 Bayes, que tamb´em pode ser escrito da seguinte forma
P (Y ) = P (Y |θi)P (θi) P (θi|yi)
, (3.15)
que na an´alise conjugada determina a distribui¸c˜ao Binomial Negativa que tem a fun¸c˜ao de probabilidade dada por
P (Y ) =α + yi yi β β + ni α 1 β + ni yi . (3.16)
Assim, ap´os encontrar os valores dos hiperparˆametros e os parˆametros da pos-teriori, ´e poss´ıvel calcular o valor estimado para a taxa de incidˆencia para cada regi˜ao i com o valor esperado da posteriori dado por
EBi =
α0 + yi
β0+ ni
, (3.17)
onde EBi ´e o estimador Bayesiano para a ´area i.
Outro meio de estimar a taxa de incidˆencia ´e atrav´es do M´etodo dos Momentos, que gera uma estimativa pontual para o parˆametro θi sem a necessidade de estipular uma
distribui¸c˜ao, mas apenas conhecendo seus momentos de primeira e segunda ordens. O estimador para a taxa de incidˆencia ´e dado por
Mi = mi+ Ci(ri− mi), (3.18) aqui Ci = Ai Ai+ mi ni (3.19) ri = yi ni (3.20) onde para uma uma ´area i: Ci ´e a variˆancia da distribui¸c˜ao marginal da taxa bruta, ri´e a
taxa bruta, mi ´e o valor esperado da distribui¸c˜ao a priori, Ai ´e a variˆancia da distribui¸c˜ao
a priori e ni ´e o tamanho da popula¸c˜ao sob risco.
O valor de Ci varia entre 0 e 1, quando o tamanho populacional ni ´e pequeno,
Ci → 0 e o estimador Bayesiano se aproxima da m´edia a priori mi; se o tamanho da
popula¸c˜ao ´e grande, Ci → 1 e o estimador de Bayes se aproxima da taxa bruta [22].
Para cada valor do ´ındice i est´a associada uma ´area. Para facilitar, utiliza-se a mesma distribui¸c˜ao a priori para todas as ´areas (priori global), assim, os valores esperados
3.4 An´alise de S´eries Temporais 32 e as variˆancias para cada ´area ser˜ao os mesmos. Ao utilizar a priori global: mi = m e
Ai = A para toda unidade de ´area i.
Quando se trabalha com o modelo global, qualquer m´edia ponderada para o n´umero de ocorrˆencias ´e um estimador n˜ao viciado para m´edia [20]. Uma possibilidade ´e utilizar a incidˆencia global da regi˜ao a ser mapeada, definida como
mg = PN i=1Yi PN i=1ni , (3.21) ondePN
i=1ni´e o total de pessoas sob risco. Assim, o estimador pelo M´etodo dos Momentos
ser´a dado por
Mi = mg+ Ci(ri− mg). (3.22)
Na estima¸c˜ao da variˆancia a priori, utiliza-se o estimador n˜ao viciado
ˆ A = s2−mI η , se s2 >mI η , 0, caso contr´ario,
(3.23) onde s2 = PI i=1ni(ri − mg)2 PI i=1ni , (3.24)
η ´e o total da popula¸c˜ao ao longo das ´areas, N ´e o n´umero de unidades de ´areas existentes e s2 ´e uma variˆancia ponderada.
A partir da pr´oxima se¸c˜ao a abordagem ser´a apenas temporal e o objetivo ´e verificar a evolu¸c˜ao de novos casos de tuberculose mensalmente.
3.4
An´
alise de S´
eries Temporais
Uma s´erie temporal ´e um conjunto de observa¸c˜oes ordenadas em um determinado in-tervalo de tempo, geralmente regular durante um per´ıodo especifico, uma caracter´ıstica importante nesse tipo de dado ´e que observa¸c˜oes vizinhas s˜ao dependentes. A observa¸c˜ao Yt feita no instante t ´e uma vari´avel aleat´oria, assim, uma s´erie temporal ´e um processo
estoc´astico dado por Y = {Yt, t ∈ T } [23].
Alguns dos objetivos na an´alise de s´eries temporais s˜ao: investigar o mecanismo gerador da s´erie, fazer previs˜oes de valores futuros da s´erie, descrever o comportamento da s´erie, procurar periodicidades relevantes nos dados [23]. Neste trabalho, um dos objetivos ´
3.4 An´alise de S´eries Temporais 33 O primeiro passo antes de se realizar qualquer an´alise ´e fazer a representa¸c˜ao gr´afica dos dados sequencialmente ao longo do tempo, isso pode revelar padr˜oes de com-portamento importantes, como: a tendˆencia da s´erie, a existˆencia ou n˜ao de sazonalidade. A tendˆencia de uma s´erie est´a relacionada a um padr˜ao global de crescimento ou decres-cimento, que pode ser linear, exponencial; j´a a sazonalidade existe quando a s´erie exibe um comportamento que se repete a cada s per´ıodos de tempo [24].
A abordagem utilizada na parte de s´eries temporais ser´a a cl´assica, e neste caso existe a suposi¸c˜ao de estacionariedade. Dentro desse contexto, as se¸c˜oes seguintes apresentar˜ao algumas defini¸c˜oes importantes.
3.4.1
Exemplos de Processos Estoc´
asticos
Ru´ıdo Branco
Um processo {εt, t ∈ T } ´e um ru´ıdo branco se Cov(εt, εs) = 0 para todo t 6= s, ou seja, as
vari´aveis aleat´orias εt s˜ao n˜ao correlacionadas.
Processos de M´edias M´oveis
Um processo {Yt} ´e chamado de processo de m´edias m´oveis de ordem q, ou M A(q) se:
Yt= εt+ θ1εt−1+ · · · + θqεt−q, (3.25)
onde θi ∈ R, i = 1, · · · , q; {εt} ´e um ru´ıdo branco com m´edia zero e variˆancia σε2.
Processos Autoregressivos
Um processo {Yt} ´e chamado de processo autoregressivo de ordem p, ou AR(p) se:
Yt = φ1Yt−1+ φ2Yt−2+ · · · + φpYt−p+ εt, (3.26)
onde φi ∈ R, i = 1, . . . , p; {εt} ´e um ru´ıdo branco com m´edia zero e variˆancia σ2ε.
Modelos auto-regressivos e de m´edias m´oveis
Para muitas s´eries, a inclus˜ao de termos auto-regressivos e de m´edias m´oveis ´e a solu¸c˜ao adequada para encontrar um modelo com um n´umero n˜ao muito grande de parˆametros. Os modelos ARM A(p, q) s˜ao da forma:
˜
3.4 An´alise de S´eries Temporais 34 onde ˜Yt = Yt− µ.
Outra forma de escrever os modelos ARM A ´e utilizando o operador de trans-la¸c˜ao para o passado, denotado por B e definido por:
BZt= Zt−1; (3.28)
BmZt = Zt−m.
3.4.2
Processos Estacion´
arios
Para se trabalhar com uma s´erie temporal ´e necess´ario fazer algumas suposi¸c˜oes simpli-ficadoras; uma delas ´e a estacionariedade [23]. Intuitivamente uma s´erie ´e estacion´aria quando as caracter´ısticas de Yt+τ, para todo τ , s˜ao iguais as de Yt. Tecnicamente existem
dois tipos de estacionariedade: fraca (ou de segunda ordem) e estrita (ou forte). Na pr´ a-tica, ´e aceit´avel que as s´eries observadas sejam fracamente estacion´arias. Formalmente, um processo ´e dito estacion´ario de segunda ordem se e somente se:
(i) E[Yt] = µ, ∀t ∈ T ;
(ii) E[Y2
t ] < ∞, ∀t ∈ T ;
(iii) γt = Cov(Yt, Yt+τ), depende apenas de τ . Assim, se τ = 0 segue que V ar[Yt] = γ0,
ou seja, a variˆancia ´e constante.
Como exemplo de processo estacion´ario pode-se citar o ru´ıdo branco.
Caso n˜ao haja estacionariedade, ´e comum fazer modifica¸c˜oes na s´erie original. O primeiro passo ´e verificar se ´e preciso realizar algum tipo de transforma¸c˜ao, que tem o objetivo de estabilizar a variˆancia da s´erie e/ou tornar a distribui¸c˜ao dos dados mais sim´etrica e pr´oxima da normal; a seguir verifica-se se h´a algum tipo de tendˆencia na s´erie, em caso positivo ser´a necess´ario fazer diferen¸cas sucessivas na s´erie. A primeira diferen¸ca de Yt ´e definida por
4Yt= Yt− Yt−1. (3.29)
Em geral a n-´esima diferen¸ca de Yt ´e dada por
4nY
3.4 An´alise de S´eries Temporais 35 Na maioria das vezes a primeira diferencia¸c˜ao ´e sempre suficiente para que uma s´erie se torne estacion´aria. Segundo McLeod[25], um n´umero excessivo de diferencia¸c˜oes resulta em um valor negativo da correla¸c˜ao de ordem 1 da s´erie diferenciada e quando a s´erie ´e corretamente diferenciada, a variˆancia da s´erie transformada diminui, mas o excesso de diferen¸cas aumentar´a essa variˆancia.
Se Wt = 4dYtfor estacion´ario, poder´a ser representado por um modelo ARM A(p, q),
ou seja,
Wt= φ1Wt−1+ · · · + φpWt−p+ εt+ θ1εt−1+ · · · + θqεt−q. (3.31)
Neste caso, para obter Wt foram realizadas d diferen¸cas de Yt, ent˜ao pode-se
dizer que Ytsegue um modelo autoregressivo integrado de m´edias m´oveis, ARIM A(p, d, q).
A seguir ser˜ao apresentadas algumas defini¸c˜oes necess´arias para a an´alise de s´eries temporais.
Fun¸c˜ao de autocovariˆancia
A fun¸c˜ao de autocovariˆancia de um processo estacion´ario, com m´edia zero ´e dada por γτ = Cov{Yt, Yt+τ} = E[YtYt+τ]. (3.32)
E satisfaz as seguintes propriedades: (i) γ0 > 0 (γ0 ´e a variˆancia (σ2) de Yt);
(ii) γ−τ = γτ;
(iii) | γτ |≤ γ0;
(iv) γτ ´e n˜ao negativa definida, ou seja,
Pn j=1 Pn k=1ajakγτj−τk ≥ 0, para quaisquer n´ u-meros reais a1, · · · , an e τ1, · · · , τn de Y . Fun¸c˜ao de Autocorrela¸c˜ao
A fun¸c˜ao de autocorrela¸c˜ao te´orica (fac) de um processo estacion´ario ´e uma ferramenta extremamente importante para se identificar as propriedades de uma s´erie temporal, como por exemplo, a sua estacionariedade. Se um processo estoc´astico tem m´edia µ e variˆancia σ2, a correla¸c˜ao ser´a dada por
ρτ =
γτ
γ0
= γτ
3.4 An´alise de S´eries Temporais 36 Assim, ρ0 = 1. E essa fun¸c˜ao possui as seguintes propriedades:
(i) ρτ = ρ−τ;
(ii) −1 < ρτ < 1.
Estimadores pontuais de γτ e ρτ
Com base nas observa¸c˜oes Y1, · · · , Yn, a fac ρj ´e estimada por
rj =
cj
c0
, (3.34)
onde cj ´e a estimativa da fun¸c˜ao de autocovariˆancia γj,
cj = 1 n n−j X t=1 (zt− ¯z)(yt+j− ¯y), (3.35) onde ¯y = 1nPn t=1yt.
Fun¸c˜ao de Autocorrela¸c˜ao Parcial (facp)
Seja φk,j o j-´esimo coeficiente de um modelo AR(k) e o φk,k o ´ultimo coeficiente. Segue
que
ρj = φk,1ρj−1+ φk,2ρj−2+ · · · + φk,kρj−k, j = 1, . . . , k, (3.36)
a partir das quais obtˆem as equa¸c˜oes de Yule-Walker
1 ρ1 ρ2 · · · ρk−1 ρ1 1 ρ1 · · · ρk−2 .. . ρk−1 ρk−2 ρk−3 · · · 1 φk,1 φk,2 .. . φk,k = ρ1 ρ2 .. . ρk . (3.37)
Resolvendo as equa¸c˜oes sucessivamente para k = 1, 2, 3, . . . obtˆem-se a quan-tidade φk,k, encarada como fun¸c˜ao de k, ´e chamada de fun¸c˜ao de autocorrela¸cao parcial e
tem como forma geral
φk,k =
| P∗ k |
| Pk |
, (3.38)
onde Pk ´e a matriz de autocorrela¸c˜oes e Pk∗ ´e a matriz Pk com a ´ultima linha substitu´ıda
pelo vetor de autocorrela¸c˜oes.
O coeficiente, φk,k mede a correla¸c˜ao remanescente entre Zt e Zt−k depois de
3.4 An´alise de S´eries Temporais 37 Correlograma
O gr´afico com os τ primeiros coeficientes de autocorrela¸c˜ao como fun¸c˜ao de τ ´e chamado de correlograma. ´E uma importante ferramenta para identificar caracter´ısticas de uma s´erie temporal atrav´es de seu padr˜ao [24].
Uma das caracter´ısticas poss´ıveis de se observar atrav´es do correlograma ´e a n˜ao estacionariedade da s´erie. Em uma s´erie temporal com tendˆencia, os valores das autocorrela¸c˜oes decaem lentamente e neste caso pouca ou nenhuma informa¸c˜ao pode ser retirada da s´erie, assim qualquer tendˆencia deve ser removida antes de continuar a an´alise.
3.4.3
Modelos ARIMA
Uma metodologia muito utilizada na an´alise de modelos param´etricos consiste em ajustar modelos auto-regressivos integrados de m´edias m´oveis, ARIM A(p, d, q), a um conjunto de dados. Esta metodologia ´e conhecida como abordagem de Box e Jenkins [23].
A estrat´egia para a constru¸c˜ao de um modelo ´e baseada em um ciclo iterativo onde a estrutura do modelo ´e baseada nos pr´oprios dados. Este ciclo cont´em quatro etapas: especifica¸c˜ao, identifica¸c˜ao, estima¸c˜ao e verifica¸c˜ao. Caso o modelo n˜ao seja adequado, o ciclo ´e repetido, retornando-se a etapa de identifica¸c˜ao. A fase cr´ıtica do m´etodo ´e a identifica¸c˜ao. ´E poss´ıvel que v´arios pesquisadores identifiquem modelos diferentes que se ajustem bem a mesma s´erie temporal.
A. Especifica¸c˜ao
Nesta fase uma classe geral de modelos ´e considerada, nesse caso o modelo ARIM A.
B. Identifica¸c˜ao
O objetivo da fase de identifica¸c˜ao ´e determinar o n´ıvel de diferencia¸c˜ao (d), a ordem dos termos autoregressivos (p) e a ordem dos termos m´edias m´oveis (q) do modelo ARIM A(p, d, q), e al´em disso fazer estimativas preliminares que ser˜ao utilizadas na fase de estima¸c˜ao. A escolha do modelo ´e feita principalmente com base nas autocorrela¸c˜oes e autocorrela¸c˜oes parciais estimadas.
3.4 An´alise de S´eries Temporais 38 Tabela 3.1: Comportamento das fac e facp de um processo ARM A(p, q)
Processo fac facp
AR(1), φ > 0 Decaimento exponencial somente φ116= 0 AR(1), φ < 0 Decaimento oscilat´orio somente φ116= 0
AR(p) Decaimento para zero 0 se k > p M A(1) Somente ρ 6= 0 Decaimento oscilat´orio ARM A(p, q) Decaimento a partir de q Decaimento a partir de p
da necessidade de transforma¸c˜ao da s´erie original, com o objetivo de estabilizar a variˆancia; a diferencia¸c˜ao da s´erie obtida na primeira parte quantas vezes forem necess´arias, o n´ u-mero de diferen¸cas, d, suficiente ´e alcan¸cado quando a fac amostral decresce rapidamente para zero; e a ´ultima parte ´e identificar o processo ARM A(p, q) resultante, atrav´es da an´ a-lise das autocorrela¸c˜oes e das autocorrela¸c˜oes parciais estimadas, cujos comportamentos devem imitar os comportamentos das respectivas quantidades te´oricas [23]. A Tabela 3.1 mostra o comportamento das fun¸c˜oes de autocorrela¸c˜ao e autocorrela¸c˜ao parcial te´oricas para alguns processos estacion´arios que podem auxiliar na fase de identifica¸c˜ao [24].
Seja o modelo ARM A(p, q) dado por
Yt = φ1Yt−1+ · · · + φpYt−p+ εt+ θ1εt−1+ · · · θqεt−q, (3.39)
Muitas vezes ´e dif´ıcil identificar o melhor modelo atrav´es da fac e facp, outra alternativa nesta fase de identifica¸c˜ao ´e testar modelos de baixa ordem e utilizar formas alternativas de identifica¸c˜ao. Um meio ´e atrav´es dos m´etodos baseados em uma fun¸c˜ao penalizadora, entre estes est´a o crit´erio de informa¸c˜ao de Akaike.
A id´eia ´e escolher as ordens k, l de um modelo ARM A(k, l) que minimizem a quantidade
P (k, l) = ln(ˆσk,l2 ) + (k + l)C(N )
N (3.40)
onde σ2
k,l´e uma estimativa da variˆancia residual obtida ajustando um modelo ARM A(k, l)
`
as N observa¸c˜oes da s´erie e C(N ) ´e uma fun¸c˜ao do tamanho da s´erie. A quantidade (k + l)C(N )N , denominada termo penalizador, aumenta quando o n´umero de parˆametros aumenta, enquanto que a variˆancia residual diminui. Assim, minimizar P (k, l) corres-ponde a identificar as ordens k e l que equilibrem seu comportamento. O crit´erio de informa¸c˜ao de Akaike ´e um dos procedimentos de identifica¸c˜ao que minimizam as fun¸c˜oes penalizadoras particulares. Neste caso, escolhe-se o modelo cujas ordens k e l minimizam
3.4 An´alise de S´eries Temporais 39 o crit´erio AIC(k, d, l) = N lnˆσ2ε+ N N − d2(k + l + 1 + δd0) + N ln2π + N (3.41) onde δd0 = 1, d = 0 0, d 6= 0 e ˆσε2 ´e o estimador de m´axima verossimilhan¸ca de σε2.
A seguir se estipula valores limites superiores K e L para k e l e calcula-se AIC(k, d, l) para todas as poss´ıveis combina¸c˜oes (k, l) com 0 ≤ k ≤ K e 0 ≤ l ≤ L. Em geral, K e L s˜ao fun¸c˜oes de N .
Ap´os ajustar alguns modelos, o melhor ser´a o que fornecer o menor valor AIC.
C. Estima¸c˜ao
Ap´os identificar o modelo provis´orio para a s´erie, o pr´oximo passo ´e fazer a estima¸c˜ao de seus parˆametros.
Considerando-se o modelo ARIM A(p, d, q), h´a p + q + 1 parˆametros para se estimar, ou seja, ξ=(φ,θ, σ2ε), onde φ=(φ1, · · · , φp), e θ = (θ1, · · · , θq), neste caso d > 0
e assim a m´edia ´e nula. Caso contr´ario, µ ´e inclu´ıdo como mais um parˆametro a ser estimado e assim p + q + 2 parˆametros ser˜ao estimados.
Uma das formas de encontrar os estimadores ´e atrav´es da maximiza¸c˜ao da fun¸c˜ao de verossimilhan¸ca exata dada por
p(y1, · · · , yn | ξ) = p(yn, · · · , yp | ξ) n
Y
t=p+1
(yt| yt−1, · · · , yt−p, ξ). (3.42)
D. Diagn´ostico de Modelos
Ap´os a etapa da estima¸c˜ao, deve-se verificar se o modelo representa adequadamente os dados antes de utiliz´a-lo, por exemplo, para fazer previs˜oes. A id´eia ´e verificar o compor-tamento dos res´ıduos onde
res´ıduo = valor observado-valor ajustado (3.43) Se o modelo estiver bom, os res´ıduos estar˜ao pr´oximos de zero com variˆancia constante e ser˜ao n˜ao correlacionados. Se a variˆancia dos res´ıduos n˜ao for constante ser´a necess´ario fazer uma transforma¸c˜ao nos dados.
3.4 An´alise de S´eries Temporais 40 A adequa¸c˜ao do modelo pode ser verificada atrav´es do gr´afico dos res´ıduos e de seu correlograma, que pode indicar poss´ıveis termos faltantes do modelo. Por exemplo, se as autocorrela¸c˜oes residuais sa´ırem do intervalo de confian¸ca nas defasagens 1 ou 2, ou em defasagens sazonais (ex.: 12 em dados mensais) ´e uma indica¸c˜ao de que mais termos de m´edias m´oveis devem ser inclu´ıdos no modelo. O mesmo vale para autocorrela¸c˜oes parciais dos res´ıduos para a inclus˜ao de termos autorregressivos [24].
Outra forma de se fazer a verifica¸c˜ao de adequa¸c˜ao do modelo, ao inv´es de olhar para as autocorrela¸c˜oes residuais individualmente, ´e a partir do Teste de Ljung-Box. Este ´e um teste para as autocorrela¸c˜oes dos res´ıduos estimados. As hip´oteses s˜ao definidas como H0 : n˜ao h´a autocorrela¸c˜ao H1 : h´a autocorrela¸c˜ao
A estat´ıstica de teste utilizada ´e Q(K) = n(n + 2) K X j=1 ˆ rj2 (n − j), (3.44)
que segue distribui¸c˜ao χ2 com K − p − q (ou K-(nº de parˆametros estimados)) graus de liberdade. Sendo K n´umero de autocorrela¸c˜oes utilizadas, em geral, ´e suficiente usar as 10 ou 15 primeiras ˆrk.
Assim, hip´otese de ru´ıdo branco ´e rejeitada para valores grandes de Q(K).
3.4.4
Previs˜
ao com modelos ARIMA
Ap´os realizar todas as etapas do ciclo iterativo de especifica¸c˜ao, identifica¸c˜ao, estima¸c˜ao e verifica¸c˜ao e ter constru´ıdo o modelo ARIM A(p, d, q), o pr´oximo passo ser´a fazer previs˜oes de valores futuros da s´erie. O interesse aqui ´e prever um valor Yt+h, h ≥ 1, sendo as
observa¸c˜oes at´e o instante t conhecidas, assim, a previs˜ao de origem t e horizonte h ser´a denotada por ˆYt(h) e ´e definida como a esperan¸ca condicional de Yt+h dado os valores
passados, isto ´e
ˆ
yt(h) = E(Yt+h| yt, yt−1, . . .). (3.45)
Como uma forma de checar a qualidade de previs˜ao do modelo costuma-se fazer previs˜oes dentro do per´ıodo amostral, neste caso as ´ultimas observa¸c˜oes s˜ao omitidas e o modelo ´e feito com base nas observa¸c˜oes restantes, isso possibilita a compara¸c˜ao dos
3.4 An´alise de S´eries Temporais 41 valores previstos com os valores reais. A diferen¸ca entre os valores previstos e reais ´e chamada de erro de previs˜ao h passos `a frente e ´e denotado por
et+h= ˆyt(h) − yt+h. (3.46)
Para calcular o intervalo de confian¸ca para Yt+h´e necess´ario checar se os erros
seguem uma distribui¸c˜ao normal. Um dos testes utilizados para este fim ´e o teste de Shapiro-Wilk, as hip´oteses s˜ao definidas como
H0 : os dados vˆem de uma distribui¸c˜ao normal
H1 : caso contr´ario.
A estat´ıstica de teste utilizada ´e w = Pn b
i=1(y(i)− ¯y)2
, (3.47)
onde n ´e o n´umero total de observa¸c˜oes, y(i) representa as observa¸c˜oes em ordem crescente,
¯
y ´e a m´edia das observa¸c˜oes e b representa uma constante baseada na diferen¸ca entre as maiores observa¸c˜oes e as menores.
Para a classe de modelos ARIM A, as previs˜oes podem ser obtidas utilizando diretamente a equa¸c˜ao do modelo. A previs˜ao ´e obtida substituindo os valores futuros dos erros por zero, valores futuros da s´erie Yt+1, Yt+2, . . . pela esperan¸ca condicional, e
valores passados de Y e de ε pelos seus valores observados. Por exemplo, para um modelo ARM A(2, 1) cuja equa¸c˜ao ´e dada por
Yt= φ1Yt−1+ φ2Yt−2+ εt+ θ1εt−1, (3.48)
as previs˜oes 1 e 2 passos a frente ser˜ao ˆ
yt(1) = φ1yt+ φ2yt−1+ θ1εt (3.49)
ˆ
yt(2) = φ1yˆt(1) + φ2yt. (3.50)
Generalizando, para modelos AR(p) a fun¸c˜ao de previs˜ao ser´a ˆ yt(1) = φ1yt+ · · · + φpyt+1−p (3.51) ˆ yt(2) = φ1yˆt(1) + · · · + φpyt+2−p (3.52) .. . (3.53) ˆ yt(p + 1) = φ1yˆt(p) + · · · + φpyˆt(1). (3.54)