• Nenhum resultado encontrado

Análise de agrupamento para taxa de incidência de dengue entre os anos de 1990 e 2010 nos estados brasileiros

N/A
N/A
Protected

Academic year: 2021

Share "Análise de agrupamento para taxa de incidência de dengue entre os anos de 1990 e 2010 nos estados brasileiros"

Copied!
5
0
0

Texto

(1)

An´ alise de agrupamento para taxa de incidˆ encia de dengue entre os anos de 1990 e 2010 nos estados

brasileiros

Jader da Silva Jale 1 2 Joseilme Fernandes Gouveia 3 Prof. Dr. Borko Stosic 4

1 Introdu¸ c˜ ao

A Taxa de Incidˆencia de Dengue (TID) ´e uma estat´ıstica que mede o risco da popula¸c˜ao de um determinado espa¸co geogr´afico adoecer de dengue. De acordo com [1], o conceito da TID ´e: n´umero de casos confirmados de dengue (cl´assico e febre hemorr´agica da dengue), por 100 mil habitantes, em determinado espa¸co geogr´afico e no ano considerado (c´odigos A90-A91 da CID-10). O c´alculo da TID ´e dado pela Equa¸c˜ao 1.

T ID = n´umero de casos de dengue confirmados em residentes

popula¸c˜ao total residente (1)

em que o n´umero de casos confirmados inclui todos os tipos de dengue. ´E prefer´ıvel utilizar a TID e n˜ao um n´umero absoluto porque a TID pode se utilizada para fazer compara¸c˜oes entre popula¸c˜oes de tamanhos diferentes (com n´umeros distintos de pessoas sob risco) [2].

A defini¸c˜ao de caso confirmado de dengue baseia-se em crit´erios adotados pelo Minis- t´erio da Sa´ude para orientar as a¸c˜oes de vigilˆancia epidemiol´ogica da doen¸ca em todo o pa´ıs.

A TID estima o risco de ocorrˆencia de casos de dengue, sob a forma endˆemica ou epidˆemica. A ocorrˆencia de casos est´a relacionada `a transmiss˜ao do mosquito Aedes aegypti infectado com o v´ırus da dengue, tipos 1, 2, 3 ou 4 (grupo dos flaviv´ırus). Essas Epidemias tendem a eclodir quando mais de 5% dos domic´ılios apresentam focos de A.

aegypti, cujo habitat ´e urbano e domiciliar.

De acordo com [1], algumas limita¸c˜oes da TID s˜ao:

• A confirma¸c˜ao diagn´ostica de casos baseia-se em exames laboratoriais espec´ıficos (sorologia e isolamento do v´ırus), exceto em situa¸c˜oes epidˆemicas, que oferecem evidˆencia cl´ınico-epidemiol´ogica de dengue.

• A capacidade de detec¸c˜ao, notifica¸c˜ao, investiga¸c˜ao e confirma¸c˜ao laboratorial de casos est´a sujeita `as condi¸c˜oes t´ecnico-operacionais do sistema de vigilˆancia epide- miol´ogica, em cada ´area geogr´afica.

• A maioria dos casos ´e constitu´ıdo de formas cl´ınicas leves e moderadas, com pouca probabilidade de serem reconhecidas. Tornam-se por´em evidentes durante epide- mias, o que imp˜oe aten¸c˜ao na an´alise de s´eries temporais.

1DEINFO - PGBEA/UFRPE. e-mail: jsj ce@uahoo.com.br

2Agradecimento `a CAPES pelo apoio financeiro.

3DEINFO - PGBEA/UFRPE.

(2)

• O indicador n˜ao distingue a febre hemorr´agica da dengue dos casos de dengue cl´as- sico, nem identifica os tipos de v´ırus circulantes.

Portanto, neste trabalho analisamos a TID por estado e por ano. A an´alise ocorreu entre os anos de 1990 a 2010, visto que os dados est˜ao dispon´ıveis para acesso livre no endere¸co eletrˆonico http://tabnet.datasus.gov.br/cgi/idb2000/fqd02 4.htm.

O objetivo deste trabalho ´e aplicar m´etodos de agrupamento ao conjunto de dados, para verificar como se distribuiu a dengue no per´ıodo analisado, bem como a ocorrˆencia ao longo do territ´orio nacional. Toda a parte computacional para a gera¸c˜ao das sa´ıdas gr´aficas bem como a escolha do m´etodo de agrupamento, das distˆancias utilizadas etc, foram implementadas por meio do software livre R, vers˜ao 2.15.3.

2 Materiais e m´ etodos

Os dados sobre a TID foram obtidos a partir do endere¸co eletrˆonico http://tabnet.data sus.gov.br/cgi/idb2000/fqd02 4.htm, no portal de dados do Minist´erio da Sa´ude, o DATA- SUS: www.datasus.gov.br, que disponibiliza diversos bancos de dados do Sistema ´Unico de Sa´ude (SUS) com not´ıcias, produtos e servi¸cos, al´em de dados sobre a sa´ude do Brasil.

Implementamos as sa´ıdas gr´aficas e os m´etodos de agrupamento atrav´es de duas fun-

¸c˜oes. Uma fun¸c˜ao chamada mapa(), que gera o mapa do Brasil, com a densidade estimada da TID, por estado e por ano. E outra fun¸c˜ao, chamada clustering() que gera o agrupa- mento desejado.

Os m´etodos de agrupamento dispon´ıveis na fun¸c˜ao clustering() s˜ao: m´etodos Ward, liga¸c˜ao simples (vizinho mais pr´oximo), liga¸c˜ao completa, liga¸c˜ao m´edia, m´etodo Mc- quitty, m´etodo da mediana e m´etodo centroide (m´etodos hier´arquicos), al´em do m´etodo raio influˆencia (m´etodo particional).

Ainda na fun¸c˜ao clustering(), as distˆancias dispon´ıveis, que s˜ao usadas como medida de dissimilaridade s˜ao: Euclideana, m´axima, Manhattan, Canberra, bin´aria, Minkowski, Bray-Curtis, Mahalanobis, Jaccard, simples, diferen¸ca, Sorensen e parcial.

Os algoritmos hier´arquicos criam uma hierarquia de relacionamentos entre os objetos do conjunto de dados.

Existem duas vers˜oes: aglomerativa e divisiva. A aglomerativa cria grupos a partir de elementos isolados (singletons) e a cada itera¸c˜ao aglutina dois grupos com base na dis- tˆancia entre eles. A divisiva inicia com um grande grupo formado por todos os elementos do conjunto de dados e vai dividindo-os at´e chegar a elementos isolados.

A vers˜ao aglomerativa funciona de acordo com o seguinte algoritmo [3]:

i. Forme um grupo para cada elemento (singletons);

ii. Encontre os pares de grupos mais similares, de acordo com uma medida de distˆancia e m´etodo escolhido;

iii. Aglomere-os em um grupo maior e recalcule a distˆancia deste grupo para todos os outros elementos;

iv. Repita os passos ii e iii at´e formar um ´unico cluster.

O m´etodo raio influˆencia ´e dados pelos seguintes passos [4]:

(3)

1. Determinar, para cada observa¸c˜ao do conjunto de dados analisado, o somat´orio das distˆancias Euclidianas a todos os demais pontos do conjunto. Ordenar as observa¸c˜oes em ordem crescente numa lista DMIN.

2. Determinar o raio de influˆencia de cada observa¸c˜ao. O raio de influˆencia ´e dado pelo somat´orio das distˆancias Euclidianas de cada ponto aos demais, dividido pelo n´umero de observa¸c˜oes.

3. Avaliar, para o primeiro elemento de DMIN (primeiro n´o semente), quais as obser- va¸c˜oes est˜ao contidas dentro do seu raio de influˆencia, compondo, ent˜ao, umcluster.

4. Repetir o Passo 3 para os elementos subsequentes de DMIN que encontram-se fora dos raios de influˆencia dos seus antecessores. Caso uma observa¸c˜ao que j´a comp˜oe um cluster esteja mais pr´oxima de outro candidato a n´o semente, ele deve sair do agrupamento inicial e compor um novo cluster com esse novo candidato.

Os m´etodos para avaliar os agrupamentos foram ´Indice de Rand, ´Indice de Rand Ajustado [5] e Silhueta [6], dados pelas Equa¸c˜oes 2, 3, 5. Ambos variam no intervalo [−1,1]. OndeC ´e a parti¸c˜ao gerada pelo algoritmo para k grupos eR ´e a parti¸c˜ao gerada para k+ 1 grupos. Onde k = 1,2, . . . , n. Em que n ´e o n´umero de objetos do conjunto de dados.

IR(C,R) = a+d

a+b+c+d (2)

IRaj(C,R) = a− (a+c)(a+b)M

(a+c)+(a+b)

2(a+c)(a+b)M (3)

em que M =a+b+c+d. Em que:

• a: N´umero de pares de objetos que pertencem ao mesmo grupo em R e em C;

• b: N´umero de pares de objetos que pertencem ao mesmo grupo em R e a diferentes grupos em C;

• c: N´umero de pares de objetos que pertencem a diferentes grupos emRe ao mesmo grupo em C;

• d: N´umero de pares de objetos que pertencem a grupos distintos em R e a grupos distintos em C.

O crit´erio da Silhueta ´e obtido da seguinte forma: dado um objeto xi pertence a um grupo Ga. Seja a(xi) a distˆancia m´edia de xi para os demais objetos de seu grupo Ga. Realiza-se o c´alculo de ¯D(xi, Gc) para todos os grupos Gc 6= Ga. Assim, b(xi) = minD(x¯ i, Gc).

s(xi) = b(xi)−a(xi)

max{b(xi), a(xi)} (4)

¯ s =

PN

i=1s(xi)

N (5)

(4)

3 Resultados e discuss˜ oes

A Figura 1 ilustra a TID no Brasil nos anos de 1995 e 2006.

Figura 1: TID no Brasil nos anos de 1995 e 2006.

A Figura 2 exibe o dendograma dos dados em geral, o dendograma obtido pelo m´etodo da liga¸c˜ao simples e seu agrupamento, al´em do agrupamento pelo m´etodo raio influˆencia.

2009 1994 1999 1990 2000 1993 2004 1992 2005 2006 1995 1996 2007 2010 1997 1998 2002 2008 2003 1991 2001

Ano

AC MS RR SE PB RJ RN ES BA PE MG AL MT RO GO SC RS DF PR SP AM PI MA PA TO CE AP

Estado

1000 3000 Value

04080

Color Key and Histogram

Count

(a) Dendograma bidirecional dos dados. (b) Dendograma liga¸ao simples.

(c) Liga¸ao Simples: 4 grupos. (d) M´etodo Raio Influˆencia: 6 grupos.

Figura 2: Dendogramas.

(5)

Pode-se notar algumas semelhan¸cas entre os dois agrupamentos. Os estados de Ro- raima, Acre e Mato Grosso do Sul formam singletons, ou seja, s˜ao grupos compostos por apenas um ´unico elemento. Os m´etodos hier´arquicos s˜ao bastante subjetivos, pois quem decide o n´umero de grupos ´e o pesquisador da ´area ou o usu´ario do m´etodo, com base na observa¸c˜ao do dendograma. Por outro lado, o m´etodo raio influˆencia calcula o n´umero de grupos de forma autom´atica.

4 Conclus˜ oes

O estudo da distribui¸c˜ao de eventos relacionados `a sa´ude em popula¸c˜oes com certeza ´e de extrema importˆancia. Os padr˜oes de ocorrˆencia de doen¸cas podem ser analisados siste- maticamente para permitir o entendimento das causas das doen¸cas. Assim, uma estrat´egia b´asica ´e procurar diferen¸cas e similaridades para comparar e contrastar o comportamento de doen¸cas em busca de melhoria de qualidade de vida da popula¸c˜ao. Portanto, atrav´es do estudo realizado neste trabalho, pode-se verificar quais estados ou regi˜oes est˜ao mais vulner´aveis a uma poss´ıvel epidemia de dengue no pa´ıs ou quais regi˜oes sofrem menos com incidˆencia de dengue, afim de que as autoridades competentes tomem as devidas providˆencias cab´ıveis, seja atrav´es de campanhas, fiscaliza¸c˜oes e/ou atrav´es providˆencias emergenciais.

Referˆ encias

[1] CENEPI: Sistema de Informa¸c˜ao de Agravos Notific´aveis (SINAN) e bases demogr´aficas do IBGE. Minist´erio da Sa´ude. Dispon´ıvel em:

http://tabnet.datasus.gov.br/cgi/idb2000/fqd02 4.htm. Acesso em: 3 de abril de 2013.

[2] Costa, G.G.O., Instituto Multidisciplinar. Universidade Federal Rural do Rio de Janeiro. Estimativas Bootstrap para o enviezamento, desvio- padr˜ao e intervalo de confian¸ca para a taxa m´edia de inci- dˆencia de dengue no estado do Rio de Janeiro. Dispon´ıvel em:

http://www.aedb.br/seget/artigos07/1031 Artigo%20Estimativa%20Bootstrap%20 da%20Taxa%20Media%20de%20Dengue.pdf. Acesso em: 20 de mar¸co de 2013.

[3] Johnson, R. A. & Wichern, D. W. Applied Multivariate Statistical Analysis Prentice Hall, 1992

[4] Prata, B.A., & Freitas, S.M. Uma nova abordagem para a an´alise de agrupamento com uma aplica¸c˜ao em agronomia. Dispon´ıvel em:

http://paginas.fe.up.pt/ deg07002/Artigos%202007/SEAGRO2007.pdf. Acesso em:

5 de abril de 2013.

[5] L. Hubert & P. Arabie. Comparing partitions. Journal of Classification, 1985, vol. 2, p´ag, 193-218.

[6] Kaufman, L. & Rousseeuw, P. J. Finding Groups in Data: An Introduction to Cluster Analysis, Probability and Mathematical Statistics. John Wiley, 1990.

Referências

Documentos relacionados

Para avaliar a busca, inicialmente ´e usada a mesma f´ormula para eficiˆencia energ´etica do caso homogˆeneo, que ´e simplesmente a raz˜ao entre os alvos encontrados e a

Suponha que a quantidade semanal demandada dos pneus radiais Super Titan esteja relacionada com seu pre¸ co unit´ ario pela equa¸c˜

O Teorema de H¨ older consiste da afirma¸c˜ ao que a Fun¸c˜ ao Gamma de Euler n˜ao ´e solu¸c˜ ao de nenhuma equa¸c˜ ao diferencial alg´ebrica, ou seja, ´e uma fun¸c˜

O impacto ambiental causado pelos resíduos da construção civil, seja de construção ou de demolição, é perceptível nos lixões, que são fonte de proliferação

A teoria do propaga- dor semicl´ assico K + sc nesta representa¸c˜ ao j´ a existe a bastante tempo [10, 35, 36], por´ em somente ap´ os a dedu¸c˜ ao do retro-propagador K − sc

• Para fun¸c˜ oes de v´ arias vari´ aveis utiliza-se m´etodos de primeira ordem que s˜ao baseados no c´ alculo do gradiente, m´etodos de segunda ordem que s˜ao baseados no

Generalizar o algoritmo para bases de enumera¸c˜ao b > 1, observando que a resposta produzida pelo algoritmo independe da base de enumera¸c˜ao escolhida!. Dica: E poss´ıvel

1 o /03/11 Raz˜ ao de ser da disciplina; objetivos e metodologia; apresenta¸c˜ao breve dos conte´ udos de cada unidade do curso; os crit´erios de avalia¸c˜ao.. Os n´ umeros