• Nenhum resultado encontrado

Universidade de São Paulo (USP), Brasil

N/A
N/A
Protected

Academic year: 2021

Share "Universidade de São Paulo (USP), Brasil"

Copied!
5
0
0

Texto

(1)

Aplicação da teoria de redes complexas no estudo

de relacionamento entre doenças em casos de

óbito do paciente

Fernando Sequeira Sousa

1,2

, Evandro Eduardo Seron Ruiz

2 1Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto,

2Faculdade de Medicina de Ribeirão Preto.

Universidade de São Paulo (USP), Brasil

Resumo - A teoria de redes complexas já foi estudada e aplicada em situações diversas, como as redes

gênicas, a World Wide Web, as redes sociais, entre outras. Neste artigo apresentamos um estudo sobre a aplicação desta teoria no relacionamento entre doenças em casos de óbito de pacientes. Elaboramos as redes utilizando dados de mortalidade de cinco estados brasileiros fornecidos pelo sistema DATASUS – SIM. A sucessão de doenças diagnosticadas, referenciadas pelo código CID-10, para cada paciente, foi utilizada como base para a criação de redes complexas. Alguns dos principais parâmetros para caracterização de redes foram extraídos, as redes foram caracterizadas e comparadas a outras redes conhecidas. As discussões apresentadas esclarecem como a topologia observada destas redes pode servir como uma ferramenta robusta e formalizada estudos sobre relacionamentos entre doenças. Estudos estes que podem ser utilizados para diversas áreas, desde a análise de ocupação de leitos e recursos ambulatoriais até áreas de pesquisa de abrangência mais ampla, como pesquisas sobre saúde populacional.

Palavras-chave: redes complexas,mortalidade, SIM, Código Internacional de Doenças

Abstract – The theory of complex networks has been studied and applied to a variety of topics, from gene

networks, to the World Wide Web, through social networks, among others. In this article we apply this theory to study the relationship between diseases from patient’s mortality registries. The mortality registries used are Brazilian records from the DATASUS – SIM web system. The ICD-10 codes reported for each patient have been used as the substratum for the network creation. Some of the fundamental network parameters have been extracted and the disease’s networks have been characterized and compared to other previously studied networks networks. The discussions presented make clear that the observed network topology can be used as a tool in the areas of public health and medical decision.

Key words: complex networks, mortality, SIM, International Classification of Diseases.

Introdução

A análise estatística de dados é uma das principais ferramentas para a síntese das situações de saúde ou de doenças em populações, quer seja em pequenos grupos de pessoas ou até mesmo em ambientes de promoção de saúde. Medidas simples como a média e desvio padrão podem ser vistas como análises estatísticas de primeiro grau em que doenças isoladas são caracterizadas. No entanto, existem situações de encadeamento entre doenças em pacientes, ou seja, situações em que doenças sucessivas ocorrem numa mesma pessoa [1]. Para estes casos, acreditamos ser conveniente quantificarmos e entendermos a ocorrência desta sucessão de doenças. Para tanto, neste trabalho procuramos caracterizar o relacionamento entre doenças em pacientes que foram a óbito. Neste estudo, os eventos sucessivos, ou seja, as doenças, são abordadas como elementos correlacionados, doenças

ligadas como causa/conseqüência umas das outras formando uma rede de doenças inter-relacionadas.

Caso denotemos estas doenças como um conjunto de elementos chamados aqui de vértices, e conectamos estes vértices por ligações que representam causa/conseqüência (chamemos estas ligações de arestas), teremos uma representação matemática conhecida como um grafo [2]. Já, uma rede complexa é essencialmente um grafo com uma topologia não trivial, ou seja, não é um grafo aleatório e nem tão pouco apresenta padrões de conexão entre seus elementos, ou melhor, o grau de conectividade (número de arestas por vértice) não é regular, nem randômico [3,4]. Podemos dizer que as redes complexas permeiam nossa vida. São exemplos de redes complexas a Internet, a web, redes de proteínas, redes gênicas, redes sociais, entre outras [5]. São características das redes complexas um número de vértices muito superior ao número de arestas, ou também a situação em

(2)

que tanto a quantidade de arestas como a de vértices atinge grandes proporções.

Vários tipos de redes já foram estudadas a fim de entendermos seu comportamento [3,4,5]. A análise de parâmetros característicos de redes complexas é a principal metodologia de estudo destas redes. Neste trabalho temos o objetivo de, a partir dos dados das fichas de óbitos de pacientes de cinco estados brasileiros, elaborar redes complexas, analisá-las e caracterizá-las. Acreditamos que a caracterização dos eventos, ou seja, das doenças que levam pacientes a óbito pode contribuir para o melhor entendimento das condições de saúde da população e inclusive contribuir com o processo de tomada de decisões nesta área.

Metodologia

Para este trabalho foram utilizados arquivos fornecidos pelo sistema DATASUS – SIM [6], referente a pacientes que vieram a óbito no ano de 20051. Utilizamos dados referentes a cinco estados brasileiros, representando as cinco regiões geopolíticas: Alagoas (AL), Acre (AC), Goiás (GO), Rio Grande do Sul (RS) e São Paulo (SP). Destes arquivos, as únicas informações utilizadas foram os códigos CID-10 (Código Internacional de Doenças) anotados por ocasião do óbito ou da internação. O SIM fornece até seis códigos CID por paciente, sendo que o primeiro código é conhecido como “causa da internação”. São fornecidos códigos CID-10 de 4 dígitos em que o último dígito refere-se a uma especialização da doença. Para nosso propósito, utilizamos a codificação CID-10 de 3 dígitos, pela eliminação do último dígito, o que simplifica bastante a rede e não altera os objetivos do trabalho.

A rede complexa foi elaborada da seguinte maneira: cada registro de mortalidade pode conter até seis códigos CID-10. A partir do primeiro código, a causa da internação, os próximos códigos foram ligados a causa da internação formando, para cada registro, um grafo no formato de estrela.

A rede resultante, formada por todos os registros, foi elaborada como uma rede não direcionada e não ponderada, ou seja, não foram atribuídos pesos à freqüência das ligações. Cada estado estudado gerou uma rede complexa distinta. O número de vértices de cada grafo corresponde ao número de diferentes doenças diagnosticadas em cada estado estudado, a saber:

• Acre: 502 vértices • Alagoas: 782 vértices • Goiás: 1033 vértices

• Rio Grande do Sul: 1223 vértices

1 Os dados de 2005 constituíam-se da última versão disponível na época do estudo.

• São Paulo: 1331 vértices

As redes complexas formadas foram analisadas de acordo com os seguintes parâmetros:

Grau máximo e grau médio: O número de arestas incidentes ou emergentes de um vértice i caracteriza o grau

!

k

i deste vértice. O grau

máximo de uma rede corresponde ao maior número de arestas incidentes ou emergentes de um vértice, enquanto que o grau médio pode ser calculado obtendo-se a média de todos os graus dos vértices da rede.

Distância geodésica média: Numa rede complexa dois vértices i e j, não adjacentes, podem estar conectados por uma série de vértices. Chamamos este conjunto de vértices de caminho entre i e j, caminho representado por c.

O número de arestas do caminho é o comprimento do caminho, ou seja, l. A distância geodésica média da rede (

!

l

) é dada por:

!

l =

2

N N "1

(

)

$

i# j

d

ij (1),

como mostra Newman [3], para

!

N

o número total de doenças e

!

d

ij a distância entre dois vértices. Por convenção, caso não exista caminho entre dois vértices, a distância entre eles será considerada infinita. Para uma rede de relacionamentos entre doenças, a distância geodésica entre os vértices mostra quais as doenças estão mais relacionadas e quais estão menos relacionadas entre si.

Eficiência global: Em redes com muitos vértices não conectados existem muitos valores de distância geodésica infinita. Caso consideremos somente os vértices conectados, a distância média calculada será muito pequena. Para contornarmos este problema, podemos usar a medida de eficiência global proposta por Latora e Marchori [7] que por ser escrita como

!

E =

1

N N "1

(

)

1

d

ij i# j

$

(2).

Esta medida pode ser mais representativa que a distância geodésica média além de refletir a propagação da informação na rede, ou seja, no caso das redes estudadas, ela reflete a evolução da doença no quadro de mortalidade.

Assortatividade: Esta medida verifica se a ligação entre dois vértices da rede ocorre preferencialmente entre vértices de grau similar ou não. O coeficiente de assortatividade assume valores no intervalo [-1,1] em que, valores negativos indicam que vértices com alto grau (muito conectados) tendem a se ligar com vértices de baixo grau (pouco conectados).

(3)

Valores positivos indicam que vértices com grau semelhante estão conectados. Esta medida foi calculada usando-se a relação de Pearson [8]. Nesta aplicação, o coeficiente de assortatividade pode indicar se doenças mais freqüentes estão conectadas a outras doenças também freqüentes ou a doenças mais ‘raras’.

Vulnerabilidade: Numa rede complexa existem vértices que são mais importantes que outros vértices. A caracterização de importância deve-se a constatação de que a ausência de um vértice tido como importante numa rede alteraria sobremaneira a sua configuração. A vulnerabilidade de cada vértice i pode ser obtida pela seguinte formulação:

!

V

i

=

E " E

i

E

(3),

em que

!

E

é a eficiência global da rede e

!

E

i é a

eficiência após a retirada do vértice i. A vulnerabilidade da rede será o maior valor de

!

V

i

encontrado. Nesta aplicação a vulnerabilidade da rede, semelhante ao grau de cada vértice, as doenças mais importantes ou criticas da rede.

Componentes conexos: Um componente conexo é um conjunto de vértices conectados entre si. Um componente conexo pode representar quais os vértices estão mais fortemente relacionados, ou, no caso da rede de doenças, as doenças mais interligadas.

Apesar de existirem outros vários parâmetros para caracterização de redes, acreditamos que os parâmetros aqui apresentados são suficientes para caracterizar e comparar as redes de mortalidade frente a outras redes igualmente importantes. Esses parâmetros foram escolhidos partir de uma revisão bibliográfica sobre redes complexas. Não encontramos aplicações de redes complexas relativas a análises de mortalidade ou registros semelhantes. Na ausência de trabalhos similares optamos por revisões bibliográficas [3,5,7,8], no entanto, não existe ainda um consenso sobre as medidas em redes complexas que sirvam como balizadores ou comparadores de redes distintas. A escolha dos parâmetros utilizados neste estudo foi baseada em redes biológicas complexas que contêm características parecidas com a rede aqui proposta.

Resultados

Foram estudados e implementados algoritmos computacionais para o cálculo de todos os parâmetros descritos acima. Estes algoritmos foram aplicados aos dados de mortalidade fornecidos pelo SIM (Sistemas de Informações sobre Mortalidade) do DATASUS. Apesar dos parâmetros descritos na seção anterior já terem sido utilizados para caracterizar

várias outras redes complexas, a aplicação destes para a caracterização de relacionamentos entre doenças é inovador. A Tabela 1 a seguir sumariza os resultados obtidos.

Antes de podermos comparar as redes, devemos afirmar que o a quantidade de dados disponíveis é muito discrepante e varia de estado para estado, não só, obviamente, na quantidade de óbitos que reflete a população de cada estado mas principalmente na quantidade de códigos CID-10 anotados para cada óbito. Enquanto que o grande número de óbitos pode contribuir para minimizar os possíveis erros de anotação, a quantidade de dados anotados por óbito contribui sobremaneira para diferenciar as redes na sua formação inicial.

Tabela 1 - Parâmetros e medidas das redes complexas de

mortalidade dos estados.

AC AL GO RS SP Grau Máximo 260 530 753 1036 1310 Grau Médio 4,3 10,9 21,3 33,4 59,8 Distância Geodésica Média 1,367 1,337 1,354 1,251 1,275 Eficiência Global 0,016 0,017 0,019 0,022 0,031 Assortativida-de -0,152 -0,202 -0,213 -0,255 -0,266 Vulnerabilida-de 0,061 0,048 0,034 0,030 0,021 Componentes Conexos 23 23 7 5 28

Na Tabela 1 acima, nota-se que a medida de grau médio reflete a constatação anterior sobre a diferença entre a quantidade de dados anotados a cada registro de óbito. Quanto mais informações por registro maior será o número de arestas da rede.

Enquanto que para o estado de São Paulo cada doença, em média, possui quase que 60 doenças relacionadas, para o estado do Acre cada doença possui pouco mais de quatro outras doenças relacionadas. Portanto é evidente que existem grandes discrepâncias de padrões de anotação entre os estados. O grau máximo representa a doença mais referenciada, ou seja, a doença mais associada a outras doenças. Certamente esta corresponde a uma doença crítica naquele estado.

Lembramos que a distância geodésica média retrata o número médio de doenças entre quaisquer duas notificações. Podemos observar que estas distâncias não variam muito entre os estados estudados. De fato, a pouca variação apresentada também pode ser atribuída a quantidade de anotações por registro de óbito

(4)

pois os estados de SP e RS apresentam as menores distâncias geodésicas revelando assim que mais doenças são relacionadas a causa da internação.

Lembramos que a eficiência global é uma medida mais apurada que a distância geodésica pois não considera os vértices isolados. Aqui também notamos a diferença entre os estados de SP e RS para com os demais estados dado o mesmo motivo apontado anteriormente.

De todas as medidas, talvez a que tenha mais surpreendido os autores foi a medida de assortatividade. O resultado negativo para todas as redes deveria demonstrar que estas redes acompanham o padrão mais tradicional de redes com hubs, ou seja, vértices que concentram um grande número de ligações provenientes de vértices com baixo grau. Entretanto, a pouca expressividade dos valores não é suficiente para classificar estas redes como tipo hub ou não. Diferentemente da maioria das redes sociais que geralmente apresentam a característica de assortatividade bem pronunciada, as redes de doenças não apresentam esta característica e são mais próximas às redes biológicas como as redes de interação de proteínas, as redes metabólicas e as redes neurais. Este tipo de rede oferece alta percolação e facilita a dispersão de epidemias.

Como uma outra conseqüência da baixa assortatividade, estas redes de doenças são resistentes a ataques, ou seja, apresentam baixos valores de vulnerabilidade. Note, mais uma vez, que as redes dos estados de SP e RS têm valores de vulnerabilidade ainda mais baixos que de outros estados.

Tabela 2 - Vulnerabilidade das redes de doenças nos

estados brasileiros.

AC AL GO RS SP

Vulnerabilida-de 0,061 0,048 0,034 0,030 0,021

Grau Máximo 260 530 753 1036 1310

CID-10 A41 J96 J96 A41 J18

Na Tabela 2 acima em que mostramos os vértices mais vulneráveis da rede, temos: A41, código CID-10 para “Outras septicemias”, J96 significa “Insuficiência respiratória de outra parte” e, finalmente J18 significa “Pneumonia por microrganismo não especificado”.

Quanto ao número de componentes conexos das redes, estes apresentaram uma outra grande variação que também pode ser explicada. Os registros dos códigos CID-10 de todos os estados apresentam alguns erros de codificação. São exemplos destes erros: códigos CID-10 inexistentes e múltiplos códigos num único campo. Codificações deste tipo foram eliminadas dos nosso registros. Essa eliminação

de códigos favoreceu os códigos que tiveram uma única citação, ou seja, estes códigos ficaram mais evidenciados. Lembramos, no entanto, que um componente conexo formado por um único vértice significa somente que aquele vértice não está ligado a outro vértice. Tomemos como exemplo o estado do AC: dos 23 componentes conexos, o componente conexo principal tem 477 vértices. Dos 22 restantes, três componentes tem dois vértices e os 19 restantes tem apenas um vértice. Este padrão é semelhante aos outros estados, ou seja, possuem um grande componente conexo e os demais componentes são compostos de nós isolados e, raramente, de dois nós interligados e sem demais ligações.

Deste modo, apresentamos os resultados de alguns dos principais parâmetros que caracterizam as redes complexas de doenças por cinco estados brasileiros.

Discussão e Conclusões

A utilização de grafos e redes complexas como ferramentas estatísticas para estudar a interligação entre doenças é inovadora na área de saúde pública. Estudando a topologia destas redes podemos obter informações preciosas sobre a evolução das doenças e suas inter-dependências. Observamos que, apesar de algumas diferenças entre as redes motivadas talvez por condições econômicas, políticas e/ou sociais, ou até mesmo, diferenças específicas como a variabilidade no padrão de preenchimento dos dados de registro de óbito, alguns parâmetros colocam estas redes em proximidade entre si e com outras redes biológicas. Notamos que o grau máximo de uma rede de doenças pode ser influenciado pela quantidade de dados reportados em cada registro. Notamos também que as diferentes redes obedecem a um mesmo padrão de assortatividade, indicando que, apesar das variabilidades todas encontradas entre os estados, as redes de doenças mostram-se bem percoladas, ou seja, favorecem a dispersão de doenças. Entretanto, as diferenças provocadas pela pouca quantidade de dados registrados por alguns estados não permite ampliar a discussão para elucidar outras diferenças entre as redes.

Este trabalho deve continuar avaliando redes de doenças mais informativas e procurar calcular parâmetros que caracterizem estas redes como sendo de mundo pequeno (small world) ou não e ainda, buscando quantificar e caracterizar caminhos que mais freqüentemente levam pacientes a óbito.

Agradecimentos

Os autores agradecem as opiniões e as sugestões valiosas de Nelson Augusto Alves. F.S. Sousa agradece a USP pelo apoio financeiro do programa “Bolsa Ensinar com Pesquisa”.

(5)

Referências

[1] Pastor-Satorras, R., Vespignani A. Epidemic dynamics and endemic states in complex networks. Phys. Rev. E 2001 63(6). DOI 10.1103/PhysRevE.63.066117

[2] Szwarcfiter, J. L. Grafos e Algoritmos Computacionais. Rio de Janeiro, Editora Campus, 1984.

[3] Newman, M. E. J., The Structure and Function of Complex Networks. Siam Review 2003 45(2): 167–256.

[4] Barabási, A-L., Réka A.; Hawoong J, Scale-free characteristics of random networks: the topology of World Wide Web. Phys. A 2000 281: 69–77.

[5] Brarabási, A-L., Linked – How everything is connected to everything. Plume; 2003.

[6] SIM, DATASUS, Arquivos de mortalidade, Ministério da Saúde, última visita 10-jul-2008

http://tabnet.datasus.gov.br/tabdata/sim/dado s/cid10 indice.htm.

[7] Latora, V., Marchiori, M. Efficient behavior of small-world networks. European Physics Journal B 2001, 87(19): 198701-4.

[8] Newman, M. E. J., Assortative Mixing in Networks. Physical Review Letters 2002, 89(20): 208701-4.

[9] Faloutsos, M., Faloutsos, P., Faloutsos, C. On power- law relationships of the internet topology. Computer Communications Rev.1999, 29: 251–262.

Contato

Fernando Sequeira Sousa, Departamento de Física e Matemática, FFCLRP – USP, Av. Bandeirantes, 3900, 14040-901, Ribeirão Preto, SP.fe.ibmusp@gmail.com

Referências

Documentos relacionados

A) Ser solidário com outros profissionais, e eximir-se de denunciar atos que contrariem os postulados éticos do código. C) Repassar ao seu substituto as

descobrir os números escolhidos pelos outros componentes do grupo. Atenção professor: Organize os grupos e, se for preciso, relembre como determinar a soma e o produto de

Cargo: Profissional de Educação Física / Profissional de Educação Física – N.A.S.F. Foram utilizados três critérios de seleção e organização dos conteúdos da

Adicionalmente, a política preconiza liberalização das trocas exteriores para impulsionar o crescimento enquanto de um lado sabemos que os países avançados

Quais Atividades-Chave são necessárias para entregar nossa(s) Proposta(s) de Valor.. Nosso Canais

Algumas regras de divisibilidade permitem que saibamos se um número é múltiplo de outro sem a necessidade de fazer

Mamíferos: possuem pelos, os filhotes crescem-na barriga da mãe e vivem na terra e na água.. Aves: põem ovos, possuem penas

Quais meios de pagamento estão integrados com a plataforma Linx Commerce?. Como adicionar PIX