JOÃO PESSOA – PB AGOSTO 2018
UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
UMA METODOLOGIA PARA CONSTRUÇÃO DE REDES BAYESIANAS COM BASE EM ONTOLOGIAS DE DOMÍNIO NA ÁREA DA SAÚDE PARA SUPORTE À
DECISÃO CLÍNICA
CARLOS ALBERTO DE SOUZA
JOÃO PESSOA – PB AGOSTO 2018
UNIVERSIDADE FEDERAL DA PARAÍBA
CENTRO DE INFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM INFORMÁTICA
UMA METODOLOGIA PARA CONSTRUÇÃO DE REDES BAYESIANAS COM BASE EM ONTOLOGIAS DE DOMÍNIO NA ÁREA DA SAÚDE PARA SUPORTE À
DECISÃO CLÍNICA
CARLOS ALBERTO DE SOUZA
JOÃO PESSOA – PB AGOSTO 2018
CARLOS ALBERTO DE SOUZA
UMA METODOLOGIA PARA CONSTRUÇÃO DE REDES BAYESIANAS COM BASE EM ONTOLOGIAS DE DOMÍNIO NA ÁREA DA SAÚDE PARA SUPORTE À DECISÃO CLÍNICA
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação da Universidade Federal da Paraíba por Carlos Alberto de Souza, sob a orientação da Profa. Dra. Natasha Correia Queiroz Lino, como parte dos requisitos necessários para a obtenção do título de Mestre em Informática.
Linha de Pesquisa: Computação Distribuída Orientadora: Prof.ª. Drª. Natasha Correia Queiroz Lino.
Catalogação na publicação Seção de Catalogação e Classificação
S729m Souza, Carlos Alberto de.
UMA METODOLOGIA PARA CONSTRUÇÃO DE REDES BAYESIANAS COM BASE EM ONTOLOGIAS DE DOMÍNIO NA ÁREA DA SAÚDE PARA SUPORTE À DECISÃO CLÍNICA / Carlos Alberto de Souza. - João Pessoa, 2018.
128 f. : il.
Orientação: Natasha Correia Queiroz Lino.
Dissertação (Mestrado) - UFPB/CI.
1. Informática em Saúde. 2. Redes Bayesianas. 3. Sistemas de Suporte à Decisão Clínica. 4. Ontologias.
I. Lino, Natasha Correia Queiroz. II. Título.
UFPB/BC
Não espere ter certeza em cada questão que se envolva. Há uma centena de coisas nas quais nós mortais devemos nos contentar com probabilidades, pois nossos melhores entendimento e raciocínio não irão além. (Isaac Watts)
Dedico esse trabalho aos meus pais.
AGRADECIMENTOS
Primeiramente, agradeço as duas pessoas responsáveis pelas minhas conquistas, minha mãe Josefa e meu pai Josinaldo, por sempre acreditarem e apoiarem as minhas decisões, além de sempre estarem presentes, onde nunca mediram esforços para me ajudar quando mais precisei.
Ao meu irmão, Cassiano, agradeço pelo apoio concedido em mais uma fase da minha vida.
Ao Programa de Pós-Graduação em Informática (PPGI), agradeço a oportunidade oferecida de avançar em minha carreira acadêmica.
Agradeço a minha Orientadora, Drª Natasha Queiroz, pela confiança, paciência, por compartilhar seus conhecimentos e principalmente acreditar no meu potencial.
Agradeço à Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) pelo seu apoio financeiro durante o desenvolvimento do meu mestrado.
Agradeço a todos os colegas do Laboratório de Inteligência Artificial Aplicada – LIAA em especial Renan Gomes, Ana Patrícia, Arthur Batista, Cecília Pegado e Mayrton Dias por estarem presentes nesta fase da minha vida.
Agradeço à Cecilia Pegado, pela confiança, paciência, dedicação, companheirismo, por compartilhar seus conhecimentos e principalmente por acreditar no meu potencial.
Agradeço aos meus amigos Ana Patrícia e Arthur pela amizade verdadeira e pela parceria durante todo o mestrado.
Agradeço a minha amiga Luciene Roberta pela sua amizade verdadeira, parceria e companheirismo. Também, agradeço à Gilvandra, minha quarta mãe, sempre presente na minha vida, me apoiando e ajudando nos momentos mais difíceis.
Agradeço também à Deus e a todos amigos, professores e familiares, que não foram citados, mas que forma direta ou indiretamente foram responsáveis por mais essa conquista.
RESUMO
Carlos Alberto de Souza. Uma metodologia para construção de redes bayesianas com base em ontologias de domínio na área da saúde para suporte à decisão clínica.
Por meio da união de duas abordagens da Inteligência Artificial, Representação do Conhecimento por meio de Ontologias, e o tratamento de informações incompletas por meio do uso de Redes Bayesianas (RBs), este trabalho possui como objetivo criar uma metodologia para a construção de RBs com base em ontologias de domínio da área da saúde, com o intuito de fornecer suporte à decisão clínica. Para avaliar a metodologia criada, esta foi aplicada a uma ontologia do domínio da Nefrologia, mais especificamente sobre a Doença Renal Crônica (DRC), a partir da qual foi construída uma RB. Para a obtenção das probabilidades da rede gerada foram utilizados casos clínicos reais de uma base de dados de pacientes do Hospital Universitário Lauro Wanderley no Estado da Paraíba. Para tal, foram utilizadas técnicas como: especificação direta de probabilidade, probabilidade marginal e probabilidade condicional. Desta forma, foi feita a construção da tabela de probabilidade condicional dos nós da RB. Diante dos resultados obtidos com a avaliação experimental, na qual foi aplicada a metodologia definida neste trabalho, foi possível observar a criação de novos conhecimentos a partir de conhecimentos preexistentes. A rede gerada possibilitou ainda a extração de conhecimento probabilístico de uma ontologia pelo uso da RB, possibilitando a obtenção de conhecimentos não fornecidos pela ontologia devido a informações inexistentes e/ou incertas.
Palavra-chave: Informática em Saúde; Redes Bayesianas; Sistemas de Suporte à Decisão Clínica; Ontologias.
ABSTRACT
Carlos Alberto de Souza. A methodology for the construction of bayesian networks based on ontologies in the health domain to support clinical decision.
Through the union of two approaches of Artificial Intelligence, Knowledge Representation via ontologies, and the treatment of incomplete information through the use of Bayesian Networks (BNs), this work aims to create a methodology for the construction of BNs based on ontologies of the health domain in order to provide clinical decision support. In order to evaluate the methodology, it was applied to an ontology of the Nephrology domain, more specifically of Chronic Kidney Disease (CKD) from which a BN was built. To obtain the probabilities of the Bayesian Network generated, it was used real clinical cases from a database of patients from the Lauro Wanderley University Hospital in the State of Paraíba. For that, it was used techniques such as: direct probability specification, marginal probability and conditional probability. In this way, the conditional probability table was constructed, for the obtained nodes of the BN. Given the results obtained with the experimental evaluation, where the methodology was applied, it was possible to observe the creation of new knowledge based on pre-existing knowledge.
The generated network also enabled the extraction of probabilistic knowledge of an ontology by the use of BN, allowing the obtaining of knowledge not provided by the ontology, due to non-existence and/or uncertain information.
Keyword: Health Informatics; Bayesian Networks; Clinical Decision Support Systems;
Ontologies.
SUMÁRIO
1. INTRODUÇÃO ... 15
1.1. Motivação ... 15
1.2. Objetivos ... 18
1.2.1. Objetivo Geral ... 18
1.2.2. Objetivos Específicos ... 18
1.3. Estrutura da Dissertação... 18
2. FUNDAMENTAÇÃO TEÓRICA ... 19
2.1. Informática em Saúde ... 19
2.2. Ontologia ... 19
2.2.1. OWL – Ontology Web Language ... 20
2.2.2. Modelo RDF - Resource Description Framework ... 21
2.2.3. Grafo RDF ... 23
2.3. Sistema de Suporte à Decisão Clínica... 24
2.4. Doença Renal Crônica (DRC)... 25
2.4.1. Grupos de Risco para DRC ... 25
2.4.2. Diagnóstico da DRC ... 26
2.5. Redes Bayesianas ... 27
2.5.1. Teoria de Probabilidade... 28
2.5.2. Probabilidade Condicional ... 28
2.5.3. Probabilidade Total ... 28
2.5.4. Teorema de Bayes ... 29
2.5.5. Construção da Redes Bayesianas ... 29
2.5.6. Independência ... 31
2.5.7. Inferência em Rede Bayesiana ... 32
2.5.8. Aprendizagem Bayesiana ... 33
2.6. Conclusão ... 33
3. TRABALHOS RELACIONADOS ... 35
3.1. Redes Bayesianas em Saúde ... 35
3.1.1. Uso de Redes Bayesianas Aplicadas à Área Da Saúde ... 35
3.1.2. Uso de Redes Bayesianas Aplicadas à Área da Saúde com Sistema De Apoio à Decisão Clínica. ... 38
3.2. Redes Bayesianas e Ontologias... 40
3.2.1. Uso Conjunto de Ontologias e Redes Bayesianas Aplicadas a Domínios Gerais. 40 3.2.2. Uso Conjunto de Ontologias e Redes Bayesianas Aplicadas à Área da Saúde 43 4. PROCESSO METODOLÓGICO PARA CONSTRUÇÃO DE REDE BAYESIANA A PARTIR DE UMA ONTOLOGIA NO DOMÍNIO DA SAÚDE. .... 49
4.1. Processo Metodológico ... 49
4.1.1. Passo 1: Análise Ontológica ... 50
4.1.2. Passo 2: Definir Escopo ... 50
4.1.3. Passo 3: Construção da Topologia da Rede Bayesiana ... 53
4.1.4. Passo 4: Validar a Rede Bayesiana ... 56
4.2. Conclusão ... 56
5. APLICAÇÃO DA METODOLOGIA E ANÁLISE DOS RESULTADOS ... 57
5.1. Aplicações da Metodologia ... 57
5.1.1. Passo 1: Análise Ontológica ... 57
5.1.2. Passo 2: Definição de Escopo ... 58
5.1.3. Passo 3: Construção da Topologia da Rede Bayesiana ... 69
5.1.4. Passo 4: Validação e Testes... 77
5.1.4.1. Resultado Final da Avaliação com Casos Clínicos ... 87
5.2. Conclusão ... 87
6. CONSIDERAÇÕES FINAIS. ... 89
6.1. Contribuições Esperadas ... 90
6.2. Limitações do Método ... 91
6.3. Publicações ... 92
6.4. Trabalhos Futuros ... 92
REFERÊNCIA ... 93
APÊNDICE A – Base de Dados Pré-processada ... 101
APÊNDICE B – Tabela de Probabilidade Condicional dos nós ClassificaDRC e Nefrologista. ... 109
APÊNDICE C – Questionário ... 123
APÊNDICE D – Estrutura da ONTODRC ... 126
LISTA DE FIGURAS
Figura 1 - Triplas RDF. ... 22
Figura 2 - Grafo RDF com representatividade de um trabalho de dissertação. ... 23
Figura 3 - Prognóstico da DRC por TFG e de classificação de Albuminúria. ... 27
Figura 4 - Estrutura básica de uma Rede Bayesiana. ... 30
Figura 5 - Passos Metodológicos para construção de Redes Bayesiana a partir de Ontologia no domínio da Saúde. ... 50
Figura 6 - Métricas da ONTODRC fornecidas pela ferramenta Protegé. ... 58
Figura 7 - Grafo das Superclasses presente na ONTODRC... 60
Figura 8 - Consultas de entrada e consulta de resposta a partir das TFG1 e A1 ... 61
Figura 9 - Consultas de entrada e consulta de resposta a partir das TFG2 e A1 ... 61
Figura 10 - Consultas de entrada e consulta de resposta a partir das TFG3A e A2... 61
Figura 11 - Consultas de entrada e consulta de resposta a partir das TFG3B e A1 ... 62
Figura 12 - Consultas de entrada e consulta de resposta a partir das TFG4 e A2 ... 62
Figura 13 - Consultas de entrada e consulta de resposta a partir das TFG5 e A3 ... 62
Figura 14 - Grafo de ligações da superclasse Estadiamento. ... 68
Figura 15 - Axioma da classe DoencaRenalCronicaEstagio3B ... 68
Figura 16 - Estrutura da Rede Bayesiana gerada a partir dos passos metodológico... 70
Figura 17 - Estrutura do estado das variáveis da Rede Bayesiana gerada da ONTODRC. ... 72
Figura 18 - Teste da rede gerada com o caso clínico apresentado pela especialista. ... 79
Figura 19 - Teste da rede gerada com o caso clínico apresentado na literatura médica, caso 2. .... 81
Figura 20 - Teste da rede gerada com o caso clínico apresentado na literatura médica, caso 3. .... 83
Figura 21 - Teste da rede gerada com o caso clínico apresentado na literatura médica, caso 4. .... 84
Figura 22 - Teste da rede gerada com o caso clínico apresentado na literatura médica, caso 5. .... 86
LISTA DE TABELA
Tabela 1 - Tabela Comparativa de Técnicas Bayesianas Aplicadas à Área da Saúde. ... 37
Tabela 2 - Tabela Demonstrativa Dos Trabalhos Sobre Ontologia E Rede Bayesiana Na Saúde. . 46
Tabela 3 - Listagem das Superclasses e Subclasses selecionadas da ONTODRC. ... 63
Tabela 4 - Estruturação das classes da ONTODRC em nós da Rede Bayesiana ... 66
Tabela 5 - Listagem das principais propriedades da ONTODRC. ... 67
Tabela 6 - Nó Sexo ... 73
Tabela 7 - Nó ExameDeImagem ... 73
Tabela 8 - Nó ExameEQU ... 74
Tabela 9 - Nó Idade ... 74
Tabela 10 - Nó TaxaFG ... 74
Tabela 11 - Nó RAC ... 74
Tabela 12 - Tabela da probabilidade condicional do nó RISCO ... 75
Tabela 13 - Tabela da Probabilidade Condicional do nó MedicoDaAtencaoPrimaria ... 76
Tabela 14 - Tabela da Probabilidade Condicional do nó RefazerExames. ... 77
Tabela 15 A - Variável Idade. ... 101
Tabela 16 A - Variável Sexo. ... 101
Tabela 17 A - Variável Exame de Imagem. ... 102
Tabela 18 A - Variável Exame de Urina. ... 102
Tabela 19 A - Variável TFG. ... 102
Tabela 20 A - Variável RAC. ... 102
Tabela 21 A - Variável Profissionais. ... 102
Tabela 22 A - Variável Manejo Clínico. ... 102
Tabela 23 A - Variável Medicamento. ... 102
Tabela 24 A - Resultado do pré-processamento a partir da base de dados de pacientes atendido no Hospital Universitário de João Pessoa-PB. ... 104
Tabela 25 B - Probabilidade condicional do nó CLASSIFICADRC. ... 109
Tabela 26 B - Probabilidade condicional do nó Nefrologista. ... 121
LISTA DE ABREVIATURAS E SIGLAS
AM – Aprendizagem de Máquina;
CAMML – Causal Minimum Message Length;
CCL - Comprometimento Cognitivo Leve;
CDSS – Clinical Decision Support System;
CelO – Cell Component Ontology;
CERAD – Consotium to Establish a Registry for Alzheimers Disease;
COR - Característica de Operação do Receptor;
CPCNP - Câncer de Pulmão de Células Não-Pequenas e;
CPPC - Câncer do Pulmão de Pequenas Células;
DA - Doença de Alzheimer;
DL- Description Logic;
DRC - Doença Renal Crônica;
EC – Engenharia do Conhecimento;
GAD - Grafos Acíclicos Dirigidos;
GDC - Grafo Dirigido sem Ciclos;
IA - Inteligência Artificial;
IC - Inferred Causation;
KDIGO - Kidney Disease Outcomes Quality Initiative;
MSKCC - Disease Management System;
NLCA – National Lung Cancer Audit;
OWL - Ontology Web Language;
PR-OWL – Language for Representing Probabilistic Ontologies;
PSF – Programa de Saúde Familiar;
RAC – Relação Albuminúria Creatinúria;
RACPC – Rapid Access Chest Pain Clinic;
RB - Rede Bayesiana;
RES – Registro Eletrônico de Saúde;
RNA - Redes Neurais Artificiais;
ROC - Receiver Operating Characteristic;
RDF - Resource Description Framework;
SE – Sistemas Especialistas;
SI - Sistemas Inteligentes;
SADC - Sistema de Apoio à Decisão Clínica;
SDC - Suporte à Decisão Clinica;
SSDC - Sistema de Suporte à Decisão Clínica TPC - Tabelas de Probabilidade Condicionais;
TFG - Taxa Filtração Glomerular;
TIC -Tecnologias de Informação e Comunicação URL - Uniform Resource Locator;
URI - Resource Identifier;
XML - Extensible Markup Language.
15
1. INTRODUÇÃO
1.1. MOTIVAÇÃO
A Inteligência Artificial (IA) ao longo dos tempos vem buscando mecanismos para produzir aplicações que possam ser utilizadas em situações do mundo real. Uma das áreas em destaque é a da Saúde, que adota mecanismos tradicionais de modo a se chegar à resolução de problemas, por exemplo, a tomada de decisão clínica. Para tanto, é necessário um conhecimento específico utilizado como base pelo médico para que se obtenha o diagnóstico clínico de um paciente.
No sentido de realizar um diagnóstico, são utilizadas técnicas tradicionais da medicina tais como: a propedêutica clínica que é composta pela anamnese; um interrogatório direcionado ao paciente, onde são necessários exames para se chegar a um possível diagnóstico (GRABER e MATHEW, 2008).
Uma das contribuições apresentadas na Ciência da Computação para o apoio ao diagnóstico clínico é a definição de técnicas para criar sistemas capazes de auxiliar profissionais no processo de tomada de decisão. Outros mecanismos que podem ser citados são as aplicações de técnicas da IA, como: aprendizagem de máquina e mineração de dados.
É sabido que o diagnóstico exige uma diversidade de elementos e causalidade, o que torna o processo bastante complexo para uma tomada de decisão. Com isto, podem existir aspectos incertos em quase todos os procedimentos médicos, ocasionando interferências quanto à segurança e eficácia nos resultados.
Essas incertezas e inconsistências presentes no diagnóstico são um dos fatores que motivam a criação de Sistemas Especialistas (SE), mecanismos desenvolvidos para realizar um raciocínio a partir de um conhecimento específico, de modo a fornecer o Suporte à Decisão Clínica (SDC).
Segundo Sim et al. (2001), os sistemas de SDC são apresentados como grandes propulsores na transcrição das dificuldades do conhecimento médico para o meio informatizado, possibilitando o auxílio aos cuidados em saúde. Como exemplo de sistemas de SDC pode-se destacar aqueles com capacidade de raciocínios probabilísticos, estatísticos ou técnicas de otimização no gerenciamento dos dados médicos a fim de resolver diversos problemas no diagnóstico, como incerteza e incompletude de informações.
16 Uma das principais técnicas apresentadas na IA para tratamento de informações incertas e incompletas é a utilização de Redes Bayesianas (RB) que são grafos acíclicos dirigidos (Pearl, 1988). Além de apresentar determinado problema de forma gráfica, as RBs possibilitam o tratamento desses problemas pelo uso de cálculos probabilísticos.
As RBs são facilmente integradas a sistemas que fornecem SDC, além de permitir capturar informação e lidar com situações de incerteza. Sabe-se que domínios específicos podem ser modelados como uma RB. Como exemplo, pode ser mencionada a representação das relações entre os estágios do paciente com Doença Renal Crônica e os sintomas apresentados nos exames solicitados pelo médico. A representação gráfica das relações entre as informações permite uma visualização simplificada do sistema.
A RB pode ser definida como uma rede probabilística, pois é constituída por uma estrutura gráfica com uma distribuição de probabilidades a ela associada (LOPES, GONÇALVES e TODESCO, 2012).
Segundo Mahoney e Laskey (1996), à medida que as RBs se tornam mais populares e bem entendidas como uma ferramenta para modelar incerteza seu poder computacional aumenta, tornando-se inadequadas para representar o conhecimento em domínios grandes e complexos.
Por outro lado, para representar o conhecimento têm-se as ontologias, mecanismos capazes de apresentar melhorias na recuperação da informação ao organizar o conteúdo de fontes de dados que compõem um domínio. Uma ontologia define os termos e as relações básicas que compõem o vocabulário de uma área do conhecimento, bem como as regras para a combinação de termos e relações para definir extensões ao vocabulário (Neches et al., 1991).
As ontologias proporcionam formas de representação subjacente baseadas em lógica, o que possibilita o uso de mecanismos de inferência para criar novo conhecimento a partir do existente (ALMEIDA e BAX, 2003).
Segundo Lopes, Gonçalves e Todesco (2012), uma das caraterísticas fundamentais das ontologias é a sua grande capacidade representativa da estrutura organizacional de um grande domínio complexo e raciocinar sobre ela. Mas, existem limitações em sua aplicação, como a incapacidade de trabalhar com incertezas (Koller e Friedman, 2009). Uma das formas mais precisas para tratar essa incapacidade, segundo Yang e Calmet (2006), é através do cálculo probabilístico.
17 Adicionalmente, tem-se a associação das ontologias às RBs, uma forma estrutural e adequada possibilitando aproveitar a potencialidade de cada uma delas no apoio ao processo de diagnóstico de forma complementar (YANG e CALMET, 2006).
Por tratar a incerteza por meio do cálculo de probabilidades e sendo o raciocínio baseado na realização de inferências probabilísticas, as RBs podem ter uma representação gráfica e probabilística, a partir do perfil de conhecimento já modelado da ontologia, assim podendo ser extraídos os principais aspectos, como: Conceitos (Classes), Propriedades (Ligações), Axiomas (Dependências) e Instâncias. Por meio de seus arcos as RBs podem representar suas dependências e independências e ainda podem lidar no tratamento da incerteza de forma probabilística, a partir da construção da Tabela de probabilidade, possibilitando calcular a probabilidade condicional.
Além da sua grande capacidade de representar o conhecimento de um domínio, as ontologias possibilitam a construção de um novo conhecimento a partir de um já existente. Um grande fator motivacional para o uso de ontologias na construção de RBs está relacionado ao fato da ontologia ter uma excelente capacidade de representar a estrutura organizacional de um grande domínio complexo e raciocinar sobre ele. Porém, existem limitações quanto à inabilidade das ontologias de lidar com incertezas (KOLLER e PFEFFER, 1998; CARVALHO et al., 2010).
Com as ontologias associadas às RBs, tem-se uma estrutura adequada para apoiar o processo relacionado à tomada de decisão clínica, como as exceções e/ou imparcialidades nos diagnósticos, como por exemplo: o paciente a partir dos exames apresenta um determinado estágio da doença, mas os sintomas demonstram um outro estágio.
Em consideração a todos os aspectos motivacionais desse estudo, buscou-se um mecanismo na Ciência da Computação, especificamente na IA, para lidar com incertezas em sistemas de SDC baseados em ontologias e assim auxiliar médicos na tomada de decisão. Desse modo, o presente trabalho consiste na modelagem e construção de uma metodologia para dar suporte à criação de RBs (Norvig e Russell, 2014; Pearl,1988), a partir do conhecimento especificado em ontologias do domínio Graber e Mathew (2008) da saúde.
18 1.2. OBJETIVOS
1.2.1. Objetivo Geral
Modelar e construir uma metodologia para a criação de RBs a partir de ontologias no domínio da saúde.
1.2.2. Objetivos Específicos
Para se alcançar o objetivo geral foram definidos os seguintes objetivos específicos:
1. Definir método para construir uma rede Bayesiana a partir de uma ontologia de domínio da saúde;
2. Construir uma rede Bayesiana a partir de uma ontologia de domínio da saúde;
3. Definir um método para construir a Tabela de probabilidade condicional a partir de casos clínicos e literatura científica sobre o tema em questão;
4. Validar o método proposto (por meio de ontologia) para suporte à decisão.
1.3. ESTRUTURA DA DISSERTAÇÃO
O presente documento apresenta seis capítulos. O primeiro apresenta a introdução com:
contextualização, motivação e os objetivos deste trabalho. Os próximos capítulos estão descritos a seguir. O Capítulo 2 apresenta a fundamentação teórica relatando os principais conteúdos que serviram de base na construção do trabalho. O Capítulo 3 apresenta os trabalhos relacionados, que divididos em duas subseções: Redes Bayesianas na área da saúde e Ontologia com redes Bayesianas. Já o Capítulo 4 apresenta em detalhes a metodologia. O Capítulo 5 apresenta a aplicação da metodologia e analise dos resultados. Por fim, o Capítulo 6 apresenta as considerações finais da dissertação.
19
2. FUNDAMENTAÇÃO TEÓRICA
2.1. INFORMÁTICA EM SAÚDE
A Informática em Saúde é uma área em constante desenvolvimento e é constituída a partir da aplicação de novas Tecnologias de Informação e Comunicação (TIC) na área da saúde, possibilitando auxiliar profissionais da saúde. Atualmente apontado com um domínio que poderá contribuir positivamente, quando bem conduzida para auxiliar os profissionais no processo de suporte à decisão clínico (ROCHA, 2007).
Se tornando um dos assuntos mais crescentes, a informática em saúde pode proporcionar melhoria na modernização da prestação de cuidados de saúde, com consequente racionalização, através de uma melhor gestão da informação de saúde assim como dos recursos associados (ROCHA, 2007; BRASIL,2008).
A Ciências da Saúde, Ciências da Informação e a Ciências da Computação foram os componentes fundamentais para o surgimento de uma nova área de estudo, denominada
“Informática em Saúde” (Rocha, 2007). A aplicação de novas TIC no campo da saúde, visa otimizar a gestão da informação e consequentemente melhorar as tomadas de decisão, adequado e seguras (ROCHA, 2007).
A Informática em Saúde proporciona uma forma adequada de utilizar a TIC para auxiliar profissionais da saúde, como: permitindo a construção de sistema capaz de raciocinar sobre determinado conhecimento, dessa forma auxiliando no processo de diagnóstico, na prescrição, no tratamento e na monitorização; e até mesmo na administração, educação e investigação na área da saúde.
2.2. ONTOLOGIA
Ontologia é um termo originado da Filosofia, Ontologia estuda a natureza do “Ser” e a
“existência”. Na filosofia, Ontologia pretende esclarecer todas as coisas do mundo, estabelecendo sistematicamente sua linhagem conceitual. Segundo Blackburn (1997), o Dicionário Oxford de Filosofia descreve ontologia como o termo derivado da palavra grega que significa “ser”, mas usado desde o século XVII para denominar o ramo da metafísica que diz respeito àquilo que existe.
Já na Ciência da Computação, Ontologias são técnicas de Representação do Conhecimento que se referem a um conjunto de conceitos fundamentais e suas relações, que percebem como as pessoas compreendem um domínio e permitem a representação de tal
20 entendimento de modo formal, compreensível por humanos e computadores (ZLOT, OLIVEIRA e ROCHA, 2002).
Já Gruber (1993), apresenta uma definição simples e completa: “Uma ontologia é uma especificação formal e explícita de uma conceitualização compartilhada”. Borst e Borst (1997), adotam essa definição, e defini que “formal” significa legível para computadores;
“especificação explícita” diz respeito a conceitos, propriedades, relações, funções, restrições, axiomas, explicitamente definidos; “compartilhado” quer dizer conhecimento consensual; e
“conceitualização” diz respeito a um modelo abstrato de algum fenômeno do mundo real. Este trabalho adota a definição de Gruber (1993) sobre ontologia e Guarino (1998) no que diz respeito a classificação dos diversos tipos ontologia.
“[...] ontologia se refere a um artefato constituído por um vocabulário usado para descrever certa realidade, mais um conjunto de fatos explícitos e aceitos que dizem respeito ao sentido pretendido para as palavras do vocabulário. Este conjunto de fatos tem a forma da teoria da lógica de primeira ordem, onde as palavras do vocabulário aparecem como predicados unários ou binários.”
(GUARINO, 1995, p, 632).
Ontologias podem ser classificadas em diferentes tipos, de acordo com a abordagem como, por exemplo, quanto à sua função (Guarino, 1998):
● Domínio: Reutilizáveis no domínio fornecem vocabulários sobre conceitos, seus relacionamentos, sobre atividades e regras que os governam.
● Tarefa: Fornece um vocabulário sistematizado de termos, especificando tarefas que podem ou não estar no mesmo domínio.
● Gerais: Incluem um vocabulário relacionado a eventos, tempo, espaço, causalidade, comportamento e funções.
A seguir nas próximas subseções serão apresentados os principais aspectos no desenvolvimento de ontologia, como: o tipo de linguagem utilizada para desenvolvimento e a representatividade do conhecimento.
2.2.1. OWL – Ontology Web Language
A OWL (do Inglês Ontology Web Language) é a linguagem para definição de ontologias da Web e é utilizada para o desenvolvimento de aplicações baseadas na Web Semântica (ISOTANI et al., 2015). Um dos pontos principais de ontologia OWL é o formalismo do domínio, definindo
21 conceitos como classe e propriedade destas classes, também definindo indivíduos e afirmações sobre eles.
McGuinness et al. (2004), apresentam na documentação do World Wide Web Consortium (W3C)1 três sublinguagens incrementais da OWL, são:
• OWL Lite: é uma sublinguagem da OWL DL que se utiliza de certas particularidades da linguagem OWL, nas quais apresentam limitações comparados com as OWL DL e OWL Full.
• OWL DL: Esta sublinguagem proporciona uma máxima expressividade, com integridade e decidibilidade computacional. A mesma integra todas as construções da linguagem OWL, nos quais essas construções podem ser utilizadas a partir de certas restrições. A sigla DL possui correspondência com a lógica descritiva no inglês (description logics).
• OWL Full: Representa uma máxima expressividade e independência sintática do modelo RDF (do inglês Resource Description Framework). As OWL Full e DL suportam o mesmo conjunto de construção da linguagem OWL, apesar de existirem certas restrições um pouco distintas. Na OWL DL as restrições são sobre o a utilização do RDF e é necessária a especificidade sobre a disjunção de classe, propriedade, indivíduos e valores de dados. Já OWL Full permite a combinação da OWL com Resource Description Framework (RDF) e não requer as especificações de conceitos.
Nas subseções a seguir é apresentado uma breve discussão sobre a representatividade do conhecimento a partir do modelo RDF.
2.2.2. Modelo RDF - Resource Description Framework
O Resource Description Framework (RDF), desenvolvido pelo W3C, constitui-se em uma arquitetura genérica de metadados2 que permite representar e codificar intercâmbios, e o reuso de metadados de forma estruturada. Esta infraestrutura permite a interoperabilidade de metadados por meio da concepção de mecanismos que suportam convenções comuns de semântica, de sintaxe e de estrutura (MILLER, 1995).
O RDF registra e intercambia esses grafos, a partir da sintaxe Extensible Markup Language (XML), estas são processáveis por máquinas e, utilizando Uniform Resource
1 https://www.w3.org
2 Metadados são dados sobre outros dados. Estes podem dizer do que se trata o tipo ou informação do dado, geralmente uma informação inteligível por um computador. Eles facilitam o entendimento dos relacionamentos e a utilidade das informações dos dados.
22 Identifier (URIs), possibilita ligar pedaços de informações através da Web. As URIs em RDF podem se referir a qualquer coisa identificável, incluindo objetos que não podem ser recuperados diretamente na Web (LIMA e CARVALHO, 2005).
O modelo RDF baseia-se no princípio de que cada objeto descrito dispõe de uma propriedade que apresenta valores e que recursos são descritos através de declarações (MILLER, 1995). Ainda, o RDF possui uma terminologia própria na descrição das partes de uma declaração. O RDF é composto por triplas de sentenças, onde estas são compostas por um recurso (URI - uma página na Web, por exemplo), propriedade (metadado / o criador de uma página Web, por exemplo) e valor (valor do metadado) conforme apresentado na Figura 1.
Figura 1 - Triplas RDF.
Fonte: Adaptado de Lima e Carvalho (2005).
O RDF é adequado para expressar declarações a respeito de recursos, de forma a facilitar o processamento automatizado por máquinas. Miller (1995), relata que este processamento automatizado requer: um sistema que identifique o recurso, a propriedade e/ou o valor em uma declaração sem ambiguidade; e uma linguagem que possa representar estas descrições facilitando o intercâmbio de informações entre máquinas. Esses dois aspectos já são representados pela arquitetura Web.
Uniform Resource Locator (URL) é uma forma de identificação de uma sequência de caracteres que caracteriza a localização de uma página Web. Já na Web Semântica Berners-lee, Hendler e Lassila (2001), essa identificação é realizada a partir do URI (Recursos), estes podem ser utilizados para identificar objetos. Os URIs podem ser utilizados para qualquer aplicação que precise ser referenciada em uma declaração, não apenas a recursos com endereços na Web.
O RDF utiliza URIs como forma de identificação de sujeitos (Recurso), predicados (Propriedade) e objetos (Valores) em declarações, ou seja, o RDF usa referências URIs com um identificador de fragmento opcional no final. O exemplo adaptado de Lima e Carvalho (2005), a referência URI http://www.exemplo.org/index.html#dissertação1 compõe-se do URI
23 http://www.exemplo.org/index.html e do identificador de fragmento dissertação1, é separado pelo caráter “#”.
Segundo Lima e Carvalho (2005), para representar as declarações RDF de forma que possam ser mais facilmente processadas por máquinas, se usa a XML e na representação de informações RDF e para o intercâmbio entre máquinas, pode ser usada uma linguagem de marcação XML específica chamada de RDF/XML. Na Subseção 2.2.3, a seguir, será apresentado uma breve discussão sobre a representatividade do conhecimento no grafo RDF.
2.2.3. Grafo RDF
Grafo direcionado, orientado e dirigido são denominações dadas a uma representação gráfica de um documento RDF. Tais grafos são estruturados em um conjunto de nós (vértices) que estão ligados por arestas (setas) direcionadas. Os nós e as arestas são rotulados com identificadores que os distinguem conforme o padrão RDF. A Figura 2 ilustra um modelo de grafo RDF com apenas dois nós e uma aresta.
Figura 2 - Grafo RDF com representatividade de um trabalho de dissertação.
Fonte: Adaptado de GRAHAM (2004).
O grafo RDF apresenta a informação em forma de um grafo. O RDF descreve os relacionamentos genéricos entre recursos de um domínio, criando declarações acerca de tais recursos (FURGERI, 2006; HITZLER, KROTZSCH e RUDOLPH, 2009).
A Figura 2 ilustra um grafo que expressa um trabalho de dissertação, representado pelo vértice dissertação1 onde o trabalho possui uma estrutura que é representada pela aresta Estrutura que liga a outro recurso chamado de Capítulos. Nota que o relacionamento entre a
24 dissertação1 e o Capítulos é uma informação que não pertence a um relacionamento do tipo hierárquico entre os recursos dissertação1 e Capítulos. Assim, o modelo de dados RDF considera estas relações como blocos básicos de informações.
Desse modo, o RDF elimina o problema da representação de informação em forma de árvore, criando uma estrutura mais flexível em forma de grafos, possibilitando a formação de uma cadeia de informações e estabelecendo uma rede de conhecimento (FURGERI, 2006).
2.3. SISTEMA DE SUPORTE À DECISÃO CLÍNICA
Sistema de Suporte à Decisão Clínica (SSDC) é qualquer sistema projetado para ajudar profissionais de saúde na tomada de decisão. Tais sistemas têm sido alvo de estudos durante as últimas décadas na área de Informática em Saúde (MUSEN, MIDDLETON e GREENES, 2014). O aumento progressivo da quantidade de dados, informações e conhecimento necessários para a prática médica é o principal motivo para o desenvolvimento de SSDCs (DENEKAMP, 2007).
A expectativa é que os SSDCs diminuam a distância entre as evidências e a prática clínica, ao disponibilizar dados relevantes e conhecimento. Os SSDCs existem há muitos anos, porém seu conceito não é nitidamente claro. Alguns acreditam que um SSDC seja um sistema que se relaciona com uma base de dados, auxiliando o usuário na tomada de decisão, indicando uma boa alternativa. Outros acreditam que um SSDC seja qualquer sistema que possa contribuir no processo decisório (BORDOLOI, ISLAM, 2012; CHAO et al., 2014; CHAO, MODY, 2015;
BINDER et al., 1999).
Apesar destas divergências, análises demonstram que estes sistemas possuem as características abaixo:
• Auxiliam na resolução de problemas menos estruturados ou semiestruturados e mais complexos;
• Devem ser facilmente adaptáveis às mudanças do processo decisório;
• Fornecem meios de distribuição eficientes e rápidos para a implementação do resultado obtido.
Segundo Sim et al. (2001), os SSDCs são sistemas que ajudam na análise de informações do negócio, onde sua meta é ajudar a administrar, definir tendências, apontar problemas e tomar decisões inteligentes. Podemos citar algumas características:
• Os SSDC tendem a ser voltados para problemas bem menos estruturados e menos especificados com os quais os gerentes de alto nível se deparam;
25
• Tentam combinar o uso de modelos ou técnicas analíticas a funções tradicionais de acesso e recuperação de informações;
• Concentram-se especificamente em recursos que facilitem seu uso para pessoal não especializado em computação de forma interativa;
• Enfatizam a flexibilidade e adaptabilidade de acomodar mudanças no ambiente e na abordagem à tomada de decisões pelo usuário.
2.4. DOENÇA RENAL CRÔNICA (DRC)
A Doença Renal Crônica (DRC) é considerada um grande problema de saúde pública, por suas elevadas taxas de morbidade e mortalidade e, além de que, tem impacto negativo sobre a qualidade de vida relacionada à saúde. Segundo a Sociedade Brasileira de Nefrologia, em Brasil (2014), foram aprovadas algumas definições da Doença Renal Crônica (DRC) proposta pela Kidney Disease Outcomes Quality Initiative (KDIGO). Estas definições seguem os seguintes critérios (KDIGO, 2012; KIRSZTAJN et al., 2014):
I. Lesão presente por um período igual ou superior a três meses, definida por anormalidades estruturais ou funcionais do rim, com ou sem diminuição da Taxa Filtração Glomerular (TFG), evidenciada por anormalidades histopatológicas ou de marcadores de lesão renal, incluindo alterações sanguíneas ou urinárias, ou ainda de exames de imagem;
II. FG <60 mL/min/1,73 m² por um período igual ou superior a três meses com ou sem lesão renal. A DRC é definida pela lesão do parênquima renal (com função renal normal) e/ou pela diminuição funcional renal presente por um período igual ou superior a três meses (KDIGO, 2012; KIRSZTAJN et al., 2014).
2.4.1. Grupos de Risco para DRC
Segundo Brasil (2014), DRC é um termo geral para alterações heterogêneas que afetam tanto a estrutura, quanto a função renal, com múltiplos fatores de prognóstico. Por isso, alguns pacientes apresentam suscetibilidade aumentada para DRC e são considerados grupos de risco (BRASIL, 2014). São eles:
I. Pessoas com Diabetes (tipo 1 ou tipo 2): O diagnóstico do diabetes deve ser realizado de acordo com o nível de sérico de glicemia de jejum acima de 126 mg/dL, ou acima
26 de 200 mg/dL 2 horas após a ingestão de 75g de glicose, ou qualquer valor de hiperglicemia, na presença de sintomas clássicos, como poliúria, polidipsia e polifagia;
II. Pessoas Hipertensas: Valores da pressão arterial acima de 140/90 mmHg em duas medidas com um intervalo de 1 a 2 semanas;
III. Idosos;
IV. Pacientes com doença cardiovascular: a DRC é considerada fator de risco para doença cardiovascular e estudo recente demonstrou que a doença cardiovascular se associa independentemente com diminuição da TFG e com a ocorrência da DRC;
V. Familiares de pacientes portadores de DRC;
VI. Pacientes em uso de medicações nefrotóxicas;
VII. Portadores de obesidade (IMC >30 kg/m²);
VIII. Tabagismo.
2.4.2. Diagnóstico da DRC
Uma das melhores medidas do funcionamento renal em indivíduos normais ou pacientes com DRC são a Taxa de Filtração Glomerular (TFG), Relação Albuminúria Creatininúria (RAC), Exame Sumário de Urina (ESU) e um exame de imagem (ultrassonografia dos rins e vias urinárias) (BRASIL, 2014). Segundo Brasil (2014), deve se ter os seguintes cuidados na avaliação do diagnóstico da DRC:
I. Avaliação da TFG: Para a avaliação da TFG, deve-se evitar o uso da depuração de creatinina medida através da coleta de urina de 24 horas, pelo potencial de erro de coleta, além dos inconvenientes da coleta temporal. Deve-se, portanto, utilizar fórmulas baseadas na creatinina sérica, para estimar a TFG;
II. Alterações parenquimatosas - Exame de urina: as alterações parenquimatosas devem ser pesquisadas através do exame Sumário de Urina (EAS) ou da pesquisa de albuminúria, que é a presença de albumina na urina. O EAS deve ser feito para todos os pacientes sob o risco de DRC;
III. Avaliação de imagem: deve ser feita para indivíduos com história de DRC familiar, infecção urinária de repetição e doenças urológicas. O exame de imagem preferido é a ultrassonografia dos rins e vias urinárias.
Existem variações de níveis da TFG com idade, sexo, e massa muscular. A TFG diminui de acordo com a idade (KIRSZTAJN et al., 2014). TFG menor que 60 mL/min/1,73m² representa
27 diminuição de cerca de 50% da função renal normal e, abaixo deste nível, aumenta a prevalência das complicações da DRC (KIRSZTAJN et al., 2014). A DRC pode ser vista em 05 (cinco) graus baseados na TFG e na classificação da albuminúria persistente, como pode ser observado na Figura 3.
Figura 3 - Prognóstico da DRC por TFG e de classificação de Albuminúria.
Fonte: Adaptado do KDIGO (2012).
O tratamento dos pacientes com DRC, bem como para estimativa de prognóstico, é necessário que, após o diagnóstico, todos os pacientes sejam classificados, de acordo com a Figura 3. Levando as principais considerações, essas classificações são de extrema importância com o prognóstico dos principais desfechos da DRC: doença cardiovascular, evolução para
Terapia Renal Substitutiva (TRS) e mortalidade.
De acordo com Brasil (2014), do primeiro ao terceiro estágio o tratamento deve ser classificado com conservador, que consiste basicamente no controle dos fatores de risco para a progressão da doença. Já o quarto e quinto estágio é baseado no tratamento pré-dialítico, consiste basicamente na manutenção do tratamento conservador, é realizado no paciente que esteja no quarto estágio da DRC. A TRS é o tratamento que consiste na substituição da função renal, o mesmo pode ser realizado com hemodiálise, diálise peritoneal e transplante renal. Esse tratamento é aplicado a pacientes no último estágio da DRC (KDIGO,2012; BRASIL, 2014;
KIRSZTAJN et al., 2014).
2.5. REDES BAYESIANAS
Ao longo do tempo vêm sendo estudadas formas de tratar informações incertas e incompletas, um desses estudos se deu a partir das pesquisas de Thomas Bayes, matemático inglês imortalizado por formular um importante teorema de probabilidade (LOGAN e
28 WOLESENSKY, 2009). Esse teorema era capaz de calcular a probabilidade condicional e as suas inversas. Thomas Bayes tornou-se um dos grandes propulsores no trabalho com raciocínio probabilístico.
Em meados dos anos 80 e 90 as Redes Bayesianas (RBs) foram desenvolvidas, com o intuito de facilitar as tarefas de predições em diversas áreas (Pearl, 1988). A partir da década de 90 se intensificou as pesquisas sobre RB, passando a ser introduzidas como um formalismo para representar e raciocinar sobre problemas envolvendo incerteza, adotando a teoria da probabilidade como uma estrutura básica (LUCAS et al. 2000). Desde então, as RBs estão sendo inseridas em diversas áreas a fim de solucionar problemas, como na saúde e economia, como cita (MARQUES e DUTRA, 2002).
2.5.1. Teoria de Probabilidade
A incerteza calculada em RB baseia-se na teoria de probabilidade. Desse modo, as noções de probabilidade desempenham um papel importante e, em particular, a probabilidade condicional. Nesta seção, serão apresentados alguns conceitos básicos e axiomas que envolvem a teoria da probabilidade Bayesiana.
Por definição, um experimento é aleatório se, ao ser repetido nas mesmas condições, é impossível prever antecipadamente o resultado. Em contrapartida, um experimento é determinístico se, quando repetido nas mesmas condições, conduz ao mesmo resultado (SOUZA, 2004). Denomina-se espaço amostral o conjunto de todos os resultados possíveis de um experimento aleatório, e o denotamos por Ω. Um subconjunto A ⸦ Ω é chamado evento.
2.5.2. Probabilidade Condicional
A probabilidade condicional se dá a partir do interesse de calcular a probabilidade de um evento, sabido que um determinando evento já ocorreu e possivelmente relacionado ao evento anterior (SOUZA, 2004). Pode se denotar da seguinte forma, P (A|B) à probabilidade de ocorrência do evento A, sabendo que o evento B ocorreu, ou simplesmente, a probabilidade de A dado B. Onde, temos:
𝑃 (𝐴|𝐵) =
𝑃 (𝐴∩𝐵)𝑃 (𝐵) (2.1)
2.5.3. Probabilidade Total
29 Seja 𝑩𝟏, 𝑩𝟐, … , 𝑩𝒏 uma partição do espaço amostral Ω em eventos de probabilidade, isto é, esses eventos são dois a dois disjuntos, Ω = ⋃𝒏𝒊=𝟏𝑩𝒊 e P(B) > 0 para todo i. Então, para qualquer evento A,
𝑃 (𝐴) = ∑
𝑛𝑖=1𝑃 (𝐴|𝐵
𝑖)𝑃(𝐵
𝑖)
(2.2)2.5.4. Teorema De Bayes
O teorema de Bayes calcula a probabilidade inversa, a partir da seguinte formula apresentada equação (2.3).
𝑃 (𝐻|𝑒) =
𝑃 (𝑒|𝐻) 𝑃 (𝐻)𝑃 (𝑒) (2.3) Onde que:
• P (H) é a probabilidade a priori do evento H;
• P (e|H) é a verossimilhança relativa dada à evidência (e) e dado a hipótese do evento H;
• P (e) é um fator de normalização (probabilidade a priori do evento e);
• P (H|e) é a probabilidade a posteriori do evento H conhecida à evidência e (SOUZA, 2004).
2.5.5. Construção da Redes Bayesianas
As Redes Bayesianas são grafos acíclicos direcionados, onde os nós representam variáveis de determinado domínio e os arcos representam a dependência condicional entre as variáveis. Os arcos direcionados representam as relações de causas e consequências entre as variáveis do domínio, ou seja, A é um nó que está direcionado em B, assim assume-se que o nó A representa uma causa de B, onde A é um nó pai de B; e onde B é um nó filho de A. Para representar a dependência, são utilizadas probabilidades associadas em todos os nós pais-filhos na rede (Pearl, 1988). A seguir na Figura 4 é apresentada uma estrutura básica de uma RB.
30
Fonte: Autoria própria.
Na Figura 4 o nó 𝑥1 (nó pai) representa semanticamente uma causa dos nós 𝑥2, 𝑥3,. . . , 𝑥𝑛 (filhos).
As RBs também são conhecidas com modelos probabilísticos, e apresentam três vantagens para modelar determinado conhecimento:
I. A representação gráfica das relações causais entre os nós;
II. Associada ao grafo existe uma distribuição de probabilidades;
III. Cada nó possui uma tabela de probabilidade que indica as probabilidades de o evento acontecer.
Dessa forma, pode-se obter a distribuição de probabilidade da RB calculada a partir das probabilidades condicionais, onde temos:
𝑃 (𝑥1, 𝑥2,… , 𝑥𝑛) = ∏𝑛𝑖=1𝑃(𝑥1| 𝑃(𝑋𝐼)), 𝑝𝑎𝑟𝑎 0 ≥ 𝑖 ≥ 𝑛 (2.4)
onde 𝑃 (𝑥1, 𝑥2,. . . , 𝑥𝑛) é a probabilidade conjunta da rede, 𝑃 (𝑋𝑖) são os nós pais de 𝑋𝑖 e 𝑃 (𝑥𝑖| 𝑃(𝑋𝑖)) são as probabilidades condicionais de 𝑋𝑖 em relação aos seus pais. A probabilidade condicional se dá a partir do interesse de calcular a probabilidade de um evento, sabido que determinado evento já ocorreu e possivelmente relacionado ao evento anterior.
As probabilidades podem ser obtidas da seguinte forma: (I) Através de observação e frequências relativas de um evento, onde é necessário tempo suficiente para calcular as probabilidades dos eventos acontecerem, observando a proporção entre o total de observação e o número de vezes em que determinado evento foi observado (Neapolitan e Jiang, 2010); (II) Grau de confiança, que é a crença que um indivíduo tem de que certo evento pode acontecer (Norvig e Russell, 2014). Essa técnica é bastante utilizada em casos de probabilidades fornecidas por especialistas onde os eventos não podem ser observados.
Figura 4 - Estrutura básica de uma Rede Bayesiana.
31 A partir das probabilidades pode-se obter a Tabela de probabilidade dos nós. A Tabela de probabilidade pode ser definida da seguinte forma. Na ocorrência de uma ou mais relações causais de um nó para outro nó, ou seja, caso exista a dependência entre os nós, a Tabela de probabilidades definirá as probabilidades condicionais associadas ao evento, passando a se chamar de Tabela de Probabilidade Condicional (TPC) de cada nó.
A TPC pode ser um processo bastante complexo, devido a sua grande capacidade de ter um elevado número de entrada, ainda que os nós possuam uma quantidade pequena de nós pais.
A adição de valores na TPC é um procedimento que requer bastante experiência, caso a relação entre nós pais e nós filhos seja completamente arbitrária (Norvig e Russell, 2014). Por outro lado, pode-se definir a Tabela de probabilidades a partir das probabilidades a priori. Isto só ocorre quando não existe nenhum tipo de dependência entre as relações de causas do nó, sendo denominada Tabela de Probabilidade Prévia (TPP).
A construção de uma RB requer uma série de cuidados para que a TPC apresente uma boa representação do problema. Um dos métodos utilizado na construção é a equação (2.1).
Segundo Norvig e Russell, (2014), um processo geral para construção da RB, consiste de:
I. Um conjunto de variáveis que descrevem o domínio.
II. Uma ordem para as variáveis, ou seja, um conjunto de arcos ligando as variáveis. Onde cada variável possui um conjunto limitado de estados mutuamente exclusivos. As variáveis e arcos formam um Grafo Dirigido sem Ciclos (GDC).
III. Na existência de variáveis:
a. Escolha uma variável e adicione um nó na rede.
b. Determine os nós pais dentre os nós que já estejam na rede e que satisfaçam a equação (3.4).
c. Defina a Tabela de Probabilidade Condicional.
Para garantir que o grafo sempre será acíclico cada nó é conectado aos nós mais antigos na rede.
2.5.6. Independência
Um nó em uma RB possui independência condicional e/ou absoluta em relação aos seus predecessores na rede dado o nó pai. A independência de um nó é um componente importante na construção de RBs devido à quantidade de eventos, ocasionando na necessidade de construir uma tabela de probabilidade, onde a mesma apresenta todos os possíveis eventos atômicos de
32 determinado domínio que está sendo observado, esse método é chamado de Distribuição Conjunta Total (MARQUES e DUTRA, 2002).
A distribuição conjunta lista todas as probabilidades possíveis com base na listagem, onde são identificadas as probabilidades condicionais existentes no domínio, assim como os relacionamentos de independência. O grande crescimento exponencial da tabela em relação ao número de eventos ou variáveis distintas de um dado domínio acaba se tornando um grande problema.
Por outro lado, para que possamos utilizar algum método de inferência na rede é necessário dizer mais a respeito das relações entre os nós de uma rede. Por exemplo, saber se um conjunto de nós X é independente de outro conjunto Y, dado que um conjunto de evidências E, isto é, saber se X é d-separado de Y. Analisando todos os caminhos não dirigidos entre um nó em X e um nó em Y é d-separado por E, então X e Y são condicionalmente independente dada à evidência E. Um conjunto de nós E d-separa dois conjuntos de nós X e Y, se todo o caminho não dirigido de um nó em X para um nó em Y é bloqueado dado E (NORVIG e RUSSELL, 2014).
2.5.7. Inferência em Rede Bayesiana
A inferência probabilística computa a distribuição de probabilidades posterior para um conjunto de variáveis de consulta, dado um conjunto de evidência, podemos observar da seguinte forma: o sistema computa P(Consulta|Evidência). Segundo Marque e Dutra (2002), inferências podem ser realizadas sobre RBs para:
• Diagnósticos: Dos efeitos para as causas. Dado X, P (Y|X);
• Causas: De causas para efeitos. Dado Y, P (X|Y);
• Inter Causais: Entre causas de um efeito comum. Dado Z, P (Y|Z) e dado W, P (Y|Z,W);
• Mistas: combinação de dois ou mais tipos descritos acima.
As RBs podem ser utilizadas para outros fins, além de consultas a partir de evidências, como (MARQUE e DUTRA, 2002):
• Tomar decisões baseadas em probabilidades;
• Decidir quais evidências adicionais deve ser observada a fim de se obter informações úteis do sistema;
• Analisar o sistema a fim de buscar os aspectos do modelo que possuem maior impacto sobre as variáveis de consulta;
33
• Explicar os resultados de uma inferência probabilística ao usuário.
2.5.8. Aprendizagem Bayesiana
O objetivo central do aprendizado Bayesiano é a obtenção de probabilidade, a estrutura da rede ou ambos. Este também pode ser visto como um processo que gera uma representação interna das restrições que definem um dado problema de modo a facilitar a recuperação dos dados, gerando assim, o menor esforço computacional possível para este tipo de representação (Pearl, 1988).
Na aprendizagem Bayesiana, a obtenção de probabilidade tem como objetivo "aprender" as distribuições de probabilidades da rede e identificar sua estrutura, ou seja, identificar as relações de interdependência dadas pelos arcos. Castillo, Gutierrez e Hadi (2012) divide esse processo de aprendizagem em "aprendizagem da estrutura "e "aprendizagem dos parâmetros numéricos", onde:
• Aprendizagem da estrutura: refere-se a alguns aspectos relacionados à estrutura do conhecimento como: regras, distribuição de probabilidade, por exemplo, a descoberta de novas causas ou efeitos de uma doença, ou a inclusão de novas regras na base do conhecimento.
• Aprendizagem dos parâmetros: refere-se a estimar os parâmetros necessários para construir a base do conhecimento, por exemplo, a estimação de frequências ou probabilidades associadas a sintomas ou doenças.
Conforme o conhecimento que se tem em relação aos dados, os métodos de aprendizagem podem variar. Tanto como a aprendizagem da estrutura quanto a aprendizagem dos parâmetros pode ser aprendida através de um especialista, responsável por definir e/ou supervisionar a construção da rede baseado no seu conhecimento. Já a aprendizagem intuitiva utiliza o auxílio de um banco de dados, e partir deste, a rede é construído.
Em redes Bayesianas para auxílio à decisão médica, o principal obstáculo em utilizar o aprendizado é a dificuldade na obtenção da base de dados, pois a coleta de dados que possam auxiliar a construção de sistemas especialistas não é uma prática comum no atendimento médico.
2.6. CONCLUSÃO
34 Neste capítulo, foram apresentados os principais conceitos para construção da metodologia apresentada neste trabalho. Uns dos principais conceitos descritos foram o de Redes Bayesianas, que é o grande propulsor na construção desta dissertação, para tratamento do informações incompleta e inconsistente.
Neste trabalho, foi construída uma rede Bayesiana a partir da metodologia para atuar como sistema de auxílio à decisão clínica, a partir de uma ontologia de domínio da Saúde utilizando o conhecimento gerado e modelado em grafo RDF. Os motivos que levaram a escolha da técnica de RBs foram os seguintes:
• Tratar as incertezas presentes em ontologia. Uma vez que, as especificações determinísticas dos indivíduos dentro da ontologia fazem de todo o modelo um ambiente determinístico;
• Construir um sistema de suporte à decisão clínica baseado no conhecimento existente na ontologia;
• O tratamento de informações incompletas, onde muitas das vezes existem condições em que não se tem certeza sobre o diagnóstico correto ou sobre a melhor forma de tratamento para determinada doença;
• A partir de uma especificação probabilística de indivíduos significa, que um modelo probabilístico é capaz de representar a incerteza em casos práticos;
• Uma vez que a topologia da rede é construída, possibilita a apresentação da representatividade das relações de causas e efeitos. Podendo facilitar o olhar intuitivo do especialista em determinado problema.
35
3. TRABALHOS RELACIONADOS
O presente capítulo aborda os principais trabalhos utilizados na construção desta pesquisa. O mesmo está dividido em duas áreas de interesses analisadas no desenvolvimento do estudo, Redes Bayesianas na saúde e ontologia em conjunto com Redes Bayesianas.
3.1. REDES BAYESIANAS EM SAÚDE
3.1.1. Uso de Redes Bayesianas Aplicadas à Área Da Saúde
O trabalho de Seixas et al. (2014), propõe um modelo de decisão Bayesiana para auxiliar no diagnóstico da doença de Alzheimer, especificamente na Demência, Doença de Alzheimer (DA) e Comprometimento Cognitivo Leve (CCL). Para construção e estruturação da RB foram adotados critérios baseados no diagnóstico e nas entradas de informações médicas realizadas por especialistas. A partir de algoritmos de aprendizagem supervisionada, os autores estimaram os parâmetros da RB em um conjunto de dados clínicos reais de pacientes do CERAD (Consortium to Establish a Registry for Alzheimers Disease), do Duke University Medical Center (Washington, EUA) e CAD (Centro para a doença de Alzheimer e Doenças relacionadas) da Universidade Federal do Rio de Janeiro.
Segundo os autores foi construída uma RB para Demência, DA e CCL. Para tal obtenção de informações do conjunto de dados (CERAD), os autores testaram de modos comparativos alguns algoritmos, como: Redes Neurais Artificiais (RNA), Regressão Logística, Naive Bayes, Árvore de Decisão, Decision Stump e J48. Os testes foram realizados na ferramenta de mineração de dados Weka3, no intuito de avaliar e comparar a medida de desempenho de cada rede gerada. Como resultado obtido a partir das comparações entre os métodos, as redes Demência, DA, CCL obtiveram um bom desempenho com relação aos demais algoritmos analisados, chegando a atingir um percentual de 0,97 % dos dados testados com o algoritmo Bayesiano (Naive Bayes).
O modelo de decisão proposto por Seixas et al. (2014), utilizou uma abordagem probabilística, em que os sintomas, sinais, os resultados dos testes e as informações do conjunto de dados estão associados às variáveis aleatórias ligadas umas às outras, dando origem a um diagrama de causalidade. Neste trabalho, a estruturação da RB foi construída manualmente,
3 Weka - Ferramenta para utilização de aplicação de técnicas de mineração de dados, desenvolvida em java pela Universidade de Waikato, Nova Zelândia. Link: https://www.cs.waikato.ac.nz/ml/weka/
36 tornando o entendimento para os especialistas de domínio (médicos) mais simples e legível. Na proposta de Sesen et al. (2013), eles apresentam uma avaliação de viabilidade da RB a partir de um conjunto de informação, com o intuito de fornecer uma estimativa de sobreviventes durante o período de um ano, desde a última atualização médica de pacientes com câncer pulmonar no ano de 2010. Para realizar essa estimativa, foi utilizada a base de dados LUCADA, que é um conjunto de informação médica criada pela National Lung Cancer Audit (NLCA) e a Universidade de Oxford. Segundo os autores, o conjunto de informação possuía dados de cerca de 126.987 pacientes, onde foi preciso a realização de pré-processamento dos dados, selecionando pacientes com Câncer de Pulmão de Células Não-Pequenas (CPCNP) e Câncer do Pulmão de Pequenas Células (CPPC), e removendo os pacientes que não possuíam a determinada patologia. Resultando em cerca de 117.426 pacientes com câncer pulmonar.
Após o pré-processamento do conjunto de dados, foram aplicadas técnicas de Aprendizagem de Máquina (AM), utilizando as ferramentas Weka e Matlab4 para a implementação dos métodos Bayesianos. Para a mineração de dados, Sesen et al., (2013) usaram cerca de 11 algoritmos Bayesianos, chegando ao seguinte resultado: as estruturas aprendidas por Causal Minimum Message Length (CaMML) alcançaram pontuações Bayesianas comparáveis aos outros algoritmos de busca baseados em pontuação. Por fim, foram apresentados de forma manual e organizacional uma RB baseada nos resultados do algoritmo CaMML (SESEN et al., 2013).
Já Forsberg et al. (2011), utilizaram um conjunto de dados da Disease Management System (MSKCC) com o total de registros de 189 pacientes que se submeteram à cirurgia para tratar metástases esqueléticas entre 1999 e 2003. Em seguida, foi desenvolvido e treinado um modelo Bayesiano para estimar a sobrevivência de pacientes em meses usando as análises dos históricos dos pacientes. Foram feitas cerca de dez validações cruzadas, nas quais, após a validação, a área sob a Receiver Operating Characteristic (ROC), no português Característica de Operação do Receptor (COR), ou simplesmente curva ROC, foi de 0,85 (Inferred Causation – (IC) 95%: 0,80 – 0,93) para 3 meses de probabilidade de sobrevivência e 0,83 (IC 95%: 0,77 - 0,90) para 12 meses de probabilidade de sobrevivência. Por fim, foi desenvolvido um modelo Bayesiano com sucesso, usando os dados clínicos observados para estimar a sobrevivência individualizada em pacientes com metástases esqueléticas operáveis.
4 https://www.mathworks.com/products/matlab.html
37 No trabalho de Estabragh et al. (2013), a RB foi aplicada às predições e ao diagnóstico de ansiedade social em uma população não clínica de estudantes universitários. A RB foi construída manualmente com base no conhecimento do domínio usando alguns fatores cognitivo-comportamentais e a Tabela de Probabilidade Condicional (TPC), foram aprendidas usando o software Netica, a partir das informações presente no questionário realizado na pesquisa. Com base nos questionários, foi realizada uma série de validação do modelo, resultando em desempenho relatado entre 0,8 e 0,9 pela área sob a curva ROC. Da mesma forma, foram mostradas as influências de certas variáveis sobre a probabilidade de ansiedade social, assim indicaram nos resultados que este modelo pode ser uma ferramenta eficiente para cuidados médicos profissionais em diagnóstico de ansiedade social e vir a se tornar um apoio à tomada de decisão (ESTABRAGH et al., 2013).
Tabela 1. Tabela Comparativa de Técnicas Bayesianas Aplicadas à Área da Saúde.
Fonte: Autoria própria.
AUTOR DOENÇAS BASE DE DADOS MÉTODOS E MÉTRICAS ALGORITMOS
Seixas et al., 2014;
Alzheimer CERAD
Aprendizagem de máquina; Comparativos;
Construção de uma RB manualmente; Ferramenta:
WEKA e Matlab.
Redes Neurais Artificiais; Rede Bayesiana (Naive Bayes).
Sesen et al., 2013;
Câncer
Pulmonar LUCADA
Aprendizagem de máquina; Comparativos;
Construção de uma RB manualmente; Ferramenta:
WEKA e Matlab.
Regressão Logística; C4.5;
e 11 algoritmos Bayesianos.
Estabragh et al., 2013;
Ansiedade Questionário
Construção de uma RB manualmente; Ferramenta:
Netica.
Não especificado
Forsberg et al., 2011;
Metástases Esqueléticas
MSKCC
Comparativos; Análise Estatística Convencional;
Construção de uma RB manualmente;
Ferramentas: F. Analytcs
Não especificado