• Nenhum resultado encontrado

Modelo de apoio ao diagnóstico no domínio médico: aplicando raciocínio baseado em casos

N/A
N/A
Protected

Academic year: 2017

Share "Modelo de apoio ao diagnóstico no domínio médico: aplicando raciocínio baseado em casos"

Copied!
116
0
0

Texto

(1)

U

NI VERSI DADE

C

ATÓLI CA DE

B

RASÍ LI A

PROGRAMA DE PÓS-GRADUAÇÃO STRICTO SENSU EM GESTÃO DO CONHECIMENTO E GESTÃO DA TECNOLOGIA DA INFORMAÇÃO

Me s t r a d o

MODELO DE APOIO AO DIAGNÓSTICO NO DOMÍNIO

MÉDICO APLICANDO RACIOCÍNIO BASEADO EM CASOS

Autora: Renata de Paiva Silva

Orientador: Prof.

o

Dr.

o

Edilson Ferneda

Co-Orientadora: Prof.

a

Dr.

a

Lourdes Mattos Brasil

(2)

RENATA DE PAIVA SILVA

MODELO DE APOIO AO DIAGNÓSTICO NO DOMÍNIO MÉDICO

APLICANDO RACIOCÍNIO BASEADO EM CASOS

Dissertação apresentada ao Programa de Pós-Graduação Strictu Sensu em Gestão do Conhe-cimento e da Tecnologia da Informação, da Universidade Católica de Brasília, como requi-sito para obtenção do Título de Mestre em Gestão do Conhecimento e da Tecnologia da Informação.

Orientador: Prof.o Dr.o Edilson Ferneda

Co-Orientadora: Prof.ª Dr.ª Lourdes Mattos Brasil

(3)

Ficha elaborada pela Divisão de Processamento do Acervo do SIBI – UCB.

S586m Silva, Renata de Paiva.

Modelo de apoio ao diagnóstico no domínio médico: aplicando raciocí-nio baseado em casos / Renata de Paiva Silva ; orientador Edilson Ferneda, co-orientadora Lourdes Mattos Brasil – 2005.

xiv, 101 f. : il. ; 30 cm.

Dissertação (mestrado) – Universidade Católica de Brasília, 2005.

1 Medicina – processamento de dados. 2. Diagnóstico – estudo de ca-sos. 3. Raciocínio. 4. Sistemas de recuperação da informação. I. Ferneda, Edilson, orient. II. Brasil, Lourdes Mattos, co-orient. II. Título.

(4)

TERMO DE APROVAÇÃO

Dissertação defendida e aprovada como requisito parcial para obtenção do Título de Mestre em Gestão do Conhecimento e Tecnologia da Informação, defendida e aprovada, em 30 de junho de 2005, pela banca examinadora constituída por:

___________________________________________________ Orientador: Prof.o Dr

.

o Edilson Ferneda

___________________________________________________ Co-orientadora: Prof.a Dr

.

a Lourdes Mattos Brasil

__________________________________________________ Examinador externo: Prof.o Dr

.

o Agenor Martins

___________________________________________________ Examinador externo: Prof.o Dr

.

o Hervaldo Sampaio Carvalho

(5)

DEDICATÓRIA

A minha avó Elza, a minha mãe querida Rita, meus pais Rene e Dovenir (é um privilégio ter dois pais maravilhosos), a tia Tânia , meus irmãos Rick, Taty, Paty, Netinho, Juninho e

(6)

AGRADECIMENTOS

Agradeço ao meu orientador, profo. Edilson Ferneda pelo carinho, orientação, paciência, amizade, apoio e motivação no desenvolvimento deste trabalho.

Agradeço a minha co-orientadora profª. Lourdes Mattos Brasil pela amizade, incentivo, cari-nho, orientação, companhia e força durante todo o período de luta.

Agradeço a Universidade Baiana de Cardiologia, a profª. Khátia de Oliveira Marçal e Mari-ano Angel Montoni pelo banco de dados do SEC e a grande ajuda e atenção prestada.

Agradeço ao especialista de domínio Dr. Hervaldo Sampaio de Carvalho pela preciosa e

imprescindível colaboração.

Agradeço aos professores integrantes da banca examinadora pelas críticas construtivas e elogios recebidos.

Agradeço a Georgiane e a Janina pela atenção, carinho, cuidado e incentivo ao longo do mestrado.

Agradeço ao meu amigo e companheiro Norcleber pela força, atenção, confiança e os mo-mentos felizes que vivemos.

Agradeço ao meus sempre sogro e sogra do coração Norberto e a Marina pela força e

confi-ança mim.

Agradeço aos meus amigos: Adriana, Ana Paula,Chris Show, Gleydson, Marcos Alexandre, Marcos Francisco, Marlene, Mauro, Mônica, Ricardinho e Ricardo Polito pela ajuda,

cari-nho e força para vencer esta importante etapa da minha vida.

(7)

EPÍGRAFE

“ Não te dei a vida Mas, te fiz parte da minha

Não te dei os sonhos Mas, realizei os meus em ti Te mostrei o caminho Mas, você estabeleceu a meta Te dei um pouco de carinho Você fez a coisa certa Te chamei atenção Você jamais me disse um não Te apertei nos meus braços E só não me lembrei dos seus primeiros passos É certo, não os vi! Mas, contigo muito aprendi Não dizia a palavra que o momento exigia Mas, sabia manter o silêncio com sabedoria Não magoa quem te atravessa o caminho Se retrai mas, responde com o carinho Poucas vezes a vi chorar Tão poucas, que não me lembro consolar Se doando sempre a todos por inteiro Sem a preocupação se há exagero És um poço sem fundo de amor Felizes os que compartilham este calor Sua garra é uma das grandes virtudes Seu medo transformas em atitudes Levas a vida da forma exata Teu anjo é forte, Renata! Não te troco por nada nesta vida Minha preta querida! “

(8)

RESUMO

O processo de diagnóstico médico é bastante complexo, exigindo intuição, raciocínio, experi-ência, além da necessidade de análise de informações de fontes distintas. Portanto, várias são as técnicas computacionais utilizadas para auxiliar a tomada de decisão que os especialistas médicos usam para chegar a um determinado diagnóstico. Entre as técnicas computacionais voltadas para a retenção, recuperação e reutilização de conhecimento tácito está o Raciocínio Baseado em Casos (RBC). Na área médica, por exemplo, diversos são os relatos de sucesso em sua aplicação. RBC constitui uma tecnologia computacional, do campo da Inteligência Artificial, onde problemas atuais são resolvidos servindo-se de casos passados. Este trabalho foi desenvolvido no âmbito do Projeto Inteligência Artificial Aplicada na Modelagem e Im-plementação de um Consultório Virtual (IACVIRTUAL), com a colaboração do Grupo de Inteligência Artificial da UCB. Esse projeto busca construir um sistema baseado em conheci-mento que simule um consultório médico virtual via Web. A principal meta deste é atender (i)

pacientes interessados em acompanhar seu histórico médico, (ii) especialistas interessados num ambiente de apoio à decisão em diagnóstico e tratamento de seus pacientes e (iii) estu-dantes interessados na aprendizagem por meio do acompanhamento dos casos médicos dispo-níveis. Portanto, o objetivo deste trabalho é a concepção de um Sistema Inteligente baseado em RBC aplicado para auxiliar o diagnóstico médico no domínio da Cardiologia, no âmbito do projeto IACVIRTUAL. Nesse contexto, busca-se uma metodologia que descreve o ciclo RBC para apoiar o Engenheiro do Conhecimento na implementação de novas patologias ao sistema em questão.

(9)

ABSTRACT

The medical diagnosis is a very complex process that need of an information analysis of sev-eral sources. It’s also an one that involve feeling, reasoning and experience. Therefore, there are many computational techniques are used for helping to make medical decision by medical experts. Among the computational techniques used for the retaining, recuperation and reuse of the tacit knowledge is the Case-Based Reasoning (CBR). In the medical area, for example, there are many cases of success in the use of CBR. CBR is a computational technology, in the Artificial Intelligence area, where problems are decided using past cases of itself. This work was developed in the scope of the Artificial Intelligence Applied to the Modeling and Imple-mentation of a Virtual Medical Office Project (IACVIRTUAL), with the UCB Group of Arti-ficial Intelligence involvement. The proposed intelligent system was developed to simulate a Virtual Medical Office conceived to support (i) patients who are interested in following their medical reports, (ii) professionals interested in decision support systems for diagnosis and treatment and (iii) students interested in learning by following available medical cases. There-fore, the objective of this study is the conception of an Intelligent System based in applied CBR to assist the medical diagnosis in the domain of the Cardiology, in the scope of the IACVIRTUAL project. In this context, a methodology is being researched to describe the cycle of CBR to support the Engineer of the Knowledge in the implementation of new ill-nesses to the system in question.

Keywords: Systems Based on Knowledge, Case-Based Reasoning, Medical Diagnosis,

(10)

SUMÁRIO

1 INTRODUÇÃO ...1

1.1 Contextualização ...3

1.2 Objetivo Geral...4

1.3 Objetivos Específicos...4

1.4 Justificativa ...4

1.5 Estrutura do trabalho ...6

2 REFERENCIAL TEÓRICO...7

2.1 Domínio Médico ...8

2.2 Informática na Saúde ...10

2.3 Inteligência Artificial na Saúde...14

2.4 Sistemas Baseados em Conhecimento ...16

2.5 Raciocínio Baseado em Casos ...21

2.5.1 História do RBC ...22

2.5.2 Ciclo RBC ...25

2.5.3 Etapas de desenvolvimento de sistema RBC ...26

2.5.4 Quando Raciocínio Baseado em Casos é apropriado? ...38

2.5.5 Aplicações de RBC ...41

2.6 Prontuário Eletrônico do Paciente ...42

2.7 Projeto IACVIRTUAL...43

2.8 Gestão do Conhecimento Médico ...45

2.8.1 Gestão do Conhecimento ...45

2.8.2 O Conhecimento Médico ...51

2.9 Considerações Finais ...52

3 MODELO RBC PROPOSTO...54

3.1 Estrutura de Casos...55

3.2 Estrutura de Raciocínio ...57

3.2.1 Funções de Similaridade Global...57

3.2.2 Funções de Similaridade Local...58

3.2.3 Função de Recuperação de Casos ...59

3.3 Aquisição do Conhecimento ...60

3.4 Módulo Educacional ...61

3.5 Descoberta de Conhecimento...62

3.6 ConsideraçõesFinais ...64

4 EXTRAÇÃO DO CONHECIMENTO MÉDICO NO CONTEXTO DO CICLO DE RBC.65 4.1 Compreensão do Negócio ...67

4.2 Compreensão dos dados...68

4.3 Preparação dos Dados ...70

4.4 Modelagem...72

4.5 Avaliação ...72

(11)

4.7 Considerações finais ...74

5 ESTUDO DE CASO...75

5.1 Compreensão do Negócio ...76

5.2 Compreensão dos dados...77

5.3 Preparação dos Dados ...79

5.4 Modelagem...84

5.5 Avaliação ...84

5.6 Aplicação ...87

6 CONCLUSÕES E TRABALHOS FUTUROS ...88

(12)

LISTA DE FIGURAS

Figura 1 - Síntese das características dos sistemas no contexto de Sistemas Inteligentes ...16

Figura 2 - Arquitetura básica de um SE simbólico ...18

Figura 3 - Ciclo RBC ...26

Figura 4 - Exemplo de um Caso ...27

Figura 5 - Arquitetura IACVIRTUAL...45

Figura 6 - Os quatro processos de conversão do conhecimento ...47

Figura 7 - Modelo genérico de gestão do conhecimento ...48

Figura 8 - Visão geral do Modelo RBC no Projeto IACVIRTUAL ...55

Figura 9 - Modelo Geral da Estrutura de Casos ...56

Figura 10 - Estrutura do componente de Raciocínio ...57

Figura 11 - Processo de Descoberta de Conhecimento no Módulo RBC ...63

Figura 12 - Processo Cíclico de Descoberta de Conhecimento, segundo a metodologia CRISP-DM ...67

Figura 13 - Quadro de teste dicotômico ...73

Figura 14 - Tabelas da Base SEC que representam os sintomas / sinais do paciente...77

Figura 15 - Exemplificação do Cálculo de Similaridade Local apresentada ao especialista....81

(13)

LISTA DE TABELAS

Tabela 1 - Medidas de similaridade local ...32

Tabela 2 - Medidas de similaridade global ...33

Tabela 3 - Descrição da Base de Dados SEC ...78

Tabela 4 - Intervalos Criados para Pressão Sistólica ...79

Tabela 5 - Intervalos Criados para Pressão Distólica ...79

Tabela 6 - Intervalos criados para freqüência cardíaca ...80

Tabela 7 - Intervalos criados para a informação...80

Tabela 8 - Resultado da Classificação e Ponderação das Características...82

Tabela 9 - Ponderação dos sintomas/sinais ...83

Tabela 10 - Exemplos de algumas atualizações na estrutura de dados e raciocínio ...84

Tabela 11 - Resultado sintético do cálculo da sensibilidade e especificidade...86

(14)

LISTA DE ABREVIATURAS E SIGLAS

AC - Aquisição de Conhecimento

CRISP-DM - Cross-industry Standard Process for Data Mining

DAC - Doença Arterial Coronariana EC - Engenheiro do Conhecimento ECG - Eletrocardiograma

FN - Falso Negativo FP - Falso Positivo

HTML - Hypertext Markup Language (linguagem de marcação de hipertexto) IA - Inteligência Artificial

IACVIRTUAL - Projeto Inteligência Artificial Aplicada na Modelagem e Implementação de um Consultório Virtual

IAM - Infarto Agudo do Miorcádio

KDD - Knowledge Discovery in Databases (descoberta de conhecimento em bases de dados) PEP - Prontuário Eletrônico do Paciente

RBC - Raciocínio Baseado em Casos RC - Representação do Conhecimento RV - Realidade Virtual

SBC - Sistemas Baseado em Conhecimento SE - Sistemas Especialistas

SEC - Sistemas Especialistas em Cardiologia SEH - Sistema Especialista Híbrido

SI - Sistemas Inteligentes

(15)

UCB - Universidade Católica de Brasília UFPB - Universidade Federal da Paraíba UFRJ - Universidade Federal do Rio de Janeiro UnB - Universidade de Brasília

USP - Universidade de São Paulo VP - Verdadeiro Positivo

(16)
(17)

A Gestão do Conhecimento tem como um de seus preceitos a utilização efetiva de ex-periências adquiridas na mudança do ambiente organizacional. Dentre as diversas formas de se ter organizações baseadas na aprendizagem está a manutenção desse conhecimento na for-ma de ufor-ma base de problefor-mas e suas respectivas soluções, representados de tal forfor-ma que possibilite recuperação e reutilização na solução de novos problemas (MORESI, 2001).

Instrumentos computacionais vêm sendo propostos para melhorar o processo de recu-peração, reutilização e aprendizagem de conhecimentos tácitos para auxílio à tomada de deci-são. Raciocínio Baseado em Casos (RBC) constitui uma tecnologia computacional, do campo da Inteligência Artificial (IA), cujas aplicações estão cada vez mais diversificadas e testadas com sucesso em diversas áreas do conhecimento. Neste trabalho, interessa-se particularmente pela sua aplicação na área médica (TURBAN, 1997; KOLODNER, 1993; WANGENHEIM, 2003).

Na área de saúde, a gestão de conhecimento tem se mostrado ineficiente (SABBATI-NI, 2004). Os conhecimentos tácitos (experiências) de seus profissionais normalmente ficam retidos somente em suas mentes, não havendo um repasse satisfatório para a comunidade mé-dica, limitando, assim, a utilização destas experiências em pesquisas ou em diagnósticos para casos médicos correlatos.

Neste contexto, a Universidade Católica de Brasília (UCB), em parceria com diversas instituições nacionais e internacionais e algumas clínicas médicas do Brasil1, está desenvol-vendo o projeto Inteligência Artificial Aplicada na Modelagem e Implementação de um Con-sultório Virtual (IACVIRTUAL). Nele, busca-se a concepção de um sistema baseado em co-nhecimento que se propõe simular um consultório médico virtual (ALMEIDA, 2003a, 2003b, 2004a, 2004b).

(18)

1.1 Contextualização

A IA vem propondo modelos computacionais que permitem “descrever” o raciocínio humano em campos especializados. Entre tais modelos estão os Sistemas Especialistas (SE)

(WATTERMAN, 1986). Na Saúde, tais sistemas são considerados como uma segunda

opini-ão do conhecimento médico especializado. Por exemplo, o SE MYCIN (BUCHANAN, 1984), considerado um marco para a IA, foi desenvolvido para apoiar o diagnóstico de infecções bacterianas. Dentre as diversas formas de raciocínio emuladas e utilizadas amplamente pelos SE, inclusive pelo MYCIN, está o Raciocínio Baseado em Regras (WATTERMAN, 1986). Nesta forma de raciocínio seqüências lógicas são compostas por premissas (ou antecedentes) e conclusões (conseqüentes).

Além das regras, o processo de diagnóstico exige a intuição, raciocínio e experiência. Essa complexidade na decisão médica decorre (SABBATINI, 2004; SHORTLIFFE, 1990) (i)

da dependência do diagnóstico médico em relação a uma análise de dados e informações de diversas fontes de naturezas muito diferentes, (ii) do desconhecimento sobre o processo men-tal envolvido no raciocínio para se chegar a um diagnóstico e (iii) da falta de padronização quanto aos termos e definições médicas. O RBC fornece uma abordagem diferente de resolu-ção de problemas: no lugar de contar apenas com o conhecimento geral do domínio do pro-blema (conhecimento explícito), é capaz de usar um conhecimento específico previamente experimentado (conhecimento tácito). Um sistema de RBC pode utilizar casos para oferecer explicações para sintomas e também alertar sobre explicações que se mostraram erradas no passado (KOLODNER, 1993).

(19)

(memó-ria), mas também nas suas etapas de desenvolvimento.

O modelo mais aceito para o processo de RBC é o Ciclo de RBC proposto por Aa-mondt e Plaza (AAMODT, 1994), que engloba um ciclo de raciocínio contínuo composto por quatro tarefas principais: (i) recuperação, (ii) reutilização, (iii) revisão e (iv) retenção (WAN-GENHEIM, 2003). Essas etapas servem de orientação para a aplicação prática do RBC e re-presentam um ciclo contínuo de raciocínio interdependente e inter-relacionado. Cada etapa é constituída de um conjunto de tarefas que podem ser implementadas por meio de diferentes técnicas. (RAMOS, 2000).

1.2 Objetivo Geral

Este trabalho tem por objetivo apresentar um modelo de instanciação do ciclo de RBC visando auxiliar engenheiros de conhecimento envolvidos na construção de sistemas RBC na área médica.

1.3 Objetivos Específicos

São os seguintes os objetivos específicos deste trabalho:

1 Definição das estruturas de conhecimento e a métrica de similaridade aplicada ao mode-lo RBC;

2 Explicitação do ciclo RBC para extração de conhecimento do especialista; 3 Definição e implementação de uma ferramenta RBC;

4 Aplicação da metodologia a uma classe de doença.

1.4 Justificativa

(20)

conheci-mentos relacionados com cada patologia é muito ampla e sua capacidade de gerenciar conhe-cimento e informação é fator chave de sucesso na elaboração de um diagnóstico. Para atingir este objetivo o gerenciamento dos conhecimentos explícitos (como manuais e livros) e tácitos (como experiências) são aspectos cruciais para a tomada de decisão no dia-a-dia dos profis-sionais ligados à área de saúde. As organizações coletam diariamente uma grande quantidade de informações clínicas como status dos pacientes (nome, endereço, idade, histórico médico, etc.) e ações médicas (terapias, cirurgias, procedimentos, etc). Além desta abundância de tipos de dados, seu uso prático é ainda limitado para reuso e avaliações dos procedimentos na área médica (MONTANI, 2003).

A IA em Saúde tem como objetivo prover ao profissional da saúde sistemas computa-cionais que simulam o modelo de funcionamento do comportamento racional dos serem hu-manos na realização de atividades inteligentes, tais como ajuda na tomada de decisão, resolu-ção de problemas e aprendizagem (FLORES, 2002).

RBC é o campo da IA que utiliza uma base de casos para consulta e resolução de pro-blemas. Os problemas atuais são resolvidos por meio da recuperação e consulta de casos pas-sados e, conseqüentemente, adaptação das soluções encontradas (KOLODNER, 1993).

Segundo Kolodner (1993), é apropriado desenvolver a metodologia RBC nas seguintes situações: (i) quando um domínio é muito difícil para avaliar soluções objetivas, usamos RBC para resolver problemas, onde as soluções podem ser justificadas por casos; (ii) RBC pode facilmente ser utilizado para antecipar problemas em potencial como parte natural de seu ra-ciocínio. Experiências sem sucesso com soluções passadas podem ser usadas em sistemas baseados em casos para antecipar problemas possíveis e talvez resultar soluções para os pro-blemas previstos.

(21)

a-prendizagem contínua, pois poderemos ter o feedback de experiências novas no processo (DERERE, 2000).

Com o RBC, o projeto IACVIRTUAL terá maiores condições de auxiliar o médico no diagnóstico por meio de recursos computacionais, uma vez que já dispõe de raciocínio basea-do em regras, redes neurais artificiais, algoritmos genéticos e lógica fuzzy.

1.5 Estrutura do trabalho

Este trabalho está organizado em seis (6) capítulos, incluindo este capítulo.

No Capítulo dois (2), é apresentada uma visão geral do referencial teórico deste traba-lho visando uma compreensão do potencial dos Sistemas Baseados em Conhecimento (SBC) nas tarefas do dia-a-dia das organizações voltadas a saúde. Também será apresentado o RBC, técnica inspiradora deste trabalho, pois, como será visto no Capítulo três (3), é a partir de es-tratégias desta natureza que será proposto um modelo para o projeto IACVIRTUAL.

No Capítulo quatro (4), será apresentada a metodologia CRISP-DM de apoio ao Enge-nheiro do Conhecimento na criação e representação de bases de casos.

No Capítulo cinco (5), é apresentado um estudo de caso, exemplificando cada etapa proposta desta metodologia para a construção do sistema RBC.

(22)
(23)

2.1 Domínio Médico

A cardiopatia isquêmica, tomada como domínio de aplicação deste trabalho, é uma doença cardíaca decorrente da diminuição significativa do fluxo coronariano devido à forma-ção de placas de gordura (ateroma) em determinados segmentos das artérias coronarianas e/ou redução do calibre por espasmos. A cardiopatia isquêmica pode se apresentar das seguintes formas (RABELO JR.,1993):

Angina Estável, que pode ser caracterizada pela dor no peito resultante de esforço físico

realizado pelo paciente. A angina estável melhora com repouso e/ou nitrato sublingual, pode ser controlada com medicação e é causada por obstruções fixas, de graus variáveis, em uma ou mais artérias coronarianas;

Angina Instável, que pode ser caracterizada como uma síndrome clínica aguda entre a

angina estável e o infarto agudo do miocárdio (angina pré-infarto). Ocorre em pacientes que percebem sintomas dor em repouso ou em pacientes que já possuam angina estável e percebem sintomas mais fortes. É causada por espasmo coronariano ou por instabili-dade da placa de ateroma.

Infarto Agudo do Miorcádio (IAM), é uma síndrome clínica, caracterizada por dor no

precórdio, geralmente retroesternal, em aperto ou peso, que não melhora com repouso e/ou nitrato sublingual. É causada, quase sempre, pela formação do trombo nas artérias coronarianas, decorrente da instabilidade da placa de ateroma, cujo trombo não sofreu trombólise espontânea e obstruiu totalmente a artéria. O espasmo coronário é responsá-vel por pequena parcela dos casos de IAM.

(24)

con-ta do melhor controle das arritmias. A partir da década de 80, houve plena confirmação de evidências demonstradas experimentalmente, apontando para os benefícios da recanalização da artéria coronária relacionada ao IAM, basicamente com o uso dos fibrinolíticos e dos no-vos processos de intervenção percutânea. Com essa abordagem, a incidência de óbitos em pacientes com IAM diminuiu para 6% a 10%. Apesar disso, o IAM continua sendo causa líder de mortalidade no Mundo Ocidental, pela alta prevalência e pela mortalidade pré-hospitalar (sabe-se que 50% das mortes por IAM ocorrem na primeira hora do evento coronariano agu-do). Portanto, frente a um quadro de dor precordial prolongada, sugestivo de IAM, a principal preocupação do médico assistente, além da rápida confirmação diagnóstica e sedação da dor, é evitar a ocorrência de arritmias ventriculares graves, extremamente comuns nas primeiras horas do evento agudo (ARQUIVOS BRASILEIROS DE CARDIOLOGIA, 2004b).

O exame clínico é um dos mais importantes passos para a avaliação do paciente com dor torácica, orientando o médico, com um alto grau de acurácia, a estimar a probabilidade de doença arterial coronariana (DAC) significativa. Além do exame clínico, uma história clinica, com detalhada descrição dos sintomas, possibilita aos clínicos uma caracterização adequada da dor torácica. Algumas características dos sintomas devem ser cuidadosamente indagadas com a finalidade de orientarem a probabilidade da presença de angina: qualidade (constritiva, aperto, peso, opressão, desconforto, queimação, pontada); localização (precordial, retroester-nal, ombro, epigástrio, cervical, hemitórax, dorso); irradiação (membros superiores direito, esquerdo ou ambos, ombro, mandíbula, pescoço, dorso, região epigástrica); duração (segun-dos, minutos, horas e dias); fatores desencadeantes (esforço físico, atividade sexual, posição, alimentação, respiração, componente emocional, espontânea); fatores de alívio (repouso, ni-trato sublingual, analgésico, alimentação, antiácido, posição e apnéia); sintomas associados

(25)

“queima-ção”, “opressão”, “peso”, entre outros (ARQUIVOS BRASILEIROS DE CARDIOLOGIA, 2004a).

O processo de diagnóstico envolve a análise de vários parâmetros clínicos e sinais bio-lógicos tais como o eletrocardiograma (ECG). O diagnóstico definitivo do IAM é feito quan-do as anormalidades características da necrose quan-do miocárdio estão presentes no ECG. Os a-chados eletrocardiográficos do IAM geralmente aparecem dentro de 24 horas após o início do sintoma, mas podem se retardar até 5 ou 6 dias em alguns poucos casos e em outros casos podem nem aparecer (WHIPPLE, 1980).

Para a elaboração do diagnóstico com grande chance de sucesso para eventos agudos da cardiopatia isquêmica, têm-se como principais elementos (RABELO JR., 1993): (i) história clínica do paciente; (ii) exame físico e (iii) eletrocardiograma. Assim, um posto de saúde, mesmo que pequeno, poderia formular um diagnóstico de evento coronariano agudo, caso tais recursos estejam disponíveis. O que ocorre é que, muitas vezes, mesmo com esses recursos, o diagnóstico não é feito pela falta de conhecimento especializado.

Desta forma, um Sistema Baseado em Experiências, que será apresentado na seção 2.5, pode ser de extrema validade, pois, a partir da parametrização do ambiente e um grupo de informações iniciais (dados clínicos), o sistema pode sugerir um diagnóstico mais provável através das experiências acumulados.

2.2 Informática na Saúde

Vários são os autores que aceitaram o desafio de definir a abrangência da Informática na Saúde. Shortliffe e Perrault (1990), por exemplo, descrevem a Informática Médica ou In-formática na saúde como “o campo científico que trata do armazenamento, recuperaçãoe uso otimizado da informática biomédica, dados e conhecimento para a resolução rápida de

(26)

Segundo Hasman e Albert (1997), Informática Médica “é a disciplina que trabalha com o processamento sistematizado de dados, informações e conhecimento em medicina e na

atenção à saúde”.

Tais definições dão ênfase aos aspectos ligados ao tratamento de informações médicas. Entretanto, segundo outros autores, o domínio da Informática Médica cobre também aspectos computacionais e processos e estruturas da Medicina e da Saúde. Por exemplo, de acordo com Zakaria (2005), a Informática em Saúde é uma disciplina emergente que estuda “a invenção e a execução das estruturas e dos algoritmos para melhorar uma comunicação, a compreensão

e a gerência da informação em saúde“.

Segundo Hasman et al. (1996), tradições culturais fazem com que muitos autores con-siderem os termos Informática na Saúde e Informática Médica como sinônimos. Nykanen (2000), no entanto, defende a utilização do termo Informática na Saúde por considerá-lo mais abrangente, associando-o ao conceito de cuidados na saúde, enquanto que Informática Médica estaria associado com a idéia mais restrita de cuidados médicos. Portanto, no contexto desse trabalho, adotou-se o termo Informática em Saúde.

Por volta de 1974, a Informática em Saúde passou a ser crescentemente reconhecida como um componente importante da prática global de Medicina. Foi nesse período que surgi-ram centros acadêmicos e de pesquisa com interesse no desenvolvimento de sistemas de regis-tro médico computadorizado que incorporassem princípios básicos de projetos determinados pela Informática em Saúde (SHORTLIFFE, 1979, apud ROJAS, 2003).

(27)

Ri-beirão Preto. No hospital da UFRJ, grupos de pesquisa do Núcleo de Processamento de Dados e da COPPE desenvolveram os primeiros sistemas baseados em microcomputadores, e no InCor foram importados vários minicomputadores e montados os primeiros sistemas de moni-toração fisiológica digital e de apoio aos testes hemodinâmicos do país. Nessa época, diversos grupos isolados com interesse em informática aplicada à saúde se formaram por todo país.

Com a iniciativa das universidades e do próprio governo, foi fundada, em 1986, a So-ciedade Brasileira de Informática em Saúde (SBIS), durante a realização do I Congresso Bra-sileiro de Informática em Saúde, em Campinas (SBIS, 2005). Esta sociedade tornou-se o foco principal da atividade profissional brasileira na área, organizando sucessivamente diversos eventos técnico-científicos, como, por exemplo, o Congresso Brasileiro de Informática em Saúde, hoje já em sua nona edição (CBIS, 2005), o Workshop de Informática Médica, com o apoio da Sociedade Brasileira da Computação e SBIS e hoje já em sua quinta edição (WIM, 2005). Diversos eventos regionais vêm ocorrendo, tal como o Simpósio de Telemedicina e Informática em Saúde do Norte e Nordeste em sua terceira edição (DIÁRIONORDESTE, 2005), entre outras. Além dos congressos específicos de Informática na Saúde, tais experiên-cias vêm sendo difundidas em eventos específicos de ferramentas e tecnologias da Computa-ção, como é o caso do Simpósio Brasileiro de Inteligência Artificial (SBIA, 2005).

A área de Informática em Saúde é bastante dinâmica e pode ser dividida em diversas especialidades. A Sociedade Brasileira de Informática em Saúde (SBIS, 2005) enfatiza as seguintes áreas de atuação: (i) Sistemas de Informação em Saúde; (ii) Prontuário Eletrônico do Paciente; (iii) Telemedicina; (iv) Sistemas de Apoio à Decisão; (v) Processamento de sinais biológicos; (vi) Processamento de Imagens Médicas; (vii) Padronização da Informação em Saúde e (viii) Internet em Saúde.

(28)

A Internet, por exemplo, vem num crescente em importância como meio de comuni-cação e difusão de informação, assim como diversas outras áreas multidisciplinares na saúde. Esse recurso tecnológico possibilita, através dos Portais de Saúde, a usuários interessados em ter acesso a informações como processos administrativos, resultados de testes e exames e as informações médicas. Além disso, tais portais podem garantir não só uma comunicação mais efetiva e abrangente entre médicos e pacientes, como também proporcionar oferta de serviços nos âmbitos educacionais e de tomada de decisão (BALL, 2000).

Na área de educação, vários projetos vêm sendo desenvolvidos. Por exemplo, a Uni-versidade de São Paulo está produzindo uma coleção de CD-ROMs com imagens nítidas e precisas do organismo (PROJETO HOMEM VIRTUAL, 2005). Os responsáveis por esse projeto são vinculados à disciplina de Telemedicina, área que utiliza as tecnologias de comu-nicação e informática para promover educação de medicina à distância. O objetivo é fazer com que esse modelo de homem virtual contribua para melhorar o entendimento da comple-xidade do corpo e ajuda a explicar doenças e tratamentos a pacientes.

Sistemas de Apoio à Decisão Médica vêm sendo desenvolvidos com o intuito de auxi-liar os profissionais da saúde a tomar decisões que influenciem diretamente no diagnóstico de pacientes ou no gerenciamento de processos que levem à definição de diagnóstico e de seu decorrente tratamento. Um dos principais motivadores para o uso destes sistemas é a esperan-ça de que eles possam ajudar a superar algumas das dificuldades intrínsecas à própria natureza do conhecimento médico, caracterizado como incerto, impreciso e incompleto (PISA, 2004). No Brasil, iniciativas neste sentido vêm ocorrendo há bastante tempo, desde projetos pionei-ros como: (i) SINDROMUS: sistema especialista para diagnóstico de síndromes de malfor-mações congênitas (NICOLLETTI, 1987); (ii) OFTALMO: sistema especialista desenvolvido para auxiliar oftalmologistas no diagnóstico de síndromes oculares (CHIANCA, 1987); (iii)

(29)

treina-mento de diagnóstico de síndromes oculares (MOREIRA JR., 1991), desenvolvidos na Uni-versidade Federal da Paraíba (UFPB), em Campina Grande; (iv) SADD-CCRN: sistema de apoio ao diagnóstico de doenças coronarianas congênitas em recém-nascidos e baseado no conceito de árvore de diagnóstico diferencial (FILARTIGA, 2004).

O projeto IACVIRTUAL, proposto pelo Grupo de Inteligência Artificial da Universi-dade Católica de Brasília, busca modelar e desenvolver um consultório médico virtual.

2.3 Inteligência Artificial na Saúde

No verão de 1956, John McCarthy organizou no Dartmouth College, um seminário onde, durante dois (2) meses, se reuniram dez (10) pesquisadores interessados em Teoria de Autômatos, Redes Neurais e no estudo da Inteligência. Esses pesquisadores se tornaram os precursores da área do conhecimento que se chamou IA, apesar desse nome não ter sido una-nimemente aceito. Racionalidade Computacional talvez tivesse sido um nome mais apropria-do (RUSSELL, 2004).

O objetivo das pesquisas em IA é capacitar o computador a executar funções que são desempenhadas pelo ser humano usando conhecimento e raciocínio (REZENDE, 2004). Vá-rios são os autores que tentam definir a IA. Kurzweil (1990), por exemplo, define a IA como

“A arte de criar máquinas que executam funções que exigem inteligência quando executadas

por pessoas”. Segundo Bellman (1978), IA é “a automatização das atividades que associa-mos com o pensamento humano, atividades tais como tomada de decisões, resolução de

pro-blemas, aprendizado...”.

(30)

especi-alizado, comparável ao de um especialista humano. Os avanços em Ciência da Computação, em Tecnologia da Informação e em Ciências Cognitivas possibilitaram a construção de artefa-tos computacionais baseados em conhecimento. A busca da viabilização da transferência dos conhecimentos humanos para o computador constituiu um campo de pesquisa da IA, que tem como proposta de desenvolver Sistemas Inteligentes (SI) capazes de simular ou emular o pro-cesso de decisão do ser humano. Os pontos-chave desses sistemas são: (i) a habilidade de usar conhecimento para desempenhar tarefas ou resolver problemas e (ii) a capacidade de realizar associações e inferências para trabalhar com problemas complexos que se assemelham a pro-blemas reais (REZENDE, 2004).

Dentro da área de pesquisa de SI está a construção de Sistemas Baseado em Conheci-mento (SBC) que estão na vanguarda da nova geração de técnicas e ferramentas baseadas em conhecimento.

De uma forma geral, pode-se dizer que os SBC são sistemas capazes de resolver pro-blemas usando conhecimento específico sobre o domínio da aplicação, enquanto os SE são SBC que resolvem problemas ordinariamente resolvidos por um especialista humano. Por isso, eles requerem conhecimento sobre a habilidade, a experiência e as heurísticas usadas pelo especialista (REZENDE, 2004).

(31)

SI

SBC

SE

Tornam explícito o domínio do

conhecimento, além de separá-lo do sistema

Aplicam conhecimento especializado na resolução de problemas difíceis do mundo real

Exibem comportamento inteligente

Figura 1 - Síntese das características dos sistemas no contexto de Sistemas Inteligentes (REZENDE, 2004)

2.4 Sistemas Baseados em Conhecimento

SBC são programas de computador que usam o conhecimento representado explicita-mente para resolver problemas. Eles manipulam conhecimento e informação de forma inteli-gente e são desenvolvidos para serem usados em problemas que requerem uma quantidade considerável de conhecimento humano e de especialização (REZENDE, 2004).

Newell (1982) sugeriu que o desenvolvimento de um SBC deveria conter a descrição do sistema sob duas perspectivas distintas: a do conhecimento, processável pelo homem e a

simbólica, processável pelo computador. Na perspectiva do conhecimento, a base restringe-se em descrever o que o sistema deve fazer, enquanto a base deve indicar em termos simbólicos como o sistema irá proceder. Com esta distinção, Newell enfatizou a importância de separar

(i) a análise e modelagem do método de resolução do problema e (ii) a atividade de represen-tar este método em um formalismo que seja computacionalmente eficiente.

(32)

co-nhecimento nele embutido para encontrar soluções satisfatórias; (iii) explicar o seu raciocínio, caso seja questionado pelo usuário, e, por último, (iv) conviver com seus erros, isto é, tal co-mo um especialista humano, o SBC pode cometer erros, mas deve possuir um desempenho satisfatório que compense seus possíveis enganos.

Os SBC têm sido aplicados nos mais variados ramos, como negócios, medicina, ciên-cia e engenharia. Mas, para seu desenvolvimento, é necessário um estudo da viabilidade da aplicação dessa tecnologia no domínio em questão. Alguns fatores a serem considerados são: custo, habilidade desejada, disponibilidade do especialista e delimitações do domínio do co-nhecimento (REZENDE, 2004).

O primeiro SE em saúde, denominado MYCIN, foi desenvolvido no início dos anos 70 como um projeto da Universidade de Stanford (EUA), onde os dois principais realizadores foram Shortliffe, do Departamento de Medicina, e Buchanan, do Departamento de Computa-ção. O MYCIN (BUCHANAN, 1984) foi um SE desenvolvido para apoiar o diagnóstico de infecções bacterianas. Dentre as diversas formas de raciocínio emuladas e utilizadas ampla-mente pelos SE, inclusive pelo MYCIN, está o Raciocínio Baseado em Regras (WATTER-MAN, 1986).

(33)

Especialista

Engenheiro de Conhecimento

Aquisição de Conhecimento

Usuário do Sistema

Máquina de Inferência

Base de Conhecimento I

N T E R F A C E

Figura 2 - Arquitetura básica de um SE simbólico (BRASIL, 1999)

A Base de Conhecimento contém a descrição do conhecimento necessário para a reso-lução do problema abordado na aplicação. Isto inclui asserções sobre o domínio de conheci-mento, regras que descrevem relações nesse domínio e, em alguns casos, heurísticas e méto-dos de resolução de problemas. A forma de representação desse conhecimento deve estar des-crita explicitamente por um formalismo processável computacionalmente, como por exemplo, lógica matemática, redes semânticas, regras de produção e frame (REZENDE, 2004).

A Máquina de Inferência é responsável pelo desenvolvimento do raciocínio baseado nos dados fornecidos pelo usuário do sistema, e do conhecimento armazenado em sua base de conhecimento. A máquina de inferência processa a linguagem de representação usada na Base de Conhecimento, gerando e percorrendo o espaço de busca sempre que necessário.

A Interface se constitui dos componentes que permitem a comunicação do sistema com o engenheiro de conhecimento (EC) e com o usuário final. As características da interface estão diretamente relacionadas com o tipo de problemas em consideração, isto é, dependem da natureza das informações, de como elas devem ser fornecidas e manipuladas, de como dese-jamos que as soluções obtidas sejam apresentadas, dos níveis de informações desejadas, etc. Normalmente, os "shells" ou ambientes para o desenvolvimento de SE, comercialmente dis-poníveis, quando adequadamente adotadas, fornecem a interface, ou opções para o seu desen-volvimento (LEMOS, 1996).

(34)

ex-periência, conhecem profundamente um domínio específico e usam artifícios e cuidados para resolver problemas e tarefas.

Os traços dos especialistas que os caracterizam são os seguintes (HART, 1986): (i) o especialista pode utilizar o seu conhecimento para resolver problemas com uma porcentagem aceitável de sucesso; (ii) seu conhecimento é eficaz, não basta resolver somente os problemas, ele deve resolvê-los rapidamente e de maneira eficaz; (iii) os especialistas conhecem os seus limites, ele sabe com o que ele pode lidar e quando ele deve consultar algum outro especialis-ta.

O EC é uma figura central, tanto na construção do SE, vista sob o aspecto técnico, como na Aquisição de Conhecimento (AC). É ele quem prepara o conhecimento para ser ar-mazenado em uma forma própria, fornecendo as explicações necessárias dos conceitos utili-zados pelo SE (ROLANDI, 1986 apud ROJAS, 2004).

Um EC deve ter um preparo especial e até algumas qualidades inatas, tais como: (i)

capacidade de comunicação, fazendo, se possível, o uso das expressões, normalmente, utiliza-das pelo especialista (LEMOS, 1996); (ii) não pode ser totalmente ignorante na área do espe-cialista e deve sentir-se bem trabalhando com profissionais da área (ROLANDI, 1986 apud

ROJAS, 2004); (iii) empatia e paciência para permitir que o especialista desenvolva o seu raciocínio sem ser interrompido (WATERMAN, 1986); (iv) lógico e objetivo, isto irá refletir-se, diretamente, no desenvolvimento da base de conhecimento do SE (LEMOS, 1996).

AC é o processo de identificar, extrair, analisar e documentar o conhecimento obtido de um especialista de domínio, com o propósito de construir um SE (CHETUPUZHA, 1991,

apud BRASIL, 1994).

(35)

observado e interpretado pelo EC para a criação do modelo computacional (REZENDE, 2004).

O processo de AC é dividido nos seguintes estágios: (i) decisão inicial do conhecimen-to necessário (análise inicial); (ii) obtenção do conhecimento vindo de especialistas humanos e sua interpretação (elicitação); (iii) representação do conhecimento pela sua codificação na linguagem interna do sistema (BRAGA JR., 2001).

A Elicitação do Conhecimento é a etapa mais importante, onde o EC extrai o conhe-cimento do domínio do especialista. Há várias técnicas de elicitação que têm sido desenvolvi-das conforme (CHETUPUZHA, 1991 apud BRASIL, 1994). Contudo, para o contexto deste trabalho algumas delas serão citadas a seguir:

Entrevista – É uma técnica conhecida também como “questionamento”, uma vez que o

tipo principal de iteração é a colocação de perguntas pelo entrevistante (elicitante) e a resposta pelo entrevistado (especialista) (ROJAS 2003 apud NASSAR, 1992);

Discussão Focalizada – É semelhante a técnica de entrevista, apenas diferenciando na

introdução de um terceiro elemento, o foco, que interage com o elicitante e a fonte hu-mana de conhecimento (ROJAS 2003 apud DIAPER, 1989);

Análise de Protocolo – Requer que o especialista “pense em voz alta” enquanto

solu-ciona um problema (ROJAS 2003 apud BYRD, 1992);

Geração de Matriz – É uma técnica que faz uso de tabelas (matrizes) quando do

proces-so de EC, em especialistas que costumam tabular seu conhecimento (ROJAS 2003 apud NASSAR, 1992);

Análise Comportamental para Solução de Problema Clínico – Esta técnica simula uma

sessão clínica para obtenção da tomada da história de uma doença real (ROJAS 2003

apud KASSIRER, 1978).

(36)

conheci-mento e da maneira como ele maneja esse conheciconheci-mento, no domínio específico que se estuda (HART, 1986).

Neste trabalho serão utilizadas técnicas de elicitação do conhecimento e será mais de-talhado no capítulo quatro (4) referente a metodologia proposta para o EC.

Para utilizar o conhecimento de um especialista num sistema computacional, há a ne-cessidade de realizar uma estruturação do que será utilizado pelo sistema. Para tanto, utiliza-se uma repreutiliza-sentação do conhecimento. A repreutiliza-sentação do conhecimento (RC) tem as utiliza- se-guintes características: (i) generalizável; (ii) passível de alteração; (iii) compreensível e (iv)

utilizável (ALVES, 2002).

O método de RC em um SE, pode ser definido como a formalização e a estruturação do conhecimento adquirido no processo da AC. O método escolhido depende, fundamental-mente, da área de domínio do problema e do problema à resolver, podendo, dependendo do problema, serem utilizados métodos diferentes de representação ou, até mesmo, mais de um método de representação na resolução de um mesmo problema (LEMOS, 1996).

Como citado na seção 2.4.1, existem vários métodos ou técnicas para a RC. Neste tra-balho utilizaremos a metodologia RBC.

2.5 Raciocínio Baseado em Casos

RBC constitui uma tecnologia computacional, do campo da IA, cujas aplicações estão cada vez mais diversificadas. Trata-se de um recurso de modelagem computacional apropria-do para soluções e respostas a problemas tais como (MARTINS, 2000):

• Problemas de um médico frente ao seu paciente: Qual o diagnóstico para estes

sinto-mas? Qual tratamento mais indicado?

• Problemas de um operador de alto-forno siderúrgico em atividade de monitoração:

(37)

• Problemas de um corretor de imóveis frente a um proprietário: Qual o valor mais

apro-priado para este imóvel?

RBC é um enfoque para a solução de problemas e para o aprendizado baseado em ex-periência passada. RBC resolve problemas ao recuperar e adaptar exex-periências passadas, chamadas de caso, armazenadas em uma base de casos. Um novo problema é resolvido com base na adaptação de soluções de problemas similares já conhecidas. Um grande número de exemplos da vida diária pode ser utilizado para demonstrar como seres humanos utilizam ca-sos conhecidos como uma forma de resolução de problemas de um modo extremamente natu-ral. Por exemplo, ao atender um novo paciente e escutar seus problemas, o médico lembra-se do histórico da doença de um outro paciente devido ao conjunto similar de sintomas, e aplica-lhe um tratamento semelhante ao que administrou ao paciente que apresentou aqueles sinto-mas similares (WANGENHEIM, 2003).

2.5.1 História do RBC

O RBC teve início com os estudos de Schank (1982) sobre a compreensão da lingua-gem. Segundo sua teoria, a linguagem é um processo baseado em memória. Seus pressupostos teóricos afirmam que em cada experiência do ser humano sua memória passa a se ajustar em resposta a essas experiências, implicando dessa forma, que o aprendizado depende dessas alterações na memória. Através desse estudo conclui-se que: o processo de compreensão de uma linguagem depende de informações armazenadas previamente na memória, ou seja, pes-soas não compreendem eventos sem deixar de fazer referências a fatos que já vivenciaram e que já conhecem (SILVA, 2002).

(38)

batendo as barbatanas e empurrando a água para trás, posso inventar um objeto chamado

remo que pode servir para impulsionar um barco realizando movimentos rítmicos que

empur-ram a água para trás”. O objetivo do raciocínio analógico é a transformação e extensão do conhecimento proveniente de um domínio conhecido para dentro de um outro domínio com estrutura ainda incompletamente compreendida. No RBC problemas são resolvidos exclusi-vamente no âmbito de um mesmo domínio de aplicação com utilização de exemplos de dentro deste domínio (WANGENHEIM, 2003).

Mais tarde, teorias de Formação de Conceitos, Resolução de Problemas e Aprendizado Experimental dentro da psicologia e da filosofia também contribuíram. Schank (1982) conti-nuou a explorar o importante papel que a memória de situações prévias e padrões de situações ou pacotes de organizações de memória têm, tanto na resolução de problemas, como durante o aprendizado de situações.

Um dos primeiros sistemas computacionais que utilizou a metodologia de RBC foi o CYRUS, desenvolvido por Kolodner (1993), baseado no modelo de memória dinâmica de Schank (1982). A memória de casos neste modelo é uma estrutura hierárquica chamada paco-tes de organização da memória episódica. A idéia básica é organizar casos específicos que possuam propriedades similares mais generalizadas (AAMODT, 1994).

(39)

Um dos exemplos mais famosos de sistemas em RBC na área da saúde é CASEY. CASEY é um sistema que diagnostica disfunções cardíacas. Como entrada usa os sintomas do paciente e produz uma explicação causal da cardiopatia que o paciente apresenta, conectando sintomas e estados internos. CASEY diagnostica pacientes por meio da aplicação de casamen-to baseado em modelos e heurísticas de adaptação aos aproximadamente 25 casos que possui em sua base de casos. Quando um novo caso surge, CASEY tenta encontrar casos de pacien-tes com sintomas similares, mas não necessariamente idênticos. Se o novo caso casa com al-gum, então CASEY adapta o diagnóstico recuperado, considerando diferenças entre sintomas do novo caso e do caso recuperado (KOLODNER, 1993 apud WANGENHEIM, 2003).

(40)

Em CASEY, o método de indexação é realizado em dois passos: (i) quando as caracte-rísticas para índices primários são estados causais gerais do modelo de colapso cardíaco, que é parte da explicação de um caso, e (ii) quando um novo problema aparece, as características deste são propagadas no modelo de colapso cardíaco e os estados que explicam estas caracte-rísticas são utilizados como índices para a memória de casos. As caractecaracte-rísticas de fato obser-vadas são utilizadas apenas como atributos secundários.

O grau de maturidade tecnológica alcançado pelo RBC pode ser documentado, tanto pelas aplicações comerciais desenvolvidas até o momento presente, quanto pelas ferramentas de desenvolvimento de sistemas baseados em RBC que agora já encontram no mercado. As primeiras ferramentas para desenvolvimento de sistemas de RBC comerciais surgiram no iní-cio da década de 1990 e, desde aquele tempo, ferramentas cada vez mais poderosas têm sido desenvolvidas.

Atualmente, alguns trabalhos vêem sendo desenvolvidos na área da saúde utilizando RBC, como o de Balaa (2003) e o de Perner (2003). Especificamente em Cardiologia, merece destaque o trabalho coordenado por Long (2005), que vem desenvolvendo o sistema Heart Disease Program, cujo objetivo é apoiar o diagnóstico médico dos pacientes com sintomas de doenças cardíacas.

2.5.2 Ciclo RBC

A arquitetura RBC pode ser vista, de uma forma mais genérica, pelas etapas definidas na Figura 3, que representam o ciclo de processamento de desse sistema (conhecido como R4) (AAMODT, 1994):

(41)

(ii) Reutilização: reutilizam-se as informações e o conhecimento que resolveram o problema anteriormente, associando-se sua solução ao contexto do problema atual;

(iii) Revisão: revisa-se (caso seja necessário) e adapta-se a antiga solução para que seja utili-zada na nova situação (problema);

(iv) Retenção: é a etapa que se armazena todas as partes consideradas úteis do novo proble-ma, na biblioteca de casos. Além disso, deve-se decidir de que forma armazenar e como indexar o caso para futuras recuperações.

Figura 3 - Ciclo RBC (AAMODT, 1994)

2.5.3 Etapas de desenvolvimento de sistema RBC

O RBC representa uma aproximação de resolução de problemas baseado em soluções de casos passados similares. Para resolver um atual problema uma noção de similaridade entre problemas é usada para recuperar casos similares da base de casos. As soluções desses casos similares são então usadas como ponto inicial para resolver o atual caso (THÉ, 2001).

(42)

Caso i

D

Diiaaggnnóóssttiicco: o Alta probabilidade de estar sofrendo um evento coronariano agudo

A

Aççãão: o encaminhar, imediatamente, o paciente a uma unidade terciária

P

Prroobblleemmaa: Paciente sentindo pontadas no coração

S

Siinnttoommaass//SSiinnaaiiss: Pulso arrítmico, febre, diabético, palidez, vômitos

Figura 4 - Exemplo de um Caso

Um caso é a formalização de um conhecimento, advindo de uma experiência prática, vivenciada anteriormente e associada a um contexto, que é construída pela ação a partir da resolução de um problema. Independentemente dos resultados alcançados serem bons ou ru-ins, de ter sido um sucesso ou não, o importante é que a experiência tenha algo útil a transmi-tir. Os casos são organizados em uma base de dados, chamada conceitualmente de Base de Casos, que é mantida em memória (RAMOS, 2000).

A interpretação apropriada da experiência será indicada pelo especialista que escolheu as características que melhor descrevem o problema representado nos casos, como resultado da AC (THÉ, 2001).

A representação dos casos é uma tarefa complexa e importante para o sucesso do sis-tema RBC. O conhecimento neste contexto pode ser interpretado como sendo um conjunto de métodos que modelam um conhecimento especializado para disponibilizá-lo em um sistema inteligente. Apesar de um sistema RBC ser extremamente dependente da estrutura e do conte-údo de sua base de casos, seu conhecimento não está presente apenas nos seus casos (memó-ria), mas também nas suas etapas de desenvolvimento. Estas etapas são: Representação do Conhecimento, Medida de Similaridade, Adaptação e Aprendizado (MATTOS, 1999).

Representação do Conhecimento

(43)

para-digmas da IA, incluindo frame, objetos, predicados, redes semânticas e regras (WATSON, 1997).

Algumas formas de representação do conhecimento mais comumente utilizadas serão descritas abaixo (WANGENHEIM, 2003):

Representação Atributo-Valor - Em uma representação atributo-valor, um item de dado

pode ser representado por um atributo-valor. Por exemplo: nome (atributo) e José da Silva (valor). Um caso é então representado como um conjunto de pares atributo-valor. O conjunto de atributos pode ser fixo para todos os casos na base, ou pode variar entre casos individuais.

Representação Orientada a Objetos - Similarmente às linguagens de programação

ori-entada a objetos, representações oriori-entadas a objetos descrevem o domínio particionan-do-o com relação aos seus objetos. Tais representações são de extrema valia em domí-nios de aplicação complexos, onde casos com estruturas variáveis podem ocorrer. É vis-to como um conjunvis-to de objevis-tos. Os objevis-tos interagem entre si por meio dos serviços que provêm. Cada objeto possui determinados atributos, que em conjunto definem a es-trutura do objeto. Por exemplo, o objeto paciente pode ser definido pelos atributos <<nome>> , <<idade>> e <<telefone>>.

Árvores e Grafos - Outras formas de representação são árvores e grafos dirigidos e não

(44)

siste-mas de RBC são as árvores K-d. Uma árvore K-d é uma árvore de pesquisa binária k -dimensional, que decompõe a base de casos iterativamente em partes menores. Uma ár-vore de busca k-d representa dados estruturados de acordo com k chaves, ao contrário da árvore de busca binária convencional que estrutura a sua informação com base em ape-nas uma chave. Uma árvore k-d é uma árvore de busca binária, onde a cada nível se uti-liza uma chave diferente, dentre as suas k chaves (equivalendo a k atributos dos casos armazenados), como critério de busca / inserção.

O modelo do domínio define um padrão para representar casos, especificando o con-junto de atributos usados. A definição de novos casos é de alta qualidade e o custo da manu-tenção é baixo, porém o investimento inicial para produzir o modelo do domínio é alto. Em geral, um caso pode ser representado a partir de alguma estrutura de dados (par: atributo, va-lor) para descrever um problema e uma solução (RAMOS, 2000).

Medida de Similaridade

O objetivo do RBC é a reutilização de soluções conhecidas no contexto de um pro-blema novo, de solução ainda desconhecida. Em função disso, a determinação de exemplos de casos adequados, que não precisam necessariamente ser idênticos à situação atual, é um dos problemas centrais desta técnica da IA (WANGENHEIM, 2003).

A eficácia de enfoques baseados em casos depende essencialmente, portanto, da esco-lha de um conceito de similaridade adequado para o domínio de aplicação e a estrutura dos casos usados. Este conceito de similaridade deveria permitir a estimativa da utilidade de um caso com base na similaridade observada entre a descrição do problema atual e a contida no caso.

(45)

entan-to, costumam a exibir as seguintes propriedades (MARTINS, 2000)

Reflexividade: um caso é sempre similar a si mesmo.

Simetria: se o caso A é similar ao caso B, então o caso B é sempre similar ao caso A.

Não transitividade: se o caso A é similar ao caso B e B é similar ao caso C, nem

sem-pre se pode garantir que o caso A é similar ao caso C.

Existem duas classes de similaridade quanto à sua abrangência: a similaridade global e a similaridade local. Tipicamente, a similaridade global entre o caso alvo (Q) e um caso fonte (C), ambos descritos por n atributos, e denotada por SIM(Q,C), está baseada na computação das similaridades locais sim entre cada atributo destes dois casos e pode ser expressa por (MARTINS, 2000):

SIM(Q,C) = f(sim1(q1,c1),sim2(q2,c2), ..., simn(qn,cn)), com f : [0,1]n → [0,1]

Uma classe particular de métrica para computar essa similaridade pode ser obtida pela soma ponderada das similaridades locais para cada atributo conforme a expressão que segue:

= = × = n i i i i n i i W C Q sim W SIM(Q,C) 1 1 ) , (

onde i designa qualquer atributo particular de 1 até n; W significa um peso medidor da impor-tância do atributo i; n significa a quantidade total de atributos em cada caso; sim(Qi,Ci)

desig-na a similaridade particular ou local entre o valor do i-ésimo atributo do caso alvo (Q) e do caso (C) na base de casos.

Uma família inteira de métricas tais como a métrica Weighted City Block, a métrica Euclidiana, a métrica de Minkowski e a métrica ponderada de Minkowski funciona de modo similar ao mostrado acima. Abaixo as métricas de similaridades mais empregadas no RBC (MARTINS, 2000):

(46)

valo-res assumidos por dois casos. A coluna Valoração indica se um certo atributo deve as-sumir um único valor ou se ele pode asas-sumir uma lista como sendo uma lista de valores.

Medidas de similaridade global - Uma vez um conjunto de similaridades locais Simi

(47)

Tabela 1 - Medidas de similaridade local (MARTINS, 2000)

Similaridade local Tipo de atributo Valoração

1.

 

 ∩ =∅

= 1,0,casose contrário

) ,

(ab a b

Sim Simbólico Monovalorado Multivalorado

2. ) ( ) ( ) ( ) , ( b a Card b a Card b a Card b a Sim ∪ ∩ − ∪

= Simbólico Multivalorado

3. ) min( ) ( ) ( ) , ( b a b a Card b a Card b a Sim ∪ ∩ − ∪

= Simbólico Multivalorado

4. ) max( ) ( ) ( ) , ( b a b a Card b a Card b a Sim ∪ ∩ − ∪

= Simbólico Multivalorado

5. ) ( ) ( ) ( ) , ( O Card b a Card b a Card b a

Sim = ∪ − ∩ Simbólico Multivalorado

6. ) ( ) ( )) , max( ), , (min( ) , ( O Card b a Card b a b a ec b a

Sim = − − − − − ∩ Simbólico ordena-do e numérico Multivalorado

7. ) ( ) , ( O ec b a b a

Sim = − Numérico Monovalorado

8. ) ( ) , ( O ec b a b a

Sim = cc Numérico Multivalorado

9. ) ( ) ( )) , max( ), , (min( ) , ( O ec b a ec b a b a ec b a

Sim = − − − − − ∩ Numérico Multivalorado

10. ) ( ) ( ) ( ) , ( b a ec b a ec b a ec b a Sim ∪ ∩ − ∪

= Numérico Multivalorado

11. )) ( ), ( min( ) ( ) ( ) , ( b ec a ec b a ec b a ec b a

Sim = ∪ − ∩ Numérico Multivalorado

12. )) ( ), ( max( ) ( ) ( ) , ( b ec a ec b a ec b a ec b a

Sim = ∪ − ∩ Numérico Multivalorado

13. max 2 )) ( ) ( ) ( 2 ) , ( h a h b h b a h b a

Sim = ∪ − − Simbólico e

Numérico Multivalorado

14. h b a h b a Sim tree of height total ) and merging node ( ) ,

( = Simbólico e Numérico Monovalorado

• Monovalorado: o atributo tem exatamente um valor por vez

• Multivalorado: o atributo toma uma lista como seus valores ou possivelmente um intervalo

O: Conjunto de possíveis valores para o atributo

Card: Tamanho de um conjunto

a-, b-: Limite superior de a (em relação a b) ac: Ponto central do intervalo a

ec(I): Valor absoluto entre limites superior e inferior do intervalo I

(48)

Tabela 2 - Medidas de similaridade global (MARTINS, 2000)

Similaridade global Nome

1.

= = p i

i i

i a b

Sim B A SIM 1 ) , ( ) ,

( Vizinho Mais Próximo

2.

= = p i i i i

iSim a b

B A SIM 1 ) , ( ) ,

( ω Vizinho Mais Próximo Pon-derado

3. ( , ) ( ( , ))/ ) 1 1

= = = p i i p i i i i

iSim a b

B A

SIM ω ω Vizinho Mais Próximo Pon-derado Normalizado

4.

= = p i i i i a b Sim p B A SIM 1 ) , ( 1 ) ,

( City Block

5.

[

]

= = p i i i i a b Sim p B A SIM 1 2 ) , ( 1 ) , ( Euclideana

6. r

[

]

p

i

r i i i a b Sim p B A SIM

= = 1 ) , ( 1 ) , ( Minkowsky

7. r

[

]

p i r i i i i Sim a b B A SIM

= = 1 ) , ( ) ,

( ω Minkowsky Ponderado

8. SIM(A,B)=maxiωiSimi(ai,bi) Maximum

A identificação das características relevantes de um caso vai determinar a sua similari-dade com outros casos. Essas características são definidas como índices na recuperação de casos. Num sistema de RBC, os índices representam uma interpretação de uma situação espe-cífica e indicam os casos na memória que são mais similares a um caso de entrada usado para pesquisa (BRAGA JR.2001).

A escolha correta dos índices, em qualquer sistema, depende do que é considerado significante para o sistema (SCHANK, 1982). Os índices precisam ser cuidadosamente sele-cionados para que apenas os casos mais úteis possam ser recuperados de forma rápida, efici-ente e precisa. Martins (2000), cita os seguintes métodos:

Indexação por atributos e dimensões - Consiste na aplicação de diretrizes para a

(49)

MEDIATOR (KOLODNER, 1993), que trata de resolver disputas entre pessoas e países que invadem a propriedade um do outro, é citado por Watson (1997) como um exemplo de indexação por atributo. Os criadores do sistema procuram indexar segundo o tipo e as funções dos objetos em disputas; como também segundo os relacionamentos entre os disputantes.

Indexação baseada em diferenças - Consiste em buscar e fazer uso das diferenças entre

situações. Nesta hipótese, os índices seriam aquelas características que diferenciam um objeto (um caso já na memória) de um outro que está sendo indexado, como nos siste-mas CASEY e CYRUS (KOLODNER, 1993).

Indexação baseada em similaridades / explicação - Métodos de generalização baseados

em similaridades e explicação, segundo Watson (1997), podem levar à produção de um conjunto de índices para casos abstratos ou índices para casos com características com-partilhadas. São métodos que usam a aprendizagem baseada em explicação ( explanati-on-based learning) para extrair uma combinação de características (atributos) que levam em conta a generalização de uma explicação.

Indexação por aprendizagem indutiva - Os métodos de aprendizagem indutiva também

são aqui citados como métodos de indexação, utilizados para identificar e selecionar ín-dices que funcionem como características prognosticadoras para casos do paradigma RBC.

(50)

Adaptação

A adaptação é um recurso muito importante na abordagem RBC. Agrega valor ao sis-tema, principalmente se ocorre de forma automática, sem intervenção humana. Através de um conjunto de regras, previamente definidas por um especialista, o sistema RBC é capaz de i-dentificar as diferenças, entre o caso recuperado e o novo caso, e inferir as adaptações neces-sárias para reutilizar a solução anterior (RAMOS, 2000).

A solução dos casos recuperados é então transferida para a situação presente. Se ne-cessário, a solução recuperada é adaptada para que satisfaça completamente os requisitos da situação presente. Isto corresponde a uma reutilização com adaptações. Neste passo, os mais variados graus de modificação podem ser realizados, utilizando-se diferentes técnicas de a-daptação, que vão desde a simples cópia da solução até adaptações realizadas conforme com-plexas regras que refletem um modelo do domínio de aplicação do sistema RBC em questão (WANGENHEIM, 2003).

A adaptação tem um papel fundamental na flexibilidade dos sistemas RBC, e a sua ca-pacidade de resolver novos problemas depende de sua habilidade em adaptar casos recupera-dos a novas circunstâncias e em sua habilidade de consertar soluções que falham ao serem aplicadas. A dificuldade maior surge quando tentamos definir como realizar a adaptação. Há muitas maneiras de se adaptar um caso, e a adaptação efetiva depende, tanto de se possuir conhecimento sobre possíveis modificações válidas, como de se possuir maneiras de selecio-nar quais são apropriadas e efetivas em uma determinada situação. Questões centrais para a adaptação de casos são:

• Quais são os aspectos de uma situação (descrita por meio de um caso) que devem ser

adaptados;

• Quais modificações são razoáveis de serem realizadas para adaptar o caso;

Imagem

Figura 1 - Síntese das características dos sistemas no contexto de Sistemas Inteligentes   (REZENDE, 2004)
Figura 2 - Arquitetura básica de um SE simbólico (BRASIL, 1999)
Figura 3 - Ciclo RBC (AAMODT, 1994)
Tabela 1 - Medidas de similaridade local (MARTINS, 2000)
+7

Referências

Documentos relacionados

CONSIDERANDO a necessidade de adequar as medidas restritivas às ati- vidades econômicas privadas para evitar a disseminação do Novo Corona- vírus sem prejudicar a manutenção

[r]

No Brasil e no mundo, é elevado o número de turistas interessados nesse tipo de atividade, em busca de conhecimentos e aventuras em cavernas e demais paisagens cársticas,

Ainda segundo Gil (2002), como a revisão bibliográfica esclarece os pressupostos teóricos que dão fundamentação à pesquisa e às contribuições oferecidas por

A tabela 25 apresenta os resultados brutos desta avaliação em relação à característica busca e a tabela 26 exibe o resultado ponderado para esta característica.. A tabela 27

O segundo Beneficiário será designado pelo Segurado na Proposta de Adesão, podendo ser substituído a qualquer tempo, mediante solicitação formal assinada pelo próprio Segurado, para

O bloqueio intempestivo dos elementos de transmissão de energia entre os equipamentos e acessórios ou reboques está impedido ou se não está existem medidas que garantem a segurança

Analysis of relief and toponymy of the landscape based on the interpretation of the military topographic survey: Altimetry, Hypsometry, Hydrography, Slopes, Solar orientation,