• Nenhum resultado encontrado

Computação na medicina: a técnica de raciocínio baseado em casos temporais no auxílio ao diagnóstico / Computing and medicine: temporal case based reasoning applied in support to diagnosis

N/A
N/A
Protected

Academic year: 2020

Share "Computação na medicina: a técnica de raciocínio baseado em casos temporais no auxílio ao diagnóstico / Computing and medicine: temporal case based reasoning applied in support to diagnosis"

Copied!
8
0
0

Texto

(1)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761

Computação na medicina: a técnica de raciocínio baseado em casos temporais

no auxílio ao diagnóstico

Computing and medicine: temporal case based reasoning applied in support to

diagnosis

DOI:10.34117/bjdv6n10-259

Recebimento dos originais: 10/09/2020 Aceitação para publicação: 13/10/2020

Jonathan William Hrenechen

Universidade Tecnológica Federal do Paraná (UTFPR), Ponta Grossa, Brasil e-mail: hrenechen@gmail.com

André Pinz Borges

Universidade Tecnológica Federal do Paraná (UTFPR), Ponta Grossa, Brasil e-mail: apborges@utfpr.edu.br

André Koscianski

Universidade Tecnológica Federal do Paraná (UTFPR), Ponta Grossa, Brasil e-mail: koscianski@utfpr.edu.br

RESUMO

O Raciocínio Baseado em Casos (RBC) é uma técnica de Inteligência Artificial aplicada em diversas áreas e que vem sendo considerada nos últimos anos no apoio ao diagnóstico médico. Seu uso nesse contexto depende de algumas modificações não triviais, em razão da dependência dos dados em relação à variável tempo. Este trabalho examina os pontos principais desse problema, destacando soluções da literatura e apontando perspectivas a serem exploradas.

Palavras-chave: Inteligência artificial; Medicina; Raciocínio Baseado em Casos. ABSTRACT

Case Based Reasoning (CBR) is a technique of Artificial Intelligence applied in several areas and has been considered in recent years in support of medical diagnosis. Its use in this context depends on some non-trivial modifications, due to the dependence of the data on the time variable. This work examines the main points of this problem, highlighting solutions in the literature and pointing out perspectives to be explored.

Keywords: Artificial Intelligence; Medicine; Case Based Reasoning.

1 INTRODUÇÃO

Em meados da década de 50 surgiram estudos sobre as possibilidades da computação no apoio a diagnósticos médicos (Ledley, Lusted, 1959). Desde então as duas áreas vem se aproximando, em especialidades que vão desde psiquiatria ou doenças infecciosas até oncologia e cirurgia cardiaca

(2)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761 (Combi, Shahar 1997), além de campos como genoma (Fraser, Burnell, 1970). Várias características tornam a tarefa de diagnóstico difícil (Hampton et al 1975); algumas delas são incertezas do próprio paciente, reações distintas de cada organismo, características comuns a várias moléstias, influência de medicações, novos entendimentos sobre exames e protocolos, e doenças que se apresentam juntas na mesma pessoa. As primeiras iniciativas explorando computadores na medicina incluíram usar o teorema de Bayes (Feinstein 1973), lógica booleana de Sistemas Especialistas (Fox, 1996), ou a lógica fuzzy (Adlassnig 1986). Na década de 1980 começou a se utilizar RBC, Raciocínio Baseado em Casos (Riesbeck e Schank, 1989), uma técnica que continua evoluindo nos dias de hoje ao lado de outros métodos de Inteligência Artificial (Braga et. al, 2019). Técnicas computadorizadas de apoio a diagnóstico dependem de uma base de dados que corresponde ao conhecimento acumulado de especialistas. A maneira como cada técnica utiliza essa base é distinta, mas a maioria delas explora caminhos coletando unidades de informação, como sintomas e resultados de exames, identificando hipóteses e descartando as situações menos prováveis. RBC adota uma visão diferente, tratando blocos de informação conhecidos como “casos”, que devem englobar todo conhecimento relativo a um paciente. Uma vez identificados os casos de maior semelhança com a entrada, o método RBC propõe uma solução, também baseada no conhecimento armazenado.

Uma característica particular no contexto médico é o fato de que a evolução de um paciente e sua resposta a medicamentos e terapias pode alterar um diagnóstico. Para tratar isso é necessário adaptar o RBC para englobar sequências de dados temporais (Brown et al 2018). Isto requer rever aspectos do algoritmo original e da estrutura de dados.

O projeto de que trata este texto tem como objetivo investigar esses requisitos e identificar métodos e extensões de CBR que melhorem sua adequação para aplicações em diagnóstico médico.

2 RACIOCÍNIO BASEADO EM CASOS

O elemento central do método RBC é o caso, que deve reunir toda informação relevante sobre um paciente e também uma indicação terapêutica, se o objetivo do sistema for aconselhamento. A parte essencial de um caso é o conjunto de atributos que retrata uma instância de um problema. Isto é ilustrado na Figura 1.

(3)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761

Figura 1. Estrutura básica de um caso.

O RBC requer uma métrica de similaridade para comparação entre casos; alguns exemplos comuns são distância Euclidiana e de Hamming, medida de contraste de Tversky, ou variantes de contagem ou razão entre atributos coincidentes (Liao et al. 1998). Além disso, a recuperação de informações da base normalmente emprega sistemas de indexação para agilizar a busca. Uma vez que uma das características do método é identificar casos semelhantes, é importante que a busca faça isso com eficiência; o método por excelência para tratar o problema são as árvores k-NN (Riesbeck e Schank, 1989). Uma vez identificado um caso na árvore k-NN, é possível rapidamente encontrar casos vizinhos mais próximos, segundo a métrica escolhida.

O método RBC original implementa um ciclo de 4 fases ilustradas na Figura 2; muito resumidamente, as fases são: (1) Recuperação: localiza casos com maior semelhança ao analisado; (2) Reuso: propõe uma solução a partir dos casos identificados e da entrada; (3) Revisão: verifica os resultados, possivelmente pela simulação de aplicação da solução; e (4) Retenção: armazena na base de dados novas conclusões obtidas.

Figura 2. Ciclo CBR, adaptado de (Riesbeck e Schank 1989).

Uma variante relativamente recente de RBC consiste em empregar lógica fuzzy para comparar casos (Lu et. al, 2016; Tanawong, 2017). Essa adaptação permite comparar dados qualitativos, sendo um exemplo prático disso os termos linguísticos usados em classificação de risco médico.

(4)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761 No RBC clássico, a informação de tempo pode aparecer como um atributo de um caso, mas há duas limitações. Primeiro, essa informação não tem um status especial; segundo, todos os casos tem a mesma estrutura, ou seja, são registros homogêneos de um banco de dados. Em sistemas de acompanhamento médico, as informações coletadas sobre cada paciente podem variar a cada consulta. Além disso, o espaçamento temporal entre esses dados é geralmente irregular.

2.1 ADAPTAÇÕES PARA TRATAR TEMPO

Existem ao menos duas formas gerais para arquivar casos: como vetores de atributo-valor; ou como estruturas, tendo como exemplos registros ou quadros (frames), objetos (Bergamann; Kolodner; Plaza, 2005), predicados, ou ainda estruturas hierárquicas (El-Sappagh e Elmogy, 2015). A escolha das formas de armazenamento encontradas em diferentes trabalhos se faz em torno de características de aplicação, de decisões de modelagem de dados, e questões relativas à eficiência de recuperação de dados.

O problema de medir a similaridade entre casos tem uma relação estreita com a definição de formato de armazenamento. Existem dois métodos gerais de comparação entre casos: um que poderia ser denominado superficial ou direto; e outro, estrutural (Mantaras et al, 2005). O primeiro pode ser empregado quando os casos são armazenados em estruturas homogêneas, como registros de comprimento fixo e com todos os campos preenchidos. O segundo se torna necessário quando a natureza da informação é mais complexa, correspondendo a situações como uso de estruturas hierárquicas, ou vetores atributo-valor em que dois casos não tem uma correspondência um para um.

No contexto da medicina, a comparação de histórico de pacientes requer em geral identificar semelhanças entre casos com registros que não dispõem das mesmas informações; isto é ilustrado na Figura 3. Nesse diagrama, a estrutura segue a proposta de Tecuci e Porter (2007) e destaca dados comuns que permitem agrupar casos iguais, e uma sequência de anotações ou episódios em que são registrados dados de evolução de cada indivíduo.

(5)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761

Figura 3. Ilustração de casos com dados diferentes.

Um exemplo básico de informação de contexto seria classificar pacientes quanto à doença, com a ressalva de que isso possa induzir erros ao desconsiderar características próprias de cada indivíduo (Loscalzo; Kohane; Barabasi, 2007). Já os episódios contem dados cuja amostragem pode ser irregular, sendo que métricas como distância euclidiana não oferecem uma resposta direta para achar similaridade nesse problema.

Encontram-se na literatura algumas abordagens para arquivar e recuperar casos suportando o conceito de histórico e formatos mais complexos de armazenagem. Em Sánchez-Marré (2005), conjunto de casos são agrupados em episódios; dado um caso de entrada, identificam-se casos similares na base de dados, e episódios que contenham tais casos. A variável tempo não é, entretanto, considerada explicitamente. Brown et. Al (2018) adotam a mesma estrutura de episódios; a similaridade é calculada usando uma soma ponderada de distâncias euclidianas. Os pesos da somatória são obtidos por um processo de mineração, e os dados omissos em um caso recebem um valor padrão de distância. Em outra abordagem, Schmidt e Gierl (2001) tratam parte do teste de similaridade de maneira algorítmica; para o contexto de doença renal, uma série temporal de diagnósticos de curto prazo classifica o quadro do paciente em diferentes “estados”; as sequências de estados geram “tendências” com diferentes escalas de tempo. Finalmente, um algoritmo percorre o espaço de estados para encontrar casamentos entre situações. Em Montani e Leonardi (2014) os casos são compostos por sequências de ações com etiquetas temporais; um exemplo são ações realizadas para tratar um paciente com infarto. Os casos são comparados usando uma variante da métrica de Levenshtein (Levenshtein 1966) que é bastante usada no casamento aproximado de

strings. A mesma estrutura geral é empregada por Lupiani et. al (2017) em um sistema que monitora

pessoas idosas e acidentes domésticos, utilizando uma métrica de similaridade para sequências de eventos (Mannila e Moen, 1999).

(6)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761

3 DISCUSSÃO E CONCLUSÕES

RBC é uma técnica aplicada com sucesso em vários domínios de conhecimento e conta com uma comunidade ativa de pesquisa. Seu uso em diagnóstico médico é uma alternativa a outros métodos de Inteligência Artificial, mas requer mudanças para tratar a dimensão tempo, presente nos dados que retratam a evolução clínica de um paciente. Há duas dificuldades principais nesse sentido. A primeira é rever a forma como um caso é arquivado, e em particular estruturas de dados adequadas para retratar atributos dependentes de tempo. A segunda é determinar métricas que consigam detectar a similaridade entre casos, e que consigam tratar registros heterogêneos ou hierarquias de informação.

Não existe uma metodologia consagrada para a modelagem de dados visando aplicação em RBC. Em razão da grande variabilidade de aplicações, parece mais provável que as técnicas já existentes de Engenharia de Software e Banco de Dados, tais como modelagem orientada a objetos e modelagem relacional, sejam as respostas mais indicadas para dar suporte a essa questão.

A definição de medidas de similaridade é um ponto central na implementação de RBC e requer considerar vários aspectos. Em primeiro lugar, tais medidas dependem do formato adotado para armazenamento. Isso varia caso a caso e também sofre interferência de lacunas nas informações. Um segundo aspecto importante, métricas têm impacto na eficiência da implementação. Enquanto no RBC tradicional a métrica pode ser a base para uma estrutura de indexação como uma árvore k-NN, em algumas situações no RBC temporal pode surgir uma noção de algoritmo (Schmidt; Gierl, 2001), que torna difícil ou talvez inviável definir índices para acelerar a busca na base de dados. Um terceiro ponto mais delicado, diz respeito ao domínio médico em si; ao sintetizar a comparação entre dois casos em medidas quantitativas, esbarra-se em sérias limitações em relação ao que acontece para comparar pacientes no mundo real. Alguns fatores incluem falta de dados relevantes na base de dados do sistema, a complexidade da percepção do paciente sobre suas sensações subjetivas, mudanças e evolução de entendimento sobre moléstias e seus diagnósticos, e inter-relações entre doenças, medicamentos e características físicas que podem mascarar e modificar parâmetros clínicos e outras informações.

Dada uma entrada e uma vez identificada semelhança com um caso ou conjunto de casos, é necessária uma avaliação do médico sobre essas informações antes de uma tomada de decisão. Esse passo inclui também a revisão dos casos e atualização da base de dados (Gu; Liang; Zhao, 2017), o que contrasta com aplicações mais simples de RBC que fazem a revisão e atualização de maneira completamente automatizada.

(7)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761 Concluindo, o modelo básico de RBC tem flexibilidade para acomodar diferentes necessidades de representação de informações no suporte ao diagnóstico médico. A literatura oferece perspectivas nesse sentido, embora ainda não hajam soluções consagradas. Por fim, como acontece com toda técnica automatizada nesse contexto, o processamento e uso de informações deve ser tratado com cautela em razão das fontes de incerteza.

REFERÊNCIAS

Adlassnig, K. P. Fuzzy set theory in medical diagnosis. IEEE Transactions on Systems, Man, and Cybernetics, v. 16, n. 2, p. 260–265, 1986.

Bergmann, Ralph, Janet Kolodner, and Enric Plaza. "Representation in case-based reasoning." The Knowledge Engineering Review 20, no. 3 (2005): 209-213.

Braga, A. V., Lins, A. F., Soares, L. S., Fleury, L., G., Carvalho, J. C., Prado, R. S. Machine learning: O Uso da Inteligência Artificial na Medicina. Brazilian Journal of Development, v. 5, n. 9, p. 16407-16413, 2019.

Brown D, Aldea A, Harrison R, Martin C, Bayley I. Temporal case-based reasoning for type 1 diabetes mellitus bolus insulin decision support. Artif Intell Med, v. 85, p. 28-42, 2018.

Combi, C; Shahar, Y. Temporal reasoning and temporal data maintenance in medicine: issues and challenges. Computers in biology and medicine, v. 27, n. 5, p. 353-368, 1997.

El-Sappagh, Shaker H., and Mohammed Elmogy. "Case based reasoning: case representation methodologies." International Journal of Advanced Computer Science and Applications 6.11 (2015): 192-208.

Feinstein, A. R. An analysis of diagnostic reasoning. I. The domains and disorders of clinical macrobiology. The Yale journal of biology and medicine, v. 46, n. 3. 1973.

Fox, J. Expert systems and theories of knowledge. In Artificial intelligence - Handbook of Perception and Cognition. Academic Press, p. 157-181, 1996.

Fraser, A. et al. Computer models in genetics. McGrawHill, New York, 1970.

Gu, D., Liang, C., Zhao, H. A case-based reasoning system based on weighted heterogeneous value distance metric for breast cancer diagnosis, Artificial intelligence in medicine, v. 77, pp 31-47, 2017.

Hampton, J. R. et al. Relative contributions of history-taking, physical examination, and laboratory investigation to diagnosis and management of medical outpatients. Br Med J, v. 2, n. 5969, p. 486– 489, 1975.

Ledley, R. S., Lusted, L. B. Reasoning foundations of medical diagnosis. Science, v. 130, p. 9-21. 1959.

(8)

Braz. J. of Develop.,Curitiba, v. 6, n. 10, p. 77608-77615, oct. 2020. ISSN 2525-8761 Levenshtein, Vladimir I. "Binary codes capable of correcting deletions, insertions, and reversals." Soviet physics doklady. Vol. 10. No. 8. 1966.

Liao, T. W., Zhang, Z., Mount, C. R. Similarity measures for retrieval in case-based reasoning systems. Applied Artificial Intelligence, v. 12, n. 4, p. 267-288, 1998.

Loscalzo, J., Kohane, I., & Barabasi, A. L. Human disease classification in the postgenomic era: a complex systems approach to human pathobiology. Molecular systems biology, v. 3, n. 1, 124, 2007, doi:10.1038/msb4100163.

Lu, J., Bai, D., Zhang, N., Yu, T., Zhang, X. Fuzzy case-based reasoning system. Applied Sciences, v. 6, n. 7, 2016.

Lupiani, E., Juarez, J. M., Palma, J., Marin, R. Monitoring elderly people at home with temporal case-based reasoning. Knowledge-Based Systems, v. 134, pp 116-134, 2017.

Mannila, H., Moen, P. Similarity between event types in sequences, in Googs, G., Hartmanis, J., van Leeuwen J. (Eds), Proceedings of the First International Conference on Data Warehousing and Knowledge Discovery, Springer, Berlin, Heidelberg, pp. 271-280, 1999.

Mantaras, R. L. et al. Retrieval, reuse, revision and retention in case-based reasoning. The Knowledge Engineering Review, v.20, n.3, p. 215-240, 2005.

Montani, S., Leonardi, G. Retrieval and clustering for supporting business process adjustment and analysis. Information Systems, v. 40, p. 128–141, 2014.

Riesbeck, C. K., Schank, R. C. Inside case-based reasoning. Psychology Press, 1989.

Sánchez-Marré, M., Cortés, U., Martínez, M., Comas, J., & Rodríguez-Roda, I. An approach for temporal case-based reasoning: Episode-based reasoning. In International Conference on Case-Based Reasoning, p. 465-476. Springer, Berlin, Heidelberg, 2005

Schmidt R, Gierl L. A prognostic model for temporal courses that combines temporal abstraction and case-based reasoning. Int J Med Inform. 74(2-4), p. 307-315, 2005.

Tanawong, T. Temporal fuzzy case-based reasoning retrieval. Chiang Mai Journal of Science, v. 44, n. 1, pp 267-278, 2017.

Tecuci, D. G., & Porter, B. W. A generic memory module for events. In Proceedings to the 20th Florida artificial intelligence research society conference (FLAIRS20), pp. 152–157, 2007.

Imagem

Figura 2. Ciclo CBR, adaptado de (Riesbeck e Schank 1989).
Figura 3. Ilustração de casos com dados diferentes.

Referências

Documentos relacionados

4.1 – Às pessoas portadoras de deficiência é assegurado o direito de inscrição no Teste Seletivo de que trata este Edi- tal, nos termos do Decreto Federal nº 3.298/99. 4.2 –

The microtensile bond strength of two PMMA acrylic resins used for the complete denture base was evaluated, one pre-polymerized used in CAD/CAM systems and another by

Inclui-se também alguns objetivos específicos pertinentes ao trabalho como realizar ensaios práticos de arquitetura no centro de Aracaju/SE; analisar o pensamento tipológico

Na carta reproduzida acima, podemos notar alguns indícios que nos conduzem a diversos aspectos da vida de Ismael Silva: as relações pessoais e profissionais

Na implementação do protótipo, foram desenvolvidas APIs para as seguintes partes: uma para a topologia de rede local, uma para topologia de rede da nuvem, quatro publicadores para

Apesar do enfoque privilegiado pelo Correio da Manhã reduzir a compreensão do levante paulista especificamente à sua interpretação – movimentação política –

centesimal para tr~s concentra,&es de sal no produto. 5) Secar a baixa temperatura e mediante convec,lo for,ada o produto resultante da prensagem com e sem

No terceiro capítulo nomeado como O Centro de Referência Especializado de Assistência Social em Sousa-PB e o Enfrentamento a Violência Contra Crianças e