• Nenhum resultado encontrado

ORGANIZAÇÃO DO CONHECIMENTO

3.5 Experiências de interoperabilidade e mapeamentos entre Sistemas de Organização do Conhecimento

3.5.2 Unified Medical Language System: MetaMap

O Unified Medical Language System (UMLS) é um produto documentário da US National Library of Medicine e tem como objetivo o desenvolvimento de sistemas de computador que “se comportam como se entendessem a linguagem

da biomedicina e da saúde” (U.S. NATIONAL LIBRARY OF MEDICINE, 2009). O

UMLS produz e distribui bases de dados e ferramentas de software associadas os quais são destinados prioritariamente a desenvolvedores de sistemas que usam as bases de dados e as ferramentas para construir ou melhorar sistemas cujas funções são criar, processar, recuperar e integrar informações e dados da área da saúde e biomédica. As ferramentas associadas ajudam os desenvolvedores no uso e customização das bases de dados do UMLS em aplicações particulares. Para usar o UMLS é necessário solicitar uma licença a National Library of Medicine que estabelece todas as formas de uso dessa ferramenta. Somente cidadãos americanos podem descarregar os SOC que integram o UMLS, sendo

que para cidadãos de outras nacionalidades é permitida a consulta nas bases disponibilizadas mediante concessão da licença, válida por um ano.

O MetaMap é um programa desenvolvido pelo Dr. Alan (Lan) Aronson na National Library of Medicine cujo objetivo é identificar termos do Metatesuro do Unified Medical Language System em textos biomédicos. A ferramenta fundamenta- se em técnicas do processamento de linguagem natural (Natural Language System- NLP) e de linguística computacional. O MetaMap pode ser usado em aplicações referentes à recuperação da informação, à mineração de dados e à indexação por meio do Medical Text Indexer (MTI) da NLM o qual é usado para indexação semiautomática e automática de literatura biomédica na NLM (U.S. NATIONAL LIBRARY OF MEDICINE, 2014b).

O MetaMap mapeia textos em linguagem natural, com até 10.000 caracteres, no idioma inglês, o que o torna ideal para mapeamentos de termos para busca a partir do resumo do artigo, que por natureza, tem como objetivo trazer as informações mais importantes tratadas no texto. A página inicial traz um menu com seis categorias às quais dão acesso: à caixa de diálogo para inserção de termos ou bloco de texto, às formas de uso, às versões, tutoriais, aplicações, etc. Para usar o MetaMap deve-se clicar na subcategoria Use MetaMap Interactively a qual dá acesso ao espaço para submissão dos termos ou blocos de texto para identificação dos termos no Metatesauro. É possível selecionar as informações do resultado, como exemplo, mostrar ou não termos candidatos, mostrar sintaxe, mostrar SOC de origem, etc (U.S. NATIONAL LIBRARY OF MEDICINE, 2014).

Analisamos o MetaMap no que se refere à identificação das formas de mapeamento, organização dos resultados, assim como à consistência dos termos

mapeados por meio de submissão de um resumo60 de um artigo da área médica, em

inglês. A análise foi feita levando-se em consideração a coerência entre o texto

60 CHENG, K. et al. Biomechanical considerations in the design of high-flexion

total knee replacements. ScientificWorldJournal, Nova York, v. 2014, n. 205375, p1-6, 2014. .

submetido e os termos mapeados do ponto de vista semântico. A partir da análise foram feitas as seguintes observações:

Os termos mapeados pelo MetaMap são classificados em Meta Mapping e Meta Candidate, sendo que os Meta Mapping correspondem aos termos considerados adequados para determinada aplicação, ou seja, referem-se ao resultado final do mapeamento; e os Meta Candidates correspondem a termos que podem ser considerados aptos para determinada aplicação, ou seja, são resultados intermediários. Os Meta Candidates podem referir-se a derivações de um termo. O tutorial de uso do MetaMap observa que termos classificados como candidatos devem ser utilizados com cautela, somente quando os termos mapeados não satisfazerem as necessidades (U.S. NATIONAL LIBRARY OF MEDICINE, 2010).

Na primeira etapa, o MetaMap identifica as frases e orações do texto por meio de pontuação.

Na sequência, dentro de cada oração ou frase, as palavras ou termos são analisados individualmente ou de forma composta. O critério para estabelecer a forma composta é a separação por virgulas e/ou conjunções.

Cada termo mapeado é classificado com um tipo semântico do Metatesauro ou nas categorias conceito funcional, conceito qualitativo, conceito quantitativo, valor qualitativo, relacionamento funcional, entidade conceitual, conceito espacial. Não foram encontradas definições para esses conceitos no manual e no glossário UMLS, assim como na documentação do MetaMap, o que nos fez observar a amostra de termos do resultado do mapeamento do ponto de vista linguístico, para tentar compreender essas classificações. Dessa forma, verificou-se que verbos, advérbios, adjetivos, preposições, numerais e símbolos podem ser classificados nessas categorias e que um termo pode ser classificado em mais de uma categoria, como Total, na frase Total knee arthroplasty involves replacing the entire knee (...) que foi classificado como conceito qualitativo e conceito quantitativo.

Primeiro são apresentados os termos Meta Candidates com as respectivas classificações, e em seguida os termos Meta Mappings.

Termos com mais de uma palavra são mapeados de forma composta quando possível (caso exista o termo em um dos vocabulários fontes do metatesauro) e de forma individual, como podemos observar no mapeamento do termo Total knee arthroplasty, conforme exemplo adiante.

Em relação às classes gramaticais fizemos as seguintes identificações:

Artigos, advérbios e conjunções: não são mapeados, nem classificados. Ex: the entire knee joint, o the foi desprezado. Tippicaly, no início do resumo, foi mapeado, mas não classificado.

Verbos: podem ou não ser mapeados. Verbos de ligação como o Is por exemplo são mapeados, mas não classificados. Verbos na forma nominal são mapeados, transformados em substantivos e classificados, caso tenha a identificação do termo no Metatesauro.

Substantivos: são mapeados e transformados em verbos quando possível, como o Replacing para o qual foi sugerida a equivalência Replace.

Exemplo de mapeamento de frase de um resumo no MetaMap:

Processing 00000000.tx.2: Total knee arthroplasty (TKA) involves replacing the entire knee joint, both femoral and tibial surfaces, (…).

Phrase 1: "Total knee arthroplasty (TKA)" >>>>> Phrase total knee arthroplasty <<<<< Phrase >>>>>

Candidatos

Meta Candidates (Total=10; Excluded=0; Pruned=0; Remaining=10)

1000 total knee arthroplasty (Knee Replacement Arthroplasty (procedure)) [Therapeutic or Preventive Procedure]

Knee arthroplasty

1000 Total knee arthroplasty (Arthroplasty, knee, condyle and plateau; medial AND lateral compartments with or without patella resurfacing (total knee arthroplasty)) [Therapeutic or Preventive Procedure]

827 Arthroplasty [Therapeutic or Preventive Procedure] 827 Knee [Body Part, Organ, or Organ Component] 827 Knee (Knee joint) [Body Space or Junction]

827 % total (% of total) [Quantitative Concept] 827 Total [Qualitative Concept]

827 Knee (Entire knee region) [Body Location or Region] 827 Knee (Knee region structure) [Body Location or Region] Mapeamentos

Meta Mapping (1000):

1000 Total knee arthroplasty (Arthroplasty, knee, condyle and plateau; medial AND lateral compartments with or without patella resurfacing (total knee arthroplasty)) [Therapeutic or Preventive Procedure] Meta Mapping (1000):

1000 total knee arthroplasty (Knee Replacement Arthroplasty (procedure)) [Therapeutic or Preventive Procedure]

<<<<< Mappings

Phrase 2: "involves" >>>>> Phrase involves <<<<<

Phrase 3: "replacing" >>>>> Phrase replacing <<<<< Phrase >>>>> Candidatos

Meta Candidates (Total=2; Excluded=1; Pruned=0; Remaining=1) 1000 replacing (Replaced by) [Functional Concept]

966 E61 Replace [Idea or Concept] <<<<< Candidates >>>>> Mapeamentos

Meta Mapping (1000): 1000 replacing (Replaced by) [Functional Concept] <<<<< Mappings Phrase 4: "the entire knee joint," >>>>> Phrase entire knee joint <<<<< Phrase >>>>> Candidatos

Meta Candidates (Total=15; Excluded=1; Pruned=0; Remaining=14) 1000 Entire knee joint [Body Space or Junction] Knee joint 913 Entire joint [Body Space or Junction] Joint

901 Knee joint [Body Space or Junction] Knee 827 Joint (Joints) [Body Space or Junction]

827 Knee [Body Part, Organ, or Organ Component] 827 Joint, NOS (Articular system) [Body System]

827 Knee (Entire knee region) [Body Location or Region] 827 Joint (Joint Device Component) [Medical Device] 827 Knee (Knee region structure) [Body Location or Region] 771 E Articular [Functional Concept]

660 Entire [Quantitative Concept]

660 Entire (Whole) [Quantitative Concept] <<<<< Candidates >>>>>

Mapeamentos

Meta Mapping (1000):

1000 Entire knee joint [Body Space or Junction] <<<<< Mappings

Phrase 5: "both femoral" >>>>> Phrase femoral <<<<< Phrase >>>>> Candidates Meta Candidates (Total=1; Excluded=0; Pruned=0; Remaining=1)

1000 Femoral (Femur) [Body Part, Organ, or Organ Component] <<<<< Candidates Mapeamentos

Meta Mapping (1000): 1000 Femoral (Femur) [Body Part, Organ, or Organ Component] <<<<< Mappings

Phrase 6: "and" >>>>> Phrase <<<<<

Phrase 7: "tibial surfaces," >>>>> Phrase tibial surfaces <<<<< Phrase >>>>> Candidatos

Meta Candidates (Total=3; Excluded=0; Pruned=0; Remaining=3) 983 Tibial surface (Surface of tibia) [Body Location or Region] 827 Surface [Spatial Concept]

694 Tibial (Bone structure of tibia) [Body Part, Organ, or Organ Component] <<<<< Candidates >>>>>

Mapeamentos

Meta Mapping (983): 983 Tibial surface (Surface of tibia) [Body Location or Region]

Como podemos verificar, nem sempre o mapeamento da forma composta é consistente, como observamos no mapeamento dos termos both femoral e tibial surface na frase Total knee arthroplasty (TKA) involves replacing the entire knee joint, both femoral and tibial surfaces (...). Nesse caso, both femoral foi mapeado como termo candidato e somente femoral foi mapeado e classificado, o que está correto, pois both não pode ser considerado um termo de busca ou de indexação. Já o termo tibial surface foi mapeado corretamente para o terno surface of tíbia como resultado final. O correto seria o mapeamento dos termos tibial surface e femoral surface, entretanto como o mapeamento é feito de forma automática, o termo surface é associado somente a tibial, devido à proximidade de ambas a palavras e o uso da conjunção and, que é um dos fatores que determina os limites da significação.

Nas aplicações de busca e recuperação, considera-se o MetaMap bastante útil para os usuários finais da área da Saúde, pois a partir do resumo de um texto considerado significativo dentro de um domínio é possível obter bons resultados para mapeamento e seleção de termos para elaboração de estratégias de busca. Todavia, destaca-se que a saída dos resultados é bastante complexa, o que dificulta a leitura e a interpretação dos mesmos.

3.5.3 Projetos de interoperabilidade e mapeamento entre Sistemas de