4.1 VIS ˜ AO GERAL DO WORKFLOW DE PROCESSAMENTO DAS BULAS PROFIS-
4.1.3 Integrac¸˜ao com outras bases
4.1.3.1 Roteiro para identificac¸˜ao dos f´armacos
No t´opico “composic¸˜ao”, verificam-se dois tipos de substˆancias: (i) princ´ıpios ati- vos - PA; (ii) excipiente - EXP. Entende-se pelo princ´ıpio ativo o principal f´armaco utilizado na composic¸˜ao do medicamento, esse respons´avel pelo efeito farmacol´ogico do rem´edio. Os excipientes s˜ao substˆancias utilizadas como ve´ıculo para o princ´ıpio ativo (BIGUETTI; AN- DRADE, 2014). ´E poss´ıvel encontrar substˆancias que s˜ao f´armacos na lista de produtos excipi- entes, mas, em geral, essas substˆancias (por exemplo, farinha) n˜ao s˜ao f´armacos.
O roteiro de identificac¸˜ao de f´armacos foi desenvolvido para analisar o conte´udo do texto referente `a composic¸˜ao do medicamento para identificar aqueles que s˜ao princ´ıpio ativo ou excipiente. O Algoritmo 2 apresenta o pseudoc´odigo das etapas que o roteiro realiza para identificac¸˜ao dos f´armacos, que s˜ao: (i) leitura do conte´udo da composic¸˜ao do medicamento realizado pela quebra de linha do texto (\r\n); (ii) pesquisa por princ´ıpio ativo e excipiente de- terminada por respectivos termos que indicam a qual tipo o termo identificado ser´a vinculado; (iii) tratamento no termo encontrado para evitar retornar palavras que s˜ao utilizadas apenas na escrita do texto e n˜ao representam um f´armaco necessariamente; (iv) procurar o termo iden- tificado nas drogas da base DrugBank, traduc¸˜ao da droga e dos sinˆonimos para pesquisa nos
termos; e (v) criar arquivo texto com o mapeamento dos termos identificados com seus respec- tivos tipos e c´odigo identificador do DrugBank caso seja encontrado.
Figura 29 – Exemplo ilustrativo do resultado da identificac¸˜ao dos f´armacos no medi- camento Lotanol.
Fonte: Autoria pr´opria.
A Figura 29 apresenta um exemplo do processo de identificac¸˜ao de f´armacos realizada no t´opico composic¸˜ao do medicamento Lotanol, em que elenca-se todas as etapas realizadas. Destaca-se pela Figura 29 a presenc¸a do marcador =[COMP] em vermelho que indica o in´ıcio do texto referente `a composic¸˜ao da bula, em que todo o conte´udo ´e separado por meio das quebras de linhas (\r\n).
O roteiro desenvolvido realiza a leitura linha a linha at´e encontrar palavras que indicam in´ıcio de um pr´ıncipio ativo ou excipiente, que respectivamente est˜ao exemplicados na figura pela palavra “CONT ´EM” na cor azul e “EXCIPIENTES” na cor laranja, e limitados pelos ca- racteres “....” sombreado em amarelo, quando identificado um pr´ıncipio ativo, e para excipiente delimitado pelo conjunto de caracteres “:”, “,”, “\” e “E” apresentada na cor roxa. A Tabela 6 apresenta os padr˜oes encontrados por meio da an´alise realizada no texto das composic¸˜oes das bulas, respons´avel por identificar somente os termos referentes aos f´armacos.
Detalha-se pela Tabela 6 que a coluna respectiva a palavras quebras serve para encon- trar paramˆetros de recorte de conte´udo no texto, ou seja, tem a finalidade de encontrar palavras
Algoritmo 2:Algoritmo referente `as etapas do processo de identificac¸˜ao dos f´armacos. Entrada: Texto do t´opico composic¸˜ao da bula m´edica
Sa´ıda: Identificac¸˜ao dos termos referentes `a princ´ıpio ativo e excipiente
1 In´ıcio
2 textoComposicao← texto do t´opico composic¸˜ao identificado na bula;
3 linhas← textoComposicao dividido pelas quebras de linha (\r\n);
4 totalLinhas← quantidade de linhas divididas;
5 termos← lista com os termos identificados, separados pelas propriedades PA e EXP;
6 conter← lista: CONT ´EM e CONT ˆEM;
7 quebrasPA← lista: ..., . . . ., -;
8 quebraFimPA← valor: MG de;
9 encontrouPA← f also;//salva se encontrou princ´ıpio ativo
10 excipiente← lista: EXCIPIENTES, EXCIPIENTE, VE´ICULOS e VE´ICULO;
11 quebrasEX P← lista: ,, :, (, ), CADA, *, E, +;
12 quebraFimEX P← valor: CADA;
13 marcarEX P← f also;//salva para marcar excipiente
14 Para contadorLinha ← 1 at´e totalLinhas fac¸a
15 linha← linhas[contadorLinha];
16 indice← vari´avel utilizada para armazenar posic¸˜ao de recorte no texto;
17 se n˜ao encontrouPA ent˜ao
18 encontrouPA← verifica se algo da lista conter acha em linha;
19 encontrouEX P← se marcarEXP ou algo da lista excipiente acha em linha;
20 se encontrouPA ent˜ao
21 indice← posic¸˜ao da letra do item de quebrasPA acha em linha;
22 se indice > −1 e n˜ao encontrouEX P ent˜ao
23 linha← recorte do texto de linha na posic¸˜ao de indice;
24 tratar linha e salv´a-lo em lista termos com PA;
25 fim
26 se encontrouEX P ent˜ao
27 encontrouPA← f also;
28 indice← posic¸˜ao da letra do item quebrasEXP acha em linha;
29 se indice > −1 ent˜ao
30 marcarEX P← verdadeiro;
31 fim
32 fim
33 se indice == −1 e n˜ao PA em termos ent˜ao
34 valor← divide linha por , at´e quebraFimAP;
35 se encontrou valor ent˜ao
36 tratar valor e salv´a-lo em lista termos com PA;
37 fim
38 fim
39 fim
40 fim
41 leitura linha at´e quebraFimEX P e para salvar termos em lista termos com EXP;
42 pesquisa dos termos na base DrugBank para poss´ıvel vinculac¸˜ao entre bases;
43 Fim
44 Retorne termos;//termos identificados
Tabela 6 – Padr˜oes para identificar f´armacos nas bulas.
Tipo Palavras quebras Caracteres
Princ´ıpio ativo CONT ´EM, CONT ˆEM ..., . . . ., -, MG de
Excipiente
EXCIPIENTES, EXCIPIENTE, VE´ICULOS,
VE´ICULO
,, :, (, ), CADA, *, E, +
Fonte: Autoria pr´opria.
que aparecem antes do f´armaco. Encontrar o item da linha que apresenta algumas destas pa- lavras significa que ela poder´a ser princ´ıpio ativo ou se trata de um excipiente. J´a a coluna referente aos caracteres, s˜ao padr˜oes respons´aveis para verificar o fim do f´armaco e at´e mesmo divis˜ao de f´armacos que aparecem juntos em um item da lista.
Por fim, entende-se pela Figura 29 que os valores sombreados em cinza representam os termos identificados no texto como princ´ıpio ativo e excipente, desta maneira exclui-se palavras que n˜ao s˜ao necess´arias para identificac¸˜ao dos f´armacos na base DrugBank.