• Nenhum resultado encontrado

Roteiro para identificac¸˜ao dos f´armacos

4.1 VIS ˜ AO GERAL DO WORKFLOW DE PROCESSAMENTO DAS BULAS PROFIS-

4.1.3 Integrac¸˜ao com outras bases

4.1.3.1 Roteiro para identificac¸˜ao dos f´armacos

No t´opico “composic¸˜ao”, verificam-se dois tipos de substˆancias: (i) princ´ıpios ati- vos - PA; (ii) excipiente - EXP. Entende-se pelo princ´ıpio ativo o principal f´armaco utilizado na composic¸˜ao do medicamento, esse respons´avel pelo efeito farmacol´ogico do rem´edio. Os excipientes s˜ao substˆancias utilizadas como ve´ıculo para o princ´ıpio ativo (BIGUETTI; AN- DRADE, 2014). ´E poss´ıvel encontrar substˆancias que s˜ao f´armacos na lista de produtos excipi- entes, mas, em geral, essas substˆancias (por exemplo, farinha) n˜ao s˜ao f´armacos.

O roteiro de identificac¸˜ao de f´armacos foi desenvolvido para analisar o conte´udo do texto referente `a composic¸˜ao do medicamento para identificar aqueles que s˜ao princ´ıpio ativo ou excipiente. O Algoritmo 2 apresenta o pseudoc´odigo das etapas que o roteiro realiza para identificac¸˜ao dos f´armacos, que s˜ao: (i) leitura do conte´udo da composic¸˜ao do medicamento realizado pela quebra de linha do texto (\r\n); (ii) pesquisa por princ´ıpio ativo e excipiente de- terminada por respectivos termos que indicam a qual tipo o termo identificado ser´a vinculado; (iii) tratamento no termo encontrado para evitar retornar palavras que s˜ao utilizadas apenas na escrita do texto e n˜ao representam um f´armaco necessariamente; (iv) procurar o termo iden- tificado nas drogas da base DrugBank, traduc¸˜ao da droga e dos sinˆonimos para pesquisa nos

termos; e (v) criar arquivo texto com o mapeamento dos termos identificados com seus respec- tivos tipos e c´odigo identificador do DrugBank caso seja encontrado.

Figura 29 – Exemplo ilustrativo do resultado da identificac¸˜ao dos f´armacos no medi- camento Lotanol.

Fonte: Autoria pr´opria.

A Figura 29 apresenta um exemplo do processo de identificac¸˜ao de f´armacos realizada no t´opico composic¸˜ao do medicamento Lotanol, em que elenca-se todas as etapas realizadas. Destaca-se pela Figura 29 a presenc¸a do marcador =[COMP] em vermelho que indica o in´ıcio do texto referente `a composic¸˜ao da bula, em que todo o conte´udo ´e separado por meio das quebras de linhas (\r\n).

O roteiro desenvolvido realiza a leitura linha a linha at´e encontrar palavras que indicam in´ıcio de um pr´ıncipio ativo ou excipiente, que respectivamente est˜ao exemplicados na figura pela palavra “CONT ´EM” na cor azul e “EXCIPIENTES” na cor laranja, e limitados pelos ca- racteres “....” sombreado em amarelo, quando identificado um pr´ıncipio ativo, e para excipiente delimitado pelo conjunto de caracteres “:”, “,”, “\” e “E” apresentada na cor roxa. A Tabela 6 apresenta os padr˜oes encontrados por meio da an´alise realizada no texto das composic¸˜oes das bulas, respons´avel por identificar somente os termos referentes aos f´armacos.

Detalha-se pela Tabela 6 que a coluna respectiva a palavras quebras serve para encon- trar paramˆetros de recorte de conte´udo no texto, ou seja, tem a finalidade de encontrar palavras

Algoritmo 2:Algoritmo referente `as etapas do processo de identificac¸˜ao dos f´armacos. Entrada: Texto do t´opico composic¸˜ao da bula m´edica

Sa´ıda: Identificac¸˜ao dos termos referentes `a princ´ıpio ativo e excipiente

1 In´ıcio

2 textoComposicao← texto do t´opico composic¸˜ao identificado na bula;

3 linhas← textoComposicao dividido pelas quebras de linha (\r\n);

4 totalLinhas← quantidade de linhas divididas;

5 termos← lista com os termos identificados, separados pelas propriedades PA e EXP;

6 conter← lista: CONT ´EM e CONT ˆEM;

7 quebrasPA← lista: ..., . . . ., -;

8 quebraFimPA← valor: MG de;

9 encontrouPA← f also;//salva se encontrou princ´ıpio ativo

10 excipiente← lista: EXCIPIENTES, EXCIPIENTE, VE´ICULOS e VE´ICULO;

11 quebrasEX P← lista: ,, :, (, ), CADA, *, E, +;

12 quebraFimEX P← valor: CADA;

13 marcarEX P← f also;//salva para marcar excipiente

14 Para contadorLinha ← 1 at´e totalLinhas fac¸a

15 linha← linhas[contadorLinha];

16 indice← vari´avel utilizada para armazenar posic¸˜ao de recorte no texto;

17 se n˜ao encontrouPA ent˜ao

18 encontrouPA← verifica se algo da lista conter acha em linha;

19 encontrouEX P← se marcarEXP ou algo da lista excipiente acha em linha;

20 se encontrouPA ent˜ao

21 indice← posic¸˜ao da letra do item de quebrasPA acha em linha;

22 se indice > −1 e n˜ao encontrouEX P ent˜ao

23 linha← recorte do texto de linha na posic¸˜ao de indice;

24 tratar linha e salv´a-lo em lista termos com PA;

25 fim

26 se encontrouEX P ent˜ao

27 encontrouPA← f also;

28 indice← posic¸˜ao da letra do item quebrasEXP acha em linha;

29 se indice > −1 ent˜ao

30 marcarEX P← verdadeiro;

31 fim

32 fim

33 se indice == −1 e n˜ao PA em termos ent˜ao

34 valor← divide linha por , at´e quebraFimAP;

35 se encontrou valor ent˜ao

36 tratar valor e salv´a-lo em lista termos com PA;

37 fim

38 fim

39 fim

40 fim

41 leitura linha at´e quebraFimEX P e para salvar termos em lista termos com EXP;

42 pesquisa dos termos na base DrugBank para poss´ıvel vinculac¸˜ao entre bases;

43 Fim

44 Retorne termos;//termos identificados

Tabela 6 – Padr˜oes para identificar f´armacos nas bulas.

Tipo Palavras quebras Caracteres

Princ´ıpio ativo CONT ´EM, CONT ˆEM ..., . . . ., -, MG de

Excipiente

EXCIPIENTES, EXCIPIENTE, VE´ICULOS,

VE´ICULO

,, :, (, ), CADA, *, E, +

Fonte: Autoria pr´opria.

que aparecem antes do f´armaco. Encontrar o item da linha que apresenta algumas destas pa- lavras significa que ela poder´a ser princ´ıpio ativo ou se trata de um excipiente. J´a a coluna referente aos caracteres, s˜ao padr˜oes respons´aveis para verificar o fim do f´armaco e at´e mesmo divis˜ao de f´armacos que aparecem juntos em um item da lista.

Por fim, entende-se pela Figura 29 que os valores sombreados em cinza representam os termos identificados no texto como princ´ıpio ativo e excipente, desta maneira exclui-se palavras que n˜ao s˜ao necess´arias para identificac¸˜ao dos f´armacos na base DrugBank.