• Nenhum resultado encontrado

Levantamento terminológico mediante o uso da ferramenta Corpógrafo V4

5. Processo de tradução dos artigos de revisão selecionados

5.1 Levantamento terminológico mediante o uso da ferramenta Corpógrafo V4

O levantamento terminológico atinente ao D-LAL enquadra-se no processo de preparação e de pré-tradução e teve como objetivo a familiarização com a terminologia relacionada com a doença.

Deste modo, e esclarecendo sucintamente as funcionalidades desta ferramenta e recorrendo à informação presente no tutorial escrito por Pinto (2006), que consta no site do Corpógrafo, esta é uma plataforma online cujo objetivo visa a análise de corpora, de forma a gerar recursos linguísticos num suporte informático. Encontrando-se esta ferramenta potencializada para a pesquisa terminológica, uma vez que inclui técnicas diferentes de extração terminológica, bem como integra a viabilidade de organização destes conteúdos em bases de dados.

Em adição, importa relevar que esta ferramenta insere algumas das funcionalidades também oferecidas pelo software AntConc, outra ferramenta também usada neste projeto, cuja finalidade também foi a de familiarização com a terminologia, mas, neste caso, de forma mais aprofundada, como veremos mais à frente. Assim, de forma breve, e no que concerne às funcionalidades que foram alvo de uso na ferramenta AntConc, o Corpógrafo também possibilita a pesquisa de expressões regulares, o estudo de N-gramas e permite a visualização da concordância modo KWIC (KeyWord In Context). Estas funcionalidades encontram-se descritas com mais detalhe no tópico seguinte, concernente às metodologias de análise do AntConc e não se inserem aqui, uma vez que no Corpógrafo foram apenas organizados os corpora e extraída a terminologia presente nos mesmos, dado que estes são constituídos por artigos científicos atinentes ao D-LAL.

Posto isto, o corpus analisado possui aproximadamente 89 989 palavras (tokens), designadas como “átomos” no Corpógrafo, e incorpora 22 artigos científicos sobre a doença escritos em português, português norma brasileira, inglês e francês. A inclusão de artigos em francês visou a facilitação na formulação em português dos termos da linguagem especializada, uma vez que esta língua se assemelha mais ao português do que a língua inglesa (por exemplo, em inglês temos lysosomal storage disease, em francês maladie de surcharge lysosomale, aproximando-se o francês do português “doença lisossomal de sobrecarga”, etc.), o que por vezes acaba por facilitar também em termos do volume da

56

informação que se encontra ao realizar uma pesquisa em francês, comparativamente com o menor volume de informação apresentada em português europeu mais a agravante de se tratar de uma doença rara. Foi também considerada relevante, de acordo com esta ótica, a leitura e a familiarização com alguns dos termos especializados na língua francesa.

Destes 22 artigos científicos, encontram-se escritos em inglês sete artigos primários, sete artigos secundários e outros quatro artigos que pertencem a outras tipologias de artigo científico, sendo que dois se inserem no tipo editorial, um na tipologia de comentário e um outro que nomeia o seu tipo como sendo um “consensus statement”. Consta em português um artigo de revisão e também um artigo primário escrito em português de norma brasileira. Por fim, encontram-se em francês dois artigos científicos que, pela sua estrutura, apontam incluir-se na tipologia de artigo secundário e primário, sendo que este último se encontra possivelmente inserido na categoria de ensaio pictórico.

Passando à pesquisa em si, e no que concerne aos possíveis candidatos a ter lugar no levantamento terminológico sugeridos pelo Corpógrafo, na primeira pesquisa realizada, cuja sequência de palavras selecionada foi a mínima de uma palavra, a ferramenta sugeriu 11 372 candidatos dos quais foram percorridos 3000 e selecionados 226. O percorrer destes 3000 candidatos baseou-se apenas no facto de que ao chegar a este número foi apenas selecionado um termo da listagem dos 200 candidatos de cada vez, que o Corpógrafo apresenta para a devida seleção até chegar ao número total dos candidatos sugeridos. Fator este que facilita muito a tarefa de seleção, pois lidamos com uma listagem de 200 candidatos de cada vez, fornecidos por páginas, ao invés de encontrarmos uma barra de deslocamento contínua, que dificultaria o retorno à seleção dos candidatos.

Já na segunda pesquisa, que visou a seleção de uma sequência de duas palavras, o Corpógrafo sugeriu 32 751 termos compostos, dos quais foram selecionados 134 ao percorrer igualmente 3000 possíveis candidatos.

Quanto à terceira pesquisa realizada com uma sequência de 3 palavras selecionadas, a ferramenta sugeriu 41 560 candidatos, tendo sido percorridos, neste caso, 2000, uma vez que, por cada página de 200, o máximo de candidatos selecionados foram nove e o mínimo dois. Contabilizando a terceira pesquisa um total de 35 termos selecionados.

57

Referentemente à quarta pesquisa, que incluiu uma sequência de quatro palavras, o número de candidatos sugeridos foi de 40 105, tendo sido percorridos 1000 candidatos, quer devido aos motivos anteriores, como também devido à exigência da pesquisa, dada a sequência selecionada, o mínimo de seleção por página foi de apenas um candidato, tendo sido selecionados ao todo 29 candidatos.

Figura 3- Captura de ecrã da ferramenta Corpógrafo referente à quarta pesquisa.

Por fim, e relativamente à última pesquisa com uma sequência de cinco palavras, o Corpógrafo sugeriu 35 870 candidatos, dos quais também foram percorridos 1000 e também selecionados 29.

58

Apresentando a base de dados terminológica, antes da devida organização e “limpeza” (de repetições, por exemplo) 453 termos, encontrando-se, no levantamento final, 396.

No que concerne à “limpeza”, foram removidas algumas repetições e candidatos como “lenzyme” e “genzyme”, este último caso referente ao nome de uma empresa norte-americana operante na área da biotecnologia farmacêutica. Quanto às repetições, foram eliminados, por exemplo, candidatos como “enzyme replacement”, uma vez que já se encontrava presente “enzyme replacement therapy” à semelhança da remoção de “epigastric” em detrimento da presença de “epigastric pain”. Quanto às repetições que permaneceram no levantamento, estas são provenientes das diferentes grafias do inglês encontrando-se presentes termos

como: “dyslipidemia” e “dyslipidaemia”; “hypercholesterolemia” e

“hypercholesterolaemia”; “mucopolysaccharidoses” e “mucopolysaccharidosis”;

“hypertriglyceridemia” e “hypertriglyceridaemia”; “leucocytes” e “leukocytes”, etc. Sendo as repetições também provenientes da presença dos mesmos termos em diferentes línguas, clarificando-se, assim, que cada entrada no levantamento não concerne a um novo termo. Adicionalmente, e para finalizar, importa mencionar que as diferentes grafias do inglês foram mantidas numa ótica de reaproveitamento posterior para a inserção numa memória de tradução, por exemplo, para que, independentemente da grafia usada, o software possa apresentar sempre resultados.

59