• Nenhum resultado encontrado

corpora TERMOS

FICHA TERMINOLÓGICA DE TRABALHO

5. ANÁLISE DE DADOS

A análise da terminologia empregada para a descrição dos termos da área da Saúde é de extrema importância. Para propor definições e correspondentes tradutórios em Língua Inglesa para esses termos é preciso compreender a que se referem, precisamente nos contextos discursivos em que são empregados.

Determinar as propriedades sintático-semânticas de um termo circunscrito em seu ambiente textual corrobora com a ideia de que no escopo terminológico, uma das principais tendências que definem os textos como científicos (de especialidade) consiste justamente na possibilidade de redução do caráter polissêmico e, por extensão, dos fenômenos de ambiguidade decorrentes das relações entre significante/significado e referentes que geram efeitos polissêmicos. A pluralidade de significações consiste de processo geralmente gerado pelo fenômeno da economia linguística, mediante o qual se recorre à composições já existentes, para fazer referência a novas noções.

Um dos princípios para a instauração das línguas e das linguagens é justamente o princípio da economia. Ora, sem a reutilização das mesmas formas, seja no plano fônico (homófonos) ou no plano da escrita (homógrafos), seria impossível atribuir nomes. A sobreposição de formas para fazer referência a diferentes entidades desemboca na impossibilidade de estabelecimento de ligações biunívocas entre significante/significado e referente no escopo das diversas realidades com as quais todo usuário de uma língua experimenta.

Normalmente, em se considerando os termos circunscritos nos thesaurus, a definição de significações só será possível a partir da consideração do contexto. Sob esse prisma, devemos admitir que os estudos estatísticos se revestem de importância sobretudo para a definição das denotações de cada entrada, tanto no que concerne a dicionários de línguas de especialidade, quanto de dicionários ditos “gerais”. Todavia, as prospecções estatísticas realizadas sobre textos de determinado domínio científico por vezes parece desconsiderar que parte do léxico, assim como de perífrases, composições nominais e de noções decorrentes remetem aos usos ditos “gerais”, podendo ocasionar incoerências quando da estratificação das línguas de especialidade. Ora,

basta considerar o próprio campo da Saúde, no qual é esperado que termos como “doença” e “paciente” apresentem elevados percentuais de ocorrência nos textos. Note-se que ao considerar corpora representativos da língua de modo amplo é provável que ambas as palavras apresentem percentuais de ocorrência elevados. Eis, então, um importante argumento para que se recupere a importância de se atrelar os estudos quantitativos dedicados às línguas de especialidade, às pesquisas realizadas sobre a língua corrente. Parece ser prudente que a Linguística de Corpus estratifique terminologias por áreas de conhecimento, mas também que esteja apta a avaliar o caráter funcional desses mesmos termos no âmbito de usos não científicos.

As propriedades sintático-semânticas de nomes e verbos definem, em grande parte, seus empregos no âmbito pragmático e também instauram conceitos e as relações entre eles. Parece que os estudos terminológicos tendem, cada vez mais, a tornar a Lexicometria (quantitativo) como campo auxiliar e não como disciplina definidora da pertinência de uma entrada de dicionário, seja em se tratando de abordagens dedicadas à terminologia especializada em caráter mais amplo, seja em termos de pequenos glossários. Um dos argumentos concerne à necessidade de – após as prospecções quantitativas – se recorrer à verificação da pertinência – e validade – dos resultados dos estudos de cunho linguístico através da apreciação de especialistas da área estudada, cabendo tal tarefa à Lexicografia e à Linguística de Corpus em sentido amplo.

Naturalmente, o princípio da coarticulação, teoricamente desenvolvido por autores como Martinet (1973), sugere que a língua se ergue a partir de suas bases mínimas (os fonemas), para compor morfemas e, finalmente, entidades lexicais simples e compostas. Logo, não se trata, absolutamente, de supor – no escopo da presente tese – que o fato de abordar e investigar dados de natureza sintática e semântica seria suficiente para marcar postura que ultrapasse a pseudo aridez dos estudos quantitativos. Trata-se, explicitamente, de buscar mostrar a importância de se agregar métodos e metodologias de estudo com vistas a unir quantidade e qualidade.

Neste início de século os computadores destinados ao grande público, assim como os softwares comercializados em grande escala, ainda são incapazes de imitar o processamento cognitivo humano em termos de definição de significações (locais) e de sentidos textuais (gerais). Ademais, a língua e suas manifestações em forma de textos escritos ou orais constituem entidades complexas que se fundem com a

própria expressão do pensamento. Os estudiosos da linguagem, mesmo atuando sobre os textos, serão sempre convidados a tratar das relações entre formas fixadas (signos) e abstrações, antes de se referirem à entidades do universo dito “real”.

No caso da Linguística de Corpus, em um primeiro momento, se estará a tratar de sequências de caracteres identificáveis. Em um segundo momento, caberá considerar os atributos e propriedades linguísticas que as formas assumem no âmbito discursivo. Ademais, à exceção de palavras erguidas a partir de induções sonoras naturais, como é o caso de algumas onomatopeias, as relações entre signo e referente serão sempre de natureza arbitrária, cabendo tratá-la gramaticalmente. Em resumo, trata-se aqui de justificar minha decisão de dedicar um capítulo ao tratamento do léxico da especialidade que confira a meu trabalho um caráter funcional, que de forma ampla denomino “gramatical”.

Em sendo a língua e as linguagens meios para a troca de informações, para a exposição de estados e processos, a meu ver, não há como circunscrever a análise de componentes linguísticos com vistas à tradução sem considerar extensões que conduzam ao processamento de significações (locais) e sentidos (gerais). Eis, então, nesta breve introdução ao Capítulo V, algumas reflexões destinadas a suprir minhas preocupações ao propor um trabalho que possa, por um lado, interessar a intérpretes e tradutores, e, por outro lado, que tome por base os resultados obtidos à luz de processos metodológicos da Linguística de Corpus.

Finalmente, cabe destacar que minha ideia de língua remete-me à consciência de que se trata do conjunto de todos os textos que a compõem, ou seja, de textos passados, presentes e até projetados para o futuro (e.g. projeções científicas). À minha ótica, a língua apresenta algumas características inerentes, quais sejam:

(i) o princípio da economia que gera o fenômeno da polissemia e, por extensão, de ambiguidade;

(ii) número finito de unidades passíveis de gerar infinitas sentenças, base necessária à comunicação, implicando novamente o princípio da economia linguística;

(iii) a dialogia, segundo Bakhtin (1979) ou intertextualidade, segundo Kristeva (1974) e Barthes (1973), que faz com que a definição (i.e. denotações, conotações, exemplos, antônimos) ligada à entidade linguística discriminada se atualize em função de orientações que emanam de suas

circunscrições e afiliações – que caracterizam as ditas “línguas de especialidade”;

(iv) o caráter ideológico impresso nas línguas como definições mais amplas que se sobrepõem, por vezes, à questão das “línguas de especialidade”.

De modo geral, linguistas, intérpretes e tradutores consideram consensuais todas essas premissas amplamente consideradas por Saussure (1969), Chomsky (1975), Bakhtin (1979), Kristeva (1974), Barthes (1973), entre outros. Todavia, alguns deles, como Saussure, foram levados a considerar estados sincrônicos e diacrônicos como estratificações necessárias à definição do objeto da ciência linguística. Tais pressupostos teóricos nos levam a considerar que os textos de especialidade se firmam a partir de regras gerais. Em outras palavras, não há texto de especialidade que não esteja condicionado às regras da língua corrente. As línguas de especialidade, em verdade, se caracterizam por tendências, salvo no caso de línguas construídas, como o Esperanto, ou de linguagens informáticas ou criadas para espaços diegéticos específicos (e.g. dos quadrinhos). Logo, ampla parte de empregos lexicais da área da Saúde estão naturalmente registrados em dicionários não especializados dedicados à língua geral e corrente.

Como acima aludido, sabe-se, por exemplo, que o termo <PACIENTE>/patient nem sempre comporta o traço semântico de “um indivíduo que tem a virtude da paciência; conformado; resignado”(Michaelis). Em outros termos, a ativação de traços semânticos agrega sutilezas que fazem com que atribuições parciais se incorpore nas denotações lexicais do domínio estudado. O termo <PACIENTE> no campo da Área da Saúde passa a agregar traços que o revestem de características diferenciadas, induzindo à < Indivíduo sob tratamento ou cuidados médicos>.

Muito embora alguns termos cuja análise possa parecer desnecessária, tal suposição revela o caráter consubstancial que a língua adquire e que poderia, eventualmente, conduzir asserções como: “todo e qualquer intérprete ou tradutor sabe como se traduz a unidade lexical <PACIENTE>”. O <PACIENTE>, inserido no contexto discursivo da Área da Saúde pode, potencialmente, se caracterizar pela suposição de que está circunscrita em um ambiente medical em razão de exigência de observação, de estado alterado ou carente de cuidados médicos. Tal caracterização pode ocorrer por meio de processos metonímicos ou até

catafóricos e as evidências se revelam, por vezes, a partir de análises textuais.

Por se tratar aqui da busca pela aproximação do estudo terminológico estatístico da análise linguística com base em textos da Área da Saúde, na relação Inglês/Português com vistas à tradução, será concedida atenção especial a termos que contemplem a classe gramatical dos substantivos dentre os termos gerados, uma vez que se revelaram como os mais salientes. A análise dos dados consiste em trabalhar o material coletado, examinando algumas das principais tendências dos textos da área da Saúde, tal como padrões, relações e interferências.

De posse dos dados gerados pelo corpus BNC World, um corpus considerado de tamanho grande e geral em relação aos assuntos que envolve, em forma de tabela, iniciou-se a leitura de todas as lexias extraídas, selecionou-se as palavras-chave em evidência, considerando a frequência em que ocorrem e a sua relevância para a área da Saúde. Essa etapa foi realizada manualmente, selecionando-se os 500 termos mais frequentes, e isolando-se dessas as stop words (palavras de parada), consideradas desnecessárias na presente pesquisa. Apresentou-se, então, os termos patient, disease, gastric e treatment46, como destaque no

quesito frequência, sendo que o termo gastric, apesar de estar ligado à área da Saúde Geral, não é considerado aqui como de maior relevância para a área de Área da Saúde, foco deste estudo.

No exame das palavras-chave providas pelo sub-corpus BNC Med são destacadas as lexias patient(s), disease, treatment, group, cell(s), health, gastric, acid, results, care, studies, years, time, normal, age, increase(d,) general, clinical, high, data, tidos como imprescindí- veis ao desenvolvimento da pesquisa, e apresentadas aqui por ordem de frequência, podendo-se constatar o índice de frequência de cada um dos itens citados nas tabelas contidas no Apêndice A deste trabalho.

A tabela a seguir apresenta uma demonstração de como os termos foram gerados, por ordem de maior frequência dentro dos corpora em estudo, o número de ocorrências de cada termo, a porcentagem com que aparecem em relação ao corpus de referência, em ocorrências e também em porcentagem. Essas palavras servirão de base para a seleção de ter- mos específicos da área, por pertinência, além de atender ao estatuto lexical.