• Nenhum resultado encontrado

CAPÍTULO 5: O Glossário Terminológico: Metodologia de Elaboração e Produto Final

5.1 Os campos da ficha terminológica

Ao partir do seguinte ponto de vista:

―A ficha terminológica é um elemento de grande importância na organização de repertórios de terminologias e um dos itens fundamentais para a geração de um dicionário. Pode ser definida como um registro completo e organizado de informações referentes a um dado termo.‖ (KRIEGER; FINATTO, 2004. p. 136).

defini doze campos fundamentais para registro dos termos nas fichas terminológicas115, a saber:

 área;  subárea;  termo;  frequência;

 dados gramaticais (classe morfológica, gênero e número); ______________

114 O que chamo de glossário

corresponde à acepção defendida por Krieger e Finatto (2004, p. 51): ―repertório de unidades lexicais de uma especialidade com suas respectivas definições ou outras especificações sobre seus sentidos. É composto sem pretensão de exaustividade‖.

 base definicional116, com as respectivas fontes;  definição final;

 contexto;

 fonte do contexto;

 gênero ao qual pertence o contexto;  termos relacionados;

 especialista consultado.

Além desses, mais quatro foram incorporados, quando disponíveis:  abreviatura(s);

 variação (ões) terminológica(s) — concorrente linguística (do tipo morfológica, gráfica, sintática ou lexical), coocorrente (sinônimo) e competitiva (empréstimo na forma híbrida)117;

 nota;

 estatísticas de associação (quando se tratava de termos complexos).

A partir do preenchimento desses campos, concebi um modelo de microestrutura para as entradas, de modo que os verbetes pudessem agregar informações de natureza gramatical, conceitual e pragmática. São sobre os paradigmas mínimos e possíveis da microestrutura que teço explicações na seção 5.2.

______________ 116

A base definicional consiste em ―armazenar todos os excertos definitórios ou quaisquer contextos explicativos referentes aos termos, de forma a facilitar a redação da definição. Esses excertos são extraídos da bibliografia especializada disponível. É imprescindível armazenar essas informações, uma vez que: 1) somente com o preenchimento de um número suficiente de excertos definitórios é que a redação de uma definição pode ser iniciada; 2) a quantidade e qualidade de excertos devem ser suficientes para elucidar o redator das definições, uma vez que este não é um especialista da área-objeto (...)‖. (ALMEIDA et al., 2007, p. 411 e 412). Vale dizer que, para determinados termos, recorri a excertos definitórios que não constavam do corpus de estudo (para dados bilibligráficos, vide Fichas Terminológicas em Apêndice D).

117 Essas categorias foram identificadas com base na tipologia de variantes terminológicas proposta por

FAUSTICH (2001), em que concorrente linguística do tipo gráfica refere-se às formas possíveis de escrita do termo (tumor filoide maligno/tumor (F)filodes maligno*); concorrente linguística do tipo morfológica apresenta alternância nos formantes do termo (carcinoma lobular invasor/carcinoma lobular invasivo*); concorrente linguística do tipo sintática implica a substituição de dois ou mais itens lexicais que funcionam como predicativos no termo complexo por um só ou vice-versa (predicação reduzida ou expandida), formando uma mesma unidade terminológica (câncer de mama/câncer mamário*); concorrente linguística do tipo lexical prevê o apagamento de elemento(s) de predicação sem, contudo, perturbar o significado (linfadenectomia axilar seletiva/linfadenectomia seletiva*). Para os casos de coocorrência, têm-se os (para)sinônimos, propriamente (ressecção segmentar/setorectomia/lumpectomia*) e, nas situações de variantes competitivas, o empréstimo híbrido (core biópsia*). *exemplos extraídos do corpus de estudo (para descrição completa, vide Apêndice D).

Antes, todavia, creio ser oportuno expor o objetivo do último item, estatísticas de associação, que, como já explicado, foi aplicado apenas aos termos complexos.

5.1.1 Estatísticas de associação

A verificação de até que ponto a coocorrência entre as partes que compõem o termo complexo (isto é, entre nódulo e colocado118) não foi aleatória é do que tratam as estatísticas de associação.

Existem três medidas: razão observado/esperado, informação mútua (MI) e o escore T (T-

Score). Todas elas tomam por base a frequência do nódulo, do colocado e o tamanho do

corpus. Para calculá-las, utilizei a calculadora virtual disponível no site <http://lael.pucsp.br/corpora/association/calc.htm>, em que é necessário apenas informar o valor da frequência das palavras para que se efetue o cálculo.

A seguir, discorrei brevemente a respeito das especificidades e das fórmulas nas quais estão baseados os cálculos estatísticos de cada medida de associação.

5.1.1.1 Razão Observado/Esperado

Pela razão observado/esperado, é possível saber se o valor observado (quantas vezes as palavras ocorreram juntas) corresponde a quantas vezes seria esperado que elas coocorressem (valor esperado), conforme o tamanho do corpus. Nesta pesquisa, considerou-se que o(s) colocado(s) era(m) imediatamente consecutivo(s) ao nódulo (horizonte 0:1).

Assim, as fórmulas para esse tipo cálculo estatístico, segundo Berber Sardinha (2004, p. 201-3), são, para valor Observado:

O = f(n,c)/N,

em que O equivale ao observado; f (n,c), à frequência da ocorrência mútua do nódulo e do

colocado; e N, ao tamanho do corpus. Para valor Esperado, tem-se: ______________

118

Colocado(s) é/são a(s) palavra(s) que, estatisticamente, coocorrem com o nódulo (palavra de busca/pesquisa) tanto à direita quanto à esquerda deste.

E = f(n)/N * f(c)/N,

em que E corresponde ao Esperado; f(n), à frequência do nódulo no corpus (N); e f(c), à

frequência do colocado no corpus (N).

Por fim, o valor do que foi observado (O) é dividido pelo o que seria esperado (E): O/E

5.1.1.2 Informação Mútua (MI)

A segunda medida de associação, informação mútua (MI), não prevê, como a anterior, a direcionalidade do colocado, isto é, este pode estar tanto nas proximidades do nódulo quanto imediatamente antes ou posterior a ele.

Para que o resultado seja considerado satisfatório, é necessário que seja maior que 3, quando da aplicação da seguinte fórmula (BERBER SARDINHA, 2004, p. 204):

I = log2 O/E

em que I significa informação; log2, logaritmo na base 2; O, Observado; e, E, Esperado119.

5.1.1.3 Escore T (T-Score)

Ao levar em conta a posição de nódulo e colocado (0:1, nesta pesquisa), o escore T sugere que resultados maiores que 2 constituem associações não aleatórias entre palavras. A fórmula para o cálculo dos valores é (BERBER SARDINHA, 2004, p. 205):

T = (O – E) / (raiz quadrada de f(n,c)/N),

em que T é igual a T-score; O, a Observado; E, a Esperado; f (n,c), a frequência da ocorrência mútua do nódulo e do colocado; e N, a tamanho do corpus.

______________ 119

Optei pelo cálculo das três medidas, posto que cada uma aborda a questão da não- aleatoriedade entre nódulo e colocado de perspectivas diferentes. Desse modo, caso a associação entre nódulo e colocado não se comprovasse pela frequência (Escore T), seria comprovada pela preferência (Informação Mútua) e, em ambos os casos, a lexicalização do termo complexo pôde ser atestada.

5.2 A microestrutura por macroparadigmas

Pensando em conferir homogeneidade ao repertório, procurei obedecer a um programa de informações constantes em todos os verbetes que possibilitou a organização da microestrutura segundo os três macroparadigmas sugeridos por Barbosa (1990) apud Barros (2004, p. 157):

Verbete = [+ entrada + Enunciado Lexicográfico (+/- PI1, + PD, +/- PP, +/- PI2, ... PIn] em que:

Paradigma informacional = [categoria gramatical, gênero, número, conjugação, pronúncia, abreviações, homônimos, campo léxico-semântico e outros];

Paradigma definicional = [sema 1, sema 2.... sema n];

Paradigma pragmático = [classe contextual 1, classe contextual 2 ...classe contextual n].

Dessa forma, o enunciado terminológico de todos os verbetes abarca, no paradigma informacional, classe morfológica, gênero, termos relacionados, abreviaturas, variantes terminológicas e nota (estas três últimas somente quando se fez necessário).

No paradigma definicional, optei por distribuir a carga conceitual de acordo com a fórmula gênero próximo + diferenças específicas, segundo a qual, por gênero

próximo subentende-se um hiperônimo, que funciona como classificador lógico-conceitual e, por diferenças específicas, um hipônimo (um tipo do primeiro). Além disso, de acordo com cada grupo conceitual120, agreguei informações de caráter pragmático, independentemente da classe a que pertenciam (entidade, conjunto genérico, ação), tais como finalidade, indicação, localização, constituição, dados estatísticos e prognóstico, a fim de fundamentar, implicitamente, a relevância e a consequente seleção de tal entrada.

______________

120 Destaco que toda informação extra anexada à fórmula gênero próximo + diferenças específicas foi

sistematicamente incorporada a todas as entradas da mesma categoria.

Quadro 4: modelo de macroparadigmas para apresentação de verbete (BARBOSA, 1990 apud BARROS, 2004, p. 157).

Por exemplo: todos os tipos de carcinoma foram descritos via gênero próximo e diferença específica, com o acréscimo de dados sobre o prognóstico e frequência de ocorrência da respectiva enfermidade. Outro exemplo refere-se aos tipos de cirurgia e às formas de tratamento empregadas na (Onco)mastologia, às quais foram adicionadas informações sobre a finalidade do procedimento. Isso porque optei por oferecer uma descrição funcional do conceito, como propõe Bèjoint, 1997, apud Barros, 2004, pág. 173-4:

―[...] em terminologia não se trata apenas de delimitar o conceito de uma maneira clara, de procurar a fórmula mais econômica, mas também de fornecer ao leitor os elementos que podem ser úteis em um determinado contexto. [...] a definição não pode ater-se aos traços centrais que constituiriam a condição necessária e suficiente para a identificação do conceito; alguns traços, ainda que não façam parte da definição stricto sensu, devem figurar, pois são úteis seja para a compreensão do conceito, seja para a manipulação em discurso do termo que o designa, seja para ambos.‖

Quanto ao paradigma pragmático, nele há exemplo de contexto de uso do termo em questão, assim como do gênero ao qual pertence e da fonte de onde foi extraído121.

5.3 A macroestrutura

Nesta seção do glossário, será apresentado o objetivo que fundamenta a concepção da obra como referência de pesquisa para jornalistas científicos.

Na sequência, exponho como foram organizados cada um dos campos que compõem a microestrutura e, abaixo, na seção 5.4, apresento formalmente o produto final.

5.4 O glossário: Termos de (Onco)mastologia: uma abordagem mediada por