• Nenhum resultado encontrado

4. Extração e validação terminológica

4.2 Procedimentos de extração de candidatos a termo

Pretende-se extrair uma lista provisória de termos, realizada com base no teste de frequência.

A frequência é constituída por duas vertentes: ocorrência e repartição (L´Homme, 2004, p. 57), isto é, número de utilizações e partes do discurso que registam o uso. A identificação de UT é realizada em função do seu posicionamento e recorrência intratextual.

Para a avaliação dos itens de frequência, é utilizado um programa de tratamento automático, ferramenta de processamento computacional da língua natural. Nos últimos anos, observou-se a evolução da linguística docorpus, dados os vários recursos informáticos de tratamento de texto. Estes fatores facilitaram o acesso a um programa informático adequado.

O corpus foi processado por um programa de tratamento automático e estatístico, AntConc 3.2.4, recomendado para textos de dimensões médias.A automatização da pesquisa será aplicada principalmente à determinação da frequência, visto que o Regulamento é um corpus de dimensões pequenas, dentro do qual não é obrigatório o uso desoftwareespecífico para percorrer a informação, bem como é considerada prioritária a inteligência humana face à inteligência artificial na análise do discurso. A ferramenta satisfaz uma tarefa informatizada e rápida de extração de candidatos a termo que necessitam em seguida de testes secundários para velidação. Os candidatos a termo são extraídos segundoo fator frequência da ocorrência. Este atesta o nível de utilização. Este critério de seleção reflete o estatuto de termo pela sua importância na construção do texto.

Com base nos resultados indicados pela ferramenta de pesquisa, AntConc 3.2.4, é identificada a lista dos termos recorrentes, tal como se pode observar na seguinte figura.

41

Figura 4: Ilustração do fator ocorrência no tratamento automático do corpus.

Os dados devem ser comparados com a estatística da classificação: classificação temática, modelo indexação e modelo CDU, a fim de distinguir entre termos de especialidade da área jurídica ou científica. As formas linguísticas indicadas pela extração automática não respeitam restrições no que concerne ao eixo sintagmático, isto é, o software não identifica UT complexas. Os défices anteriores requerem um tratamento específico das unidades salientadas pela pesquisa geral.

Em seguida, procede-se ao confronto destes dados com a seleção individual das unidades da área científica. As UT compostas são igualmente submetidas à análise automática para estabelecer a ocorrência da forma sintagmática.

O procedimento escolhido é a análise de concordâncias, ou seja, conjunto de linhas que constroem o contexto de um termo central.

A concordance is a collection of the occurences of a word-form, each in its own textual environement. In its simples forms it is an index. Each word-form is indexed and a reference is given to the place of occurence in a text.

(Sinclair, 1991, p.32)

As concordâncias servem para a redução das dimensões do corpus pela visualização mais rápida e direta dos dados úteis para a análise. Estas são importantes na análise sintagmática da língua em uso.

Terminologia jurídica

42

Figura 5: Representação da concordância na ferramenta AntConc 3.2.4.

No exemplo acima apresentado é ilustrado o quadro da UT com alto nível de ocorrência: subproduto animal não destinado ao consumo humano.

A forma extensa permite a distinção intuitiva do caráter explícito do termo (“não destinado ao consumo humano” ±consumo humano). De acordo com Béjoint & Thoiron (1997, p. 199), trata-se de um termo semanticamente transparente, pela explicação dos traços concetuais através da designação. Esta é retomada por reformulação anafórica ou catafórica enquanto “subproduto animal”. O exemplo merece um comentário explicativo.

Pode-se interpretar que o discurso distingue uma categoria superior: “subproduto animal” e uma categoria inferior subproduto animal não destinado ao consumo humano. Trata-seaparentemente de uma expressão pleonástica (no segundo exemplo) que foi intencionalmente inserida na terminologia daSegurança dos alimentos, a fim de tornar o seu significado mais explícito. De facto, as concordâncias extraídas em AntConc 3.2.4 indicam que as duas expressões linguísticas remetem para o mesmo conceito. O termo “subproduto animal” é um sinónimo não descritor, enquanto o candidato a termo descritoré subproduto animal não destinado ao consumo humano. O termo, “subproduto animal” é utilizado pelo mesmo Regulamento enquanto não descritor para apoiar a fluidez discursiva, desde que é “enunciada” inicialmente a forma extensa, logo no título.

43

O raciocínio apresentado anteriormente édado a título de exemplo do tratamento individual dos dados considerados necessários após a verificação do fator ocorrência.Este tipo de investigação linguística e concetual é aplicada a outras unidadescuja formaparece contestável à primeira vista.

Em segundo lugar, é elaborado um quadro estatístico de hierarquização dos candidatos a termo segundo o teste de frequência da ocorrência.

Gráfico 1: Avaliação do fator frequência da ocorrência nos candidatos a termo.

O quadro indica a ocorrência dos candidatos a termo por ordem decrescente. A lista dos candidatos a termo comprova uma seleção homogénea de unidades alta ou reduzidamente representativas do ponto de vista da frequência.

No que respeita à segunda vertente, a repartição, trata-se da classificação dos candidatos a termo segundo a distribuição textual, definitória para o estatuto terminológico. O fator intratextual destacado é a composição do texto.

Os resultados indicam que os candidatos a termo surgem em partes diferentes do texto, isto é, no desenvolvimento ou em partes estruturais superiores, distinguindo, deste modo, um posicionamento central ou periférico no texto. São consideradas partes estruturais superiores: título do Regulamento, títulos com referência intertextual (títulos

0 50 100 150 200 250 Oco rr ê n ci as Candidatos a termo

QUADRO DE OCORRÊNCIA

44

de outros diplomas legais inseridos no corpus enquanto referências legislativas); elementos composicionais internos de tipo: Títulos, Subcapítulos, Secções, Artigos.

Gráfico 2: Síntese de candidatos a termo emrepartição central.

A fim de realizar a seleção dos candidatos a termo no domínio dos subprodutosanimais não destinados ao consumo humano, são consideradas imprescindíveis as repartições centrais no âmbito textual, validadas pelo teste anterior.

Destaca-se a concentração de candidatos a termo dentro de títulos intertextuais12, através da inserção de títulos de outros diplomas legais, facto que orienta a classificação e reatualiza a premissa que o conhecimento é implícito.

12Exemplo de títulos de outros diplomas legais dentro do Regulamento:

“Outros instrumentos legislativos que entraram em vigor após a aprovação do Regulamento (CE) n.o 178/2002 do Parlamento Europeu e do Conselho, de 28 de Janeiro de 2002, que determina os princípios e normas gerais da legislação alimentar, cria a Autoridade Europeia para a Segurança dos Alimentos e estabelece procedimentos em matéria de segurança dos géneros alimentícios(7) JO L 31 de 1.2.2002, p. 1. (7), nomeadamente o Regulamento (CE) n.o 852/2004 do Parlamento Europeu e do Conselho, de 29 de Abril de 2004, relativo à higiene dos géneros alimentícios(8) JO L 139 de 30.4.2004, p. 1. (8), o Regulamento (CE) n.o 853/2004 e o Regulamento (CE) n.o 183/2005 do Parlamento Europeu e do Conselho, de 12 de Janeiro de 2005, que estabelece requisitos de higiene dos alimentos para animais(9) JO L 35 de 8.2.2005, p. 1. (9), e dos quais o Regulamento (CE) n.o 1774/2002 é complementar, fazem recair a obrigação primária de cumprimento da legislação comunitária, no sentido de proteger a saúde pública e animal, dos operadores de empresas do sector alimentar e de alimentos para animais.”

Título texto Títulos intratextuais

Títulos Capítulos Seções Artigos 2

24

3

6 8

19

45

Em segundo lugar, salienta-se a preponderância de um elemento de composição interna, o artigo13, pelo qual são sintetizados elementos-chave do Regulamento comunitário. Logo, a designação dos artigos indica candidatos em posição superior.

Estes elementos cumprem a função metacomunicativa de hierarquização do conteúdo semântico total, chamados igualmente peritexto (Nord, 2005, p.111).

Por conseguinte, os resultados da análise da frequência revelam informações importantes sobre os candidatos a termo. Não obstante, considera-se que os dados obtidos requerem novos critérios de análise a fim de estabelece uma lista final de termos. Contudo, os candidatos a termo com alto índice de frequência são considerados prioritários na seleção final.

Por conseguinte, delimita-se uma lista preliminar que abrange aproximadamente 150 termos considerados aptos para integrar o quadro terminológico descritivo do domínio dos subprodutos animais não destinados ao consumo humano. Estes serão indicados no presente trabalho por uma grafia em itálico.

Documentos relacionados