• Nenhum resultado encontrado

A Linguística de Corpus (L.C.), enquanto metodologia, se encarrega “da coleta de dados e da exploração de corpora, ou conjunto de dados linguísticos textuais coletados criteriosamente, com o propósito de servirem para a pesquisa de uma língua ou variedade linguística” (BERBER SARDINHA 2004, p. 3, apud TEIXEIRA 2008, p.

151). Para a L.C. é necessário que os corpora coletados sejam formados por textos autênticos e naturais, ou seja, textos que não foram traduzidos a partir de outra língua e que não foram criados com o objetivo de serem analisados.

Com a coleta desses textos autênticos, a L.C. pode então analisar a ocorrência de vários padrões linguísticos de uma língua ou linguagem especializada. Teixeira descreve esses padrões ao introduzir e exemplificar três conceitos-base da L.C.

apresentados por Berber Sardinha (2004: 40):

colocação: associação entre itens lexicais (p. ex. “presunto”

co-ocorre com “fatiado” numa frequência maior do que com

“laminado”);

coligação: associação entre itens lexicais e gramaticais (p. ex.

“vá VERBO-GERÚNDIO aos poucos”, “vá juntando/

misturando/ acrescentando aos poucos”);

prosódia semântica: associação entre itens lexicais e conotação, que pode ser positiva, negativa ou neutra (p. ex.

“gorduroso”, associa-se sempre a contextos negativos em culinária) (TEIXEIRA 2008, p. 169).

28 Entretanto, para que a L.C. identifique esses padrões, é necessário usar ferramentas próprias de programas computacionais que fazem análises de corpora eletrônicos, tais como o AntConc (ANTHONY, 2014), utilizado neste trabalho.

A ferramenta mais conhecida da L.C. são as linhas de concordância, chamadas em inglês de concordance lines e de KWIC (Key Word in Context), que apresentam todas ocorrências de uma dada palavra acompanhada de seu contexto imediato, uma por linha, como mostra a figura a seguir.

Figura 1: Linhas de concordância para sugar no corpus do original Nerdy Nummies

A observação dessas linhas de concordância e do contexto imediato da palavra de busca (nódulo), à direita e à esquerda (que pode ser ordenado até a terceira palavra de cada lado, como mostra a Figura 2), permite a identificação dos referidos padrões.

Isto é, permite responder às perguntas que norteiam o trabalho em LC: quais são as palavras e/ou categorias / estruturas gramaticais que co-ocorrem com a palavra de busca

29 e qual é sua recorrência (frequência) no corpus? A que sentidos (positivos, negativos, neutros) esses padrões se associam, ou a que partes do texto (ingredientes, modo de fazer, por exemplo)? No texto especializado, esses padrões léxico-gramaticais são, na verdade, as unidades de tradução especializadas para as quais o tradutor necessitará estabelecer uma relação de equivalência com uma unidade de tradução na outra língua de trabalho.

Figura 2: Linhas de concordância para a palavra sugar alinhadas pelas 3 palavras à esquerda

A pesquisa de padrões relevantes em um determinado corpus parte da identificação de suas palavras-chave, que são as palavras cuja ocorrência no corpus de estudo, na comparação com um corpus de referência (geralmente de língua geral, quando se está tentando levantar o vocabulário específico de uma área especializada),

30 são estatisticamente significativas. Isto é, a probabilidade de aquelas palavras identificadas como chave ocorrerem num texto semelhante aos que compõem o corpus de estudo (por exemplo, um corpus de receitas culinárias) é estatisticamente maior do que a probabilidade de elas ocorrerem em um texto do corpus de referência (no exemplo dado aqui, um texto da língua geral). As Figuras 3 e 4 mostram, respectivamente, um exemplo de lista de palavras (wordlist) e lista de palavras-chave (keyword list) usando AntConc.

Figura 3: Lista de palavras do excerto do original Nerdy Nummies usado na tradução

31 Figura 4: Lista de palavras-chave do original usando um corpus de língua geral como

referência

A partir desta breve explicação, vejamos agora como a L.C. deve ser usada para realizar todas as tarefas de tradução e terminologia mencionadas anteriormente. Existem dois meios de se utilizar a L.C., como metodologia e como abordagem. Para o primeiro caso, ela é usada somente como uma ferramenta para fornecer exemplos e testar dados e hipótese de teorias diversas. Porém, quando é usada como abordagem, a L.C. fornece uma “visão da linguagem como probabilidade” (TEIXEIRA, 2008, pg. 154), ou seja, um texto passa a ser algo que não só fornece dados, mas também uma nova visão sobre como a língua funciona. Dessa perspectiva, a L.C. passa a ser usada para fazer a análise de tipologias textuais e dos padrões linguísticos e lexicais de um texto e, com isso, pode fornecer um novo olhar sobre a linguagem especializada e dados valiosos para a concepção de um dicionário que possa atender melhor às necessidades de produção textual do tradutor.

32 Um exemplo de uso da L.C. como abordagem para a criação de dicionários técnicos pode ser visto no Vocabulário para Culinária (TEIXEIRA e TAGNIN, 2008).

Esse é um glossário que foi compilado à luz da L.C. para ser um aliado do profissional da tradução e, portanto, é estruturado de modo a fornecer o máximo de informações possíveis sobre os padrões léxico-gramaticais encontrados em receitas, ajudando, assim, o tradutor nas várias dificuldades que ele possa ter ao longo de sua tradução.

Para elaborar um glossário baseado nessa abordagem da L.C., é necessário seguir uma série de etapas. Primeiramente devem ser selecionados textos autênticos da área específica, em ambas as línguas de trabalho, para criar dois corpora com uma quantidade de palavras suficiente para se obter dados concretos. A partir daí, faz-se uma seleção das palavras mais frequentes, por meio da wordlist, para então fazer um recorte das palavras-chave que são mais significantes na língua. Depois disso, é necessário fazer a busca dos padrões léxico-gramaticais recorrentes para separar as palavras principais de suas co-ocorrências. A partir disso, faz-se então a busca dos equivalentes para esse padrão no corpus da outra língua e assim podemos elaborar um glossário.

Assim, um dicionário ou glossário que é feito a partir dessa abordagem contém mais informações que os feitos de maneira convencional. Enquanto a maioria dos dicionários possui apenas as definições dos termos (substantivos e, com sorte, verbos) e suas traduções, um dicionário feito por meio dessa abordagem pode possuir contextos de uso, sequências maiores de palavras (padrões) que podem ou não conter “termos” (=

substantivos / verbos), fraseologias, verbos no qual o termo tem mais chances de ocorrer, etc.

Tendo apresentado as noções básicas das teorias nas quais me baseei para fazer minha tradução e compilar meu exemplo de glossário, na seção a seguir irei descrever a metodologia utilizada para a realização das várias etapas deste trabalho. O capítulo foi

33 subdividido em cinco tópicos que tratam, respectivamente, do preparo do original, do levantamento de termos, da identificação de equivalentes, da tradução em si e da finalização e complementação do glossário.

Documentos relacionados