• Nenhum resultado encontrado

A importância da Linguística de Córpus no estudo das EM Conforme aponta Berber Sardinha (2004, p xvii), a Linguística

2 RESENHA DA LITERATURA

2.3 LINGUÍSTICA DE CÓRPUS E EXPRESSÕES MULTIPALAVRA Nesta seção, pretende-se abordar a Linguística de Córpus

2.3.1 A importância da Linguística de Córpus no estudo das EM Conforme aponta Berber Sardinha (2004, p xvii), a Linguística

de Córpus é uma área que trata do uso de córpus computadorizados, os quais compõem-se de textos coletados, escritos ou transcrições da fala, e são mantidos em arquivo de computador.

Para ele, a LC “questiona os paradigmas linguísticos e mostra novos caminhos para o linguista, o professor, o tradutor e o lexicógrafo, além de outros profissionais”, os quais certamente têm se beneficiado

5 Cotexto nesta pesquisa será utilizado sempre que se referir ao vem tanto à esquerda quanto à

direita da EM a qual a análise se refere; e contexto se refere ao próprio contexto semântico da língua em que a EM está inserida ao longo do córpus e dependendo do gênero textual onde aparece.

em seu árduo trabalho com a instrumentalização para os estudos das línguas proporcionados pela LC.

De acordo com Rocha (2007)

To a certain extent, corpora are now seen as essential by many researchers in these areas (linguistics fields) because insights provided by the analysis of a substantial amount of authentic data are hard – some would say impossible – to come by through other methods. (p. 9)

Levando em consideração esses aspectos da LC pode-se, por exemplo, observar padrões na língua como nesta pesquisa se verificará em relação às EM, ou ainda investigar os possíveis correspondentes em português e espanhol, assim como a frequência e a probabilidade com que tais itens lexicais ocorrem em ambas as línguas.

Um estudo não só como este apresenta relevância como instrumento auxiliar na tradução e na aprendizagem dessas línguas, mas também pode contribuir na composição de glossários e dicionários mais apropriados ao uso do falante-ouvinte e ou escritor-leitor, promovendo um círculo virtuoso de pesquisa–ensino–pesquisa–aprendizagem dentro e fora da sala de aula.

Por isso, segundo postula Rocha (2007, p. 17), a LC se apresenta como

[…] a progressive scientific research programme, in the sense that it predicts accurately that patterns detected in language corpora can be used effectively to explain language facts such as meaning, syntax and discourse relations.

Do ponto de vista deste autor, ao atrair o interesse de outras áreas percebe-se a LC em um estágio inicial, pois como não se trata de uma teoria específica, permite que outras abordagens possam desempenhar um papel em uma elaboração futuramente.

Assim, para Rocha(2007), pode-se imaginar uma fusão com uma ou mais dessas abordagens interativas ou um novo desenvolvimento baseado no uso das teorias. Isso poderia ser colocado em conexão com princípios de padrões e significados e com gramáticas tais como as funcionais, as cognitivas e as de construção.

Essa discussão vem corroborar a presente investigação acerca das EM, pois os primeiros estudos sobre elas vêm da área de Processamento

de Linguagem Natural (doravante PLN) e não dos Estudos do Léxico como seria de se esperar.

Outro aspecto ressaltado por esse autor é o apontado para a utilidade de tais estudos na elaboração de melhores dicionários e gramáticas, criando métodos de ensino de língua os quais melhorem a aprendizagem e construindo sistemas de computador mais apropriados, obtendo, assim, resultados de maior eficácia em atividades e envolvendo tecnologia de língua humana.

Tal perspectiva parece vir justamente a contribuir com o que já foi discutido quanto aos Estudos do Léxico e de Tradução debatidos nas subseções 3.1 e 3.2 desta pesquisa.

Ainda no tocante à LC, quanto aos enfoques sociais, culturais e cognitivos ressaltados por Rocha (2007), ele defende que “are likely to play a relevant role in determining observable features of a given translation product” (p. 29), pois se os estudos da tradução têm como suporte um córpus, podem se beneficiar quando levados em conta tais enfoques quanto à coleta de um córpus paralelo.6 Desse modo,

If one may think of córpus linguistics as a starting point for an approach to linguistic studies that incorporates the notion of situated cognition, it is only natural that córpus-based translation studies develop along similar lines. Ideally the development should eventually become a methodological standard and not be restricted to extraordinary events such as the translation of Harry Potter books.

6 Córpus (pl . corpora ) é o conjunto de grandes extensões de textos

autênticos preparados para a pesquisa lingüística informatizada. Córpus paralelo é um córpus composto de conjuntos de textos originais e sua tradução, denominados textos paralelos ou bitextos, os quais são segmentados e alinhados em pares correspondente s. Sua composição é bilíngüe, quando são alinhadas a língua fonte e uma língua estrangei ra; multilíngüe, quando ao lado da língua fonte aparecem as traduções para várias outras línguas. São unidirecionais, bidirecionais e mistos. Os primeiros oferecem os textos originais e sua tradução e permitem a análise das estratégias tradutórias da L1 para a L2; os bidirecionais se compõem de textos originais na L1 e sua tradução na L2 e de textos originais na L2 e sua tradução na L1, de modo a oportunizar o exame das equivalências em ambas as direções L1 para L2 e L2 para L1 (Frankenberg-Garcia, 2008).

Enfim, parece claro que a LC é de fundamental importância para a presente investigação. Entretanto, para melhor entender esta premissa, ainda se faz necessário destacar alguns aspectos apresentados por Rocha (2007) com relação ao trabalho com análise de probabilidade e frequência aqui encontradas.

Nessa abordagem, o autor alega dever a língua ser entendida como um sistema probabilístico o qual resulta na melhor escolha da palavra mais adequada a determinado contexto, também auxiliando nas probabilidades de essa palavra ser usada de modo metafórico. Para o autor, a partir dos padrões surgidos no córpus, é possível filtrar de forma probabilística as possíveis metáforas. Desse modo,

This would restrict candidates for metaphoric value to manageable proportions. The collocational principle and the notion of lexicogrammar may then interact with a concept of metaphor so as to process and interpret metaphors in a systematic way arguably integral to linguistic competence with a communicative slant. The variety of theoretical and methodological points covered in this issue is thus heartening in the sense that it may help provide a wider view of the research possibilities within córpus linguistics to those readers new to the field or working in a related area. This is likely to be useful for the development of a better understanding of córpus based approaches in linguistics, especially in Brazil, where scholars are often misled by incomplete “hearsay” descriptions of córpus linguistics. Once prejudice is cleared, one might predict a substantial increase in córpus-based research in the country, as more and more scholars make up their minds to give data a chance.(p.30)