• Nenhum resultado encontrado

Definição de Córpus e a descrição linguística com base em córpus eletrônico como ferramentas para o ensino e a

2 RESENHA DA LITERATURA

2.3 LINGUÍSTICA DE CÓRPUS E EXPRESSÕES MULTIPALAVRA Nesta seção, pretende-se abordar a Linguística de Córpus

2.3.5 Definição de Córpus e a descrição linguística com base em córpus eletrônico como ferramentas para o ensino e a

aprendizagem de límguas

Segundo Berber Sardinha (2004), nem toda a reunião de dados pode ser considerada córpus. Por exemplo, arquivo e biblioteca eletrônica seriam como outros agrupamentos de dados não, necessariamente, considerados córpus. Desse modo, segundo ele, córpus seria “uma parte da biblioteca eletrônica, construído a partir de um desenho explícito, com objetivos específicos”. (p. 29)

Assim, para esse autor, na definição de córpus — a fim de diferenciá-lo das demais compilações e ou agrupamentos de textos —, deveriam estar incluídos os seguintes aspectos: origem dos dados autêntica, finalidade de objeto de estudo linguístico, criteriosamente escolhido, de formatação legível, representatividade e vasto.

Em outras palavras, Berber Sardinha (2004) salienta os seguintes pré-requisitos para haver um córpus:

a) deve ser composto de textos autênticos (textos escritos por falantes nativos e não por aprendizes) e estar em linguagem natural (não sendo produzidos com o propósito de serem alvo de pesquisa linguística, nem criados em linguagem artificial); b) apresentar conteúdo criteriosamente escolhido (quando escritos

devem ser representativos de cada tipo textual, além de haver quantidade aceitável de cada um deles, sendo sua seleção aleatória, para não contaminar a coleta com variáveis indesejáveis);

c) e ser representativo de uma variedade linguística ou de um idioma.

Partington (1996), por sua vez, argumenta que os tipos de pesquisa com base em córpus costumam ser heterogêneos e, assim, apresenta uma descrição geral deles, listados alguns dos usos de cada um:

a) alguns estudos levariam em consideração estilo e autoria servindo para identificar diferentes características dos escritos de um autor, fazendo parte da Linguística Forense;

b) outros seriam os estudos diacrônicos cujos córpus resultariam de coleções de textos de múltiplos tipos e datados de diversos

períodos na história, bem como variados gêneros representantes dos mais diversificados campos sociais e profissionais;

c) outros também poderiam ser de natureza lexical, investigando a frequência das palavras e os sentidos de uma palavra em diferentes tipos de textos de línguas variadas, e seus padrões de combinações com outras palavras;

d) alguns outros, ainda, como os sintáticos, serviriam para verificar padrões de combinação de palavras em frases, sentenças e orações, usando córpus, ou investigando como uma palavra aparece em fraseologismos típicos.

Conforme este Partington(1996), também:

a) há os tipos textuais, cuja descrição pode acontecer por meio da tecnologia a qual parece facilitar o estudo de itens lexicais discretos e sentenças mais extensas na língua;

b) já os córpus de língua falada têm servido para estudos de pausas, repetições, não fluências, limites/fronteiras, respostas de canal de fundo e suavizadores, assim como para verificar como os falantes organizam seu discurso. Dessa forma, uma atenção é dada a como o estudo de córpus pode revelar as estratégias dos escritores para organização de textos.

Quanto aos Estudos de Tradução, quando se analisa um córpus, em duas ou mais línguas, contendo tipos de textos similares, há possibilidade de uma exploração desse para ser usado como uma fonte de informação linguística, semântica e pragmática, auxiliando no processo de tradução. Nos estudos de registro também é possível se utilizar um córpus para comparar diferentes variedades da mesma língua.,

Partington (1996) ainda acrescenta que na área da Lexicografia a partir da qual a pesquisa de córpus teve maior impacto na pedagogia da língua inglesa (cf. Cobuild Dictionary), há uma enorme riqueza de exemplos autênticos fornecidos pelo córpus permitindo aos compiladores de dicionários ter uma imagem mais acurada do uso e da frequência.

Quanto à abordagem do uso de córpus na pedagogia da língua, o autor aponta as vantagens para o aprendiz em trabalhar com o córpus, isso parece também corroborar o presente estudo das EM, a saber:

a) determinar padrões mais frequentes num domínio particular, enriquecer o conhecimento da língua;

b) trabalhar com amostras de dados autênticos;

c) no caso do professor, gerar materiais didáticos levando os alunos a se autogerirem na aquisição de regras gramaticais e regularidades através do reconhecimento de padrões na língua em uso revelados a partir do córpus.

Na economia, por exemplo, Partington aponta para o fato de que se deve ensinar ao aprendiz não nativo que palavras genéricas podem ser usadas de modo especial em um gênero em particular, bem como um vocabulário subtécnico pode ser usado para estabelecer conceitos de temas específicos por meio dos textos. Isso pode ser feito a partir de um córpus específico da área.

Partington (1996, p. 6), por fim, aponta que, para Johns (1991), a didática de língua, ao utilizar córpus, estimula o questionamento por parte do aprendiz, auxiliando-o a desenvolver a habilidade de reconhecer padrões na língua-alvo e formar generalizações.

O papel do professor, então, seria o de um coordenador da pesquisa desse aprendiz, isso também auxiliaria ambos a reavaliarem o lugar da gramática tanto nos processos de ensino como de aprendizagem de uma língua, trazendo à tona um novo modo de despertar a consciência gramatical do aprendiz.

Dessa forma, o papel do aprendiz, continua Partington, é mais ativo, pois ele se torna participante direto da construção de seu próprio arquivo de significados e usos, desenvolvendo estratégias de aprendizagem indutiva, capacitando o aprendiz a perceber similaridades e diferenças bem como da formação de hipótese e testagem.

Parece claro, então, conforme esses autores, que o córpus possa tanto servir de ferramenta de referência, da mesma forma como o dicionário, a gramática e a enciclopédia, mas também como hipertexto a ser navegado quando o usuário passa de um texto a outro e ocorre uma negociação a cada passo.

Quanto ao córpus como objeto de análise na presente investigação, acredita-se que a heterogeneidade prevalecerá, porque ela envolve a área dos Estudos do Léxico, por motivos os quais já foram explicitados na seção referente a esta área de estudo; Estudos de Tradução, por se tratar de um córpus bilíngue, conforme já foi abordado em seção subsequente a dos Estudos do Léxico; mas também aspectos lexicais, sintáticos e mesmo textuais, pois as EM são unidades léxicas

que coocorrem com determinada frequência nos textos e contextos do córpus.

E, muito embora, o uso de córpus em sala de aula não seja objeto direto desta pesquisa, o ensino de línguas pode vir a se beneficiar, mesmo indiretamente, desta investigação. Isso porque, segundo o que foi postulado pelos autores nesta subseção da Resenha da Literatura, podem ser aprimorados os instrumentos de análise de dados em atividades, as quais colocassem lado a lado línguas como o português e espanhol, investigando suas diferenças e semelhanças, bem como as possibilidades de tradução apresentadas.

Outro aspecto a ser ressaltado é quanto ao tamanho do córpus, pois para Partington (1996, p. 4), não há um tamanho padrão ideal, embora um córpus de língua falada tenda a ser menor do que um de língua escrita.

No caso da investigação acerca das EM, optou-se pela coleta de uma quantidade de dados significativa como se verá na metodologia, isso porque a frequência das ocorrências orientariam as pesquisas subsequentes realizadas a partir desse córpus.

Desse modo, optou-se, num primeiro momento, por um córpus de até 500 mil palavras a título de amostragem para depois ampliá-lo para 1 milhão de palavras, primando-se por uma maior precisão nos resultados das EM encontradas. Mais adiante isso será corroborado por Berber Sardinha (2004) que aponta o tamanho do córpus como fator de maior precisão nos resultados da pesquisa.