• Nenhum resultado encontrado

A importância da Linguística de Corpus para o estudo do uso lingüístico

No documento reginaceliamartinssalomaobrodbeck (páginas 67-71)

ARGSTR ARG1 X EVSTR EV1 e

2.5 A importância da Linguística de Corpus para o estudo do uso lingüístico

A Linguística de Corpus, importante tendência emergente nos estudos contemporâneos da linguagem e crucial para a abordagem que pretendemos desenvolver, encontra uma boa representação de suas propostas em texto de divulgação no Brasil, de autoria de Berber Sardinha (2000). Nos termos endossados por este autor, define-se que

Corpus é um conjunto de dados linguísticos (pertencentes ao uso oral ou escrito da língua, ou a ambos), sistematizados segundo determinados critérios, suficientemente extensos em amplitude e profundidade, de maneira que sejam representativos da totalidade do uso linguístico ou de algum de seus âmbitos, dispostos de tal modo que possam ser processados por computador, com a finalidade de propiciar resultados vários e úteis para a descrição e análise’.19

A Linguística de Corpus propõe, então, a exploração da linguagem através de evidências empíricas, garantidas através de uma amostragem significativa de exemplos atestados, todos eles gerados por textos autênticos, isto é, fragmentos de usos da linguagem, produzidos por falantes nativos da língua em estudo.

O quadro conceitual que orienta o trabalho da Linguística de Corpus é definido, como aponta Sardinha (2000), por uma abordagem empirista e por uma visão da linguagem enquanto sistema probabilístico. A partir do empirismo, assume-se que o conhecimento se origina da experiência, o que implica, nesse caso, em “dar primazia aos dados provenientes da observação da linguagem, em geral reunidos sob a forma de um corpus.” (2000: 350).

A adoção de uma abordagem empirista para o trabalho de investigação e exploração da linguagem não exclui, absolutamente, a compreensão de que essa observação será muito melhor orientada se ela estiver moldada e combinada com o

19

estabelecimento de hipóteses antecipadas previamente ao trabalho de consulta e de análise dos dados. Entretanto, o empirismo será também inspiração importante para o caso de, não havendo dados significativamente relevantes para atestar a frequência da ocorrência em questão, decidir quanto à conformação, exclusão ou alteração das hipóteses em exame.

De todo modo, a adoção de abordagem baseada no empirismo minimiza, de muitos modos, os riscos inerentes às análises racionalistas dos fenômenos linguísticos, em que o conhecimento desses fenômenos provém de princípios estabelecidos a priori, de tal modo que as hipóteses previamente levantadas costumam ter suas confirmações distorcidas. Uma discussão freqüente em textos de linguística gerativa concerne à legitimidade dos exemplos, ou à divergência sobre a sua aceitabilidade.

A visão da linguagem como sistema probabilístico, que é o segundo pilar da Linguística de Corpus, também ajuda a enfrentar a tendência corrente, segundo a qual na linguagem tudo é possível - ou tudo é impossível. A linguagem tomada como possibilidade, tal como a coloca a linguística gerativa chomskyana (cf. KENNEDY, 1998), define a priori quais agrupamentos sintáticos são possíveis (i.e, bem-formados), dado o conhecimento que um falante nativo tem de sua língua; aqueles que não forem imediatamente reconhecidos como bem-formados ou que gerarem algum estranhamento para esse falante acabam sendo classificados como impossíveis, ou mal-formados, o que os exclui.ou os aloja em algum limbo lingüístico.

A adoção da visão da linguagem como um sistema probabilístico (segundo Sardinha, visão defendida por HALLIDAY 1991;1992;1993) permitirá que sejam efetivamente descritos todos os agrupamentos linguísticos gerados nos contextos de uso de uma comunidade, ao mesmo tempo em se deduzirá da frequência de sua ocorrência o estágio de consolidação gramatical em que um dado elemento do uso se encontra, ou a combinação em que ele é mais e menos recorrente.

A introdução do critério de frequência para a exploração dos fenômenos linguísticos é, certamente, uma contribuição muitíssimo importante para a hipótese sobre a gramática baseada- no- uso. Por um lado, a identificação da frequência de ocorrência de um elemento linguístico em contextos de uso exige que sejam simultaneamente identificados os contextos em que a comunidade de falantes usa tal elemento e os contextos em que dificilmente ele seria atestado.

Por outro lado, a identificação das diferenças de frequência entre os diversos traços dos elementos linguísticos permite compreender que essas diferenças não são aleatórias. O fato de que instanciações de Morrer de V, por exemplo, sejam mais frequentes do que instanciações de Morrer de N sugere possibilidades estruturais de ocorrência em contexto dessa Construção e estabelece restrições probabilísticas sobre a atração ou a rejeição a lexemas no slot variável da Construção Morrer de X, de tal modo que se possa predizer que morrer de trabalhar é muitíssimo mais previsível do que

morrer de aula.

Verifica-se, então, que a correlação entre a ocorrência de um Elemento, de um Traço ou de uma Construção e seus respectivos contextos de ocorrência é regular e não- aleatória, apontando, conforme pondera Sardinha (2000), para uma correlação entre características linguísticas e situacionais, ou seja, entre as formas e seus contextos de uso.

A identificação das regularidades, na Linguística de Corpus, não é, pois, um critério de discriminação e de exclusão, diferentemente do que seria assumido numa linguística de matriz chomskyana. Como a Linguística de Corpus não trabalha com princípios a priori, e como os dados que refletem o corpus são exemplos de produções autênticas de falantes nativos em diferentes contextos de uso da linguagem, as regularidades e recorrências atestadas na consulta dos corpora são apenas indicadores de qual elemento uma comunidade de fala usa muito, usa pouco ou não usa de jeito nenhum .

Mais do que isso, como há corpora organizados que permitem uma observação da evolução diacrônica dos diversos Elementos, Traços e Construções, a identificação de regularidades e recorrências nos diversos períodos históricos é crítica para o estudo dos processos de gramaticalização ou de lexicalização em uma língua.

Dessa forma, a inclusão da metodologia desenvolvida pela Linguística de Corpus para a investigação dos fenômenos linguísticos, tais como o fenômeno do desencontro na produção das expressões investigadas Chuva de N e Monte de N, permitirá que a análise seja confrontada em exemplos atestados de uso dessas Construções por falantes nativos do Português.

Especialmente para o caso do fenômeno do desencontro, sintático, semântico ou sintático-semântico, a Linguística de Corpus se coloca como uma base metodológica obrigatória. Em primeiro lugar, as Construções formadas a partir desse fenômeno já

seriam, por si mesmas, periféricas, dado que sua produção é um desvio no processo de harmonização esperado na combinação dos Traços do Núcleo e de seus Complementos. Em segundo lugar, em se aceitando que a língua pode, eventualmente, gerar Construções desarmônicas, a expectativa seria a de que essa produção fosse pouco frequente, correspondendo a criações momentâneas e individuais.

A comprovação da distribuição regular e recorrente de Construções desencontradas em exemplos atestados no uso dos falantes do Português constitui, assim, prova inequívoca de que Construções desencontradas são Construções do Português e que a sua análise demanda novo referencial teórico que possa tratar delas como um fenômeno produtivo na linguagem.

Esse capítulo apresentou as contribuições teóricas que fundamentam a investigação do fenômeno linguístico do desencontro em Construções usadas para a Quantificação de Nomes em Português. Dessa forma, as expressões Monte de X e

Chuva de X, objetos de nosso estudo, serão analisadas considerando-se que:

(i) Construções são pareamentos de forma e sentido que se assemelham a estruturas pré-existentes no sistema.

(ii) A combinação dos constituintes de uma Construção pode produzir estruturas aparentemente anômalas, resultado de uma combinação desarmoniosa entre os Traços do Núcleo e de seus complementos.

(iii) A unificação desarmoniosa pode ser pragmaticamente motivada por demandas de uma comunidade de fala, e ela é provocada pela evocação de uma nova cena de experiência pelo item lexical que é Núcleo dessa Construção.

(iv) A resolução do conflito nessa combinação é determinada pela Coerção que um dos elementos da Construção exercerá sobre os demais e que envolverá:

(iv.1) a modificação na estrutura de Qualia dos elementos unificados; e (iv.2) um rearranjo sintático na combinação desses elementos.

(v) A nova estrutura resultante desses processos corresponde a uma reanálise de estruturas já existentes, e ela será gramaticalizada ou lexicalizada se o uso a licenciar como estrutura regular e frequentemente recorrente.

No documento reginaceliamartinssalomaobrodbeck (páginas 67-71)