• Nenhum resultado encontrado

CAPÍTULO I CÓRPUS E METODOLOGIA DA PESQUISA

1.2 Metodologia de Abordagem ao Córpus

1.2.1 Repetições de Vocábulos: Parâmetros

No processo de delineamento da metodologia da pesquisa, logo de início, fez-se necessário refletir quanto ao que a pesquisa entendia por repetição de vocábulos, pois diferentemente da sinonímia que, na vasta literatura a respeito, é atrelada à questão da semântica, a repetição de vocábulos pode envolver a semântica, a ortografia e, até, a fonologia deles. Até o ponto que se pesquisou, foi encontrada uma série de textos voltados aos estudos das repetições de vocábulos dentro dos estudos da retórica, mas nenhum que as abordasse sob o viés do Pressuposto e da

34

Hipótese da Pesquisa. Marcuschi, por exemplo, as define como "produção de segmentos discursivos idênticos ou semelhantes duas ou mais vezes no âmbito do um mesmo evento comunicativo" (MARCHSCHI, 1992 p.6 apud LOPES, 2009), sem, no entanto, importar “o tamanho do segmento repetido, ou se o que se repete é o mesmo conteúdo, a mesma forma ou ambos.” (LOPES, 2009). Entretanto, esta concepção de repetição não atendia às necessidades da pesquisa, pois: (1) Marcuschi (1992, p.263) aborda as repetições de vocábulos como estratégias discursivas, enquanto que a Hipótese da Pesquisa as toma como efeitos das relações gramático-coesivas, ou seja, não estratégicas; (2) segundo Lopes (Ibid.) a definição de Marcuschi exclui os vocábulos gramaticais do rol das repetições, mas em inglês muitos destes têm as mesmas ortografias de seus homônimos lexicais, como like, que, quando gramatical, atua como preposição e conjunção, e, quando lexical, atua como verbo e substantivo.

Considerando esta posição de Marcuschi, ficou bastante evidente complexidade da delimitação da extensão do significado da expressão ‘repetições de vocábulos’, dentro do contexto da pesquisa. Coube, então, considerar as possibilidades de repetições de vocábulos nos níveis da ortografia, da semântica e funcionalidade gramatical. A dimensão fonológica não foi considerada por não ser objeto de investigação da pesquisa. Entretanto, dada a abordagem via córpus linguístico, tais considerações não podiam se restringir a estes aspectos linguísticos, pois deviam adequar-se às limitações dos processamentos eletrônicos. Além disto, deviam também atender aos princípios da representatividade estatística, pois, como questiona Sinclair, “Como é que são identificas as instâncias de linguagem [no caso repetições de vocábulos] que são influentes a ponto de servirem como modelos para uma ‘população’ e, portanto, poderem ser ponderadas mais fortemente do que o resto?” (SINCLAIR(1)

, 2005, tradução nossa).

Para explicitar a tomada de decisão, o contraste, entre “he’s got the run of” e “ele estiver andando no”, exemplificado na introdução, é retomado, pois este também exemplifica uma das limitações do processamento eletrônico, acima mencionadas: no caso, a dificuldade de se analisar vocábulos ortograficamente idênticos via córpus eletronicamente manipulado, pois o computador não decodifica significados, ele reconhece caracteres (SARDINHA, 2004).

No exemplo em questão, tanto run quanto andando, nos segmentos de onde foram extraídos, significam estar livre, no entanto, em processamentos eletrônicos, suas frequências de ocorrências são

35

quantificadas juntamente com as de outros vocábulos ortograficamente idênticos, mas têm significados distintos. Deve-se considerar também, que run, tal quais tantos outros vocábulos, atua como substantivo, adjetivo e verbo. Mas, em processamentos eletrônicos, as quantificações das ocorrências dele não fazem a distinção por categorias morfossintáticas Esta dificuldade poderia ser parcialmente superada com a inserção de anotações de categorias morfossintáticas ao córpus. Porém, dada algumas limitações das anotações de categorias morfossintáticas, como no caso das derivações deverbais terminadas em -ing, que não são diferenciadas das formas de gerúndio dos verbos, a total anotação morfossintática do córpus não pareceu ser produtiva.

Partiu-se, então, para a alternativa de que tomar os vocábulos, no nível dos tipos de morfemas que os compõem, talvez ajudasse na obtenção de uma definição do termo ‘repetições de vocábulos’, pois “As palavras têm seus próprios constituintes, os morfemas. Estes não são marcados no sistema de escrita. Às vezes, eles podem ser identificados como as partes de uma palavra escrita, como em, eat + -ing, curd + -s, frighten + -ed.” (HALLIDAY e MATTHIESSEN, 2004, p.09). Por exemplo, em inconceivable, há três morfemas diferentes: in expressando a negação, conceiv, significando ‘pensar sobre’ ou ‘imaginar’, e able expressando ‘habilidade de’. (BAKER, 1992, p. 18).

Nesta perspectiva, o primeiro caminho tomado foi definir a extensão do termo ‘repetições de vocábulos’ a partir dos morfemas lexicais, de modo, por exemplo, a distinguir o morfema lexical de run, atuando como substantivo, do morfema lexical do verbo run, quando este corresponde a ‘correr’ em português. Porém, esta perspectiva implicaria em desconsiderar morfemas gramaticais, como -ed e –ing, em played e playing, e, estes dois vocábulos deveriam ser considerados como repetições, apesar de serem listados separadamente no processamento eletrônico. Além disso, este caminho acarretaria desconsiderar todos os vocábulos que são constituídos somente de morfemas gramaticais, tais como os operadores gramaticais auxiliares do, does, did e will. Entretanto, ainda assim, estes seriam quantificados juntamente com as frequências de vocábulos lexicais idênticos em ortografia, o que demandaria a exclusão manual das quantificações deles, feitas pelos processamentos eletrônicos.

O segundo caminho pensado foi considerar as repetições de vocábulos levando-se em conta o vocábulo a partir do(s) morfema(s) que o compõe, e, assim, do, does, did, e will seriam considerados como distintos de seus respectivos vocábulos lexicais idênticos em ortografia.

36

Mas, isto intensificaria a necessidade de ajustes ao córpus, pois além de se ter que separar vocábulos lexicais de gramaticais, seria necessário quantificá-los separadamente.

No entanto, até então, estes dois caminhos haviam sido pensados somente à luz da linguística sistêmica e de córpus, sem considerar o processamento cognitivo das ambiguidades lexicais. E, foi neste, que surgiu uma definição, adequada aos propósitos da pesquisa, para o termo ‘repetições de vocábulos’.

Por um lado, como a pesquisa previa contrastes entre os dois sistemas linguísticos, o primeiro caminho pensado parecia ser o que mais se adequava aos propósitos dela, visto que, no português, os vocábulos funcionais do, does, did e will, não existem. Além disto, a noção, na tradição de escrita do português, de que a não repetição de palavras enriquece o texto (BERBER SARDINHA, 2004), parece estar mais associada à não repetição de morfemas lexicais. Por outro lado, este direcionamento era inadequado, pois minimizaria a importância de vocábulos gramaticais que são fundamentais em algumas desambiguações lexicais, como no caso de this, que indubitavelmente distingue as duas últimas de ocorrências do vocábulo do nas perguntas “How do you do?” (BNC, C9R 180) e “How do you do this?” (BNC, A6T 1554). Assim,

decidiu-se pelo segundo caminho, a despeito de algumas dificuldades que poderiam advir dele.

Assim, apesar da complexidade da definição do termo ‘repetições de vocábulos’, dentro dos propósitos da pesquisa, pareceu ser mais produtivo tomar o termo da forma mais simplificada, ou seja, considerar como repetição de vocábulo todas as repetições da ortografia dos vocábulos, salvaguardando, certamente, casos específicos, como diferentes fonologias terem a mesma representação gráfica, como as duas pronúncias de read, que distinguem as formas de verbais do Simple Past e Past Participle das demais formas verbais e nominais de read. Assim, diferentemente da definição de Marcuschi, os vocábulos funcionais (gramaticais) deveriam ser considerados, deixando para o curso natural das investigações, a seleção de quais deles são mais relevantes para a composição de amostras de vocábulos, sempre considerando o questionamento de Sinclair, relativo à representatividade das instâncias de linguagem.