• Nenhum resultado encontrado

5 METODOLOGIA

5.3 O pronome lembrete em PB

A pesquisa foi realizada de acordo com os seguintes procedimentos:

1. constituição de um subcorpus tde Português Brasileiro com 20 textos do C-ORAL- BRASIL previamente etiquetados informacionalmente, contendo:

a) 1 monólogo público (bpubmn01);

b) 2 diálogos públicos (bpubdl01, bpubdl02); c) 2 conversações públicas (bpubcv01, bpubcv02);

d) 6 monólogos privados (bfammn01, bfammn02, bfammn03, bfammn04, bfammn05, bfammn06);

e) 5 diálogos privados (bfamdl01, bfamdl02, bfamdl03, bfamdl04, bfamdl05); f) 4 conversações privadas (bfamcv01, bfamcv02, bfamcv03, bfamcv04)88;

2. constituição de um subcorpustde Português Europeu com 20 textos do C-ORAL-ROM de PE sem etiquetagem informacional, contendo:

a) 2 monólogos públicos (ppubmn02, ppubmn03); b) 2 diálogos públicos (ppubdl08, ppubdl10); c) 2 conversações públicas (ppubcv04, pfamcv05*);

d) 5 monólogos privados (pfammn03, pfammn10, pfammn12, pfammn14, pfammn22);

e) 5 diálogos privados (pfamdl06, pfamdl07, pfamdl14, pfamdl23, pfamdl24); f) 4 conversações privadas (pfamcv05, pfamcv07, pfamcv08, pfamcv09); 3. localização, no subcorpustde PB, de retomadas por pronome lembrete;

4. localização, em enunciados com unidade informacional de Tópico do subcorpus tde PB, de retomadas por repetição do elemento retomado;

5. identificação, no subcorpus tde PB, de contextos favoráveis à retomada por pronome lembrete;

6. localização, no subcorpus tde Português Brasileiro, de retomadas pronominais em orações relativas resumptivas;

7. localização, no subcorpustde PE, de retomadas por pronome lembrete;

8. identificação de restrições prosódicas operantes na realização dos diversos tipos de retomadas identificadas anteriormente.

Como subcorpus tde pesquisa do Português Brasileiro, foi utilizado o minicorpus tdo C- ORAL-BRASIL (RASO, no prelo), o qual conta com etiquetagem informacional em todos os seus 20 textos e apresenta um total de 31.318 palavras e 5.438 enunciados. Com base na estrutura do minicorpus, foi montado um subcorpus tde Português Europeu com textos provenientes do C-ORAL-ROM de Português Europeu. Para tanto, buscou-se textos que se equiparassem o máximo possível àqueles do do subcorpus tde PB em relação aos seguintes

88 A quantidade de textos escolhidos para compor o subcorpus faz com que o mesmo seja representativo em relação ao C-ORAL-BRASIL quanto à sua divisão entre os contextos público e privadote quanto às tipologias monólogo, diálogote conversação.

parâmetros:

1. variação situacional das interações;

2. critérios sociolinguísticos dos falantes (gênero, idade, escolaridade); 3. número de palavras (aproximadamente 1.500 cada).

Na elaboração do subcorpus tde PE, encontrou-se dificuldade para atender a cada um dos parâmetros desejados. Em primeiro lugar, como foi visto na seção 5.1.3, o C-ORAL-ROM de Português Europeu apresenta uma variação de situações de fala significantemente restrita em relação ao C-ORAL-BRASIL, sendo impossível conseguir uma variação tão grande quanto aquela presente no minicorpus. Em contra partida, procurou-se conseguir um maior equilíbrio nos critérios sociolinguísticos, variando a situação comunicativa sempre que possível. O tamanho dos textos do C-ORAL-ROM de PE também foi um entrave para a construção do subcorpus: muitos deles apresentavam um número de palavras consideravelmente inferior a 1.500, tornando-os inadequados à pesquisa. De todas as conversações públicas do C-ORAL- ROM de Português Europeu, por exemplo, somente uma apresentava um número compatível de palavras, de modo que, dentre as conversações públicas presentes no subcorpus, encontra- se uma conversação familiar/privada (pfamcv05).

Outra diferença deve ser mencionada. O subcorpus de PB apresenta 6 monólogos privados e apenas 1 monólogo público. O subcorpustde PE, por outro lado, tem 5 monólogos privados e 2 monólogos públicos. Essa diferença deve-se ao fato que, posteriormente à etiquetagem informacional do minicorpus do C-ORAL-BRASIL, à criação do subcorpustde PE e à coleta de dados para essa pesquisa, um dos monólogos do minicorpustfoi reclassificado, passando de público para privado. Consequentemente, o subcorpustde PB, composto exclusivamente por textos do minicorpus, foi alterado. Devido ao prazo de publicação desse trabalho, não foi possível reformular o subcorpustde PE.

Quanto aos procedimentos metodológicos posteriores à montagem do subcorpus, algumas observações devem ser feitas. Em primeiro lugar, os procedimentos metodológicos 3 e 6 correspondem à “localização manual, em ambos os subcorpora, de retomadas por pronome lembrete”. Nessa fase da pesquisa, considerou-se que uma retomada por pronome lembrete é a

retomada anafórica de um SN realizada por um pronome pessoal em posição de:

1. sujeito da oração principal ou de uma oração subordinada; 2. objeto direto da oração principal ou de uma oração subordinada; 3. objeto indireto da oração principal ou de uma oração subordinada; 4. complemento na oração principal ou em uma oração subordinada.

Dessa forma, buscou-se cobrir todos os casos que seriam considerados de pronome lembrete em uma análise discursiva como a de Pontes (1987).

A identificação de retomadas por pronome lembrete foi realizada de forma semiautomática, valendo-se da função “localizar” do editor de textos BrOfficet(http://broffice.org/). Com essa função, é possível identificar as ocorrências de uma palavra em um certo arquivo de texto. Assim, foram procuradas todas as formas de pronomes pessoais previstas pelos critérios de transcrição do C-ORAL-BRASIL (eu, tu, ele, e', ela, ea, nós, vós, eles, es, elas, eas89) e, em seguida, foram identificadas aquelas em contexto de retomada por pronome lembrete em posição de sujeito.

O procedimento metodológico 5, por sua vez, prevê a identificação de casos de retomada anafórica de um SN pela sua repetição. Com esse procedimento, busca-se localizar casos como (5.1), em que o SN “o Fábio” é retomado pela sua repetição.

(5.1) O Fábio, o Fábio tem mãos de alface.

Esse procedimento foi realizado de forma inteiramente manual. O pesquisador procurou, em cada enunciado que possuía uma ou mais unidades informacionais de Tópico, por retomadas envolvendo a repetição do elemento retomado. A busca foi feita somente em enunciados com unidades informacionais de Tópico pois considerou-se que procurar retomadas por repetição em todos os 5.438 enunciados do subcorpus tseria tarefa demasiado exaustiva. Dessa forma, visto que o subcorpus tde PE não possui etiquetagem informacional, o procedimento metodológico 4 não se estendeu ao mesmo.

89 As formas e', ea, este eastsão contrações de ele, ela, eleste elas, respectivamente. Todas essas formas são respeitadas nas transcrições do C-ORAL-BRASIL.

O procedimento metodológico 5 prevê a identificação de contextos favoráveis à retomada por pronome lembrete no subcorpustde PB. Foram considerados contextos favoráveis ao emprego da retomada lembrete os enunciados que apresentam (a) um SN na unidade informacional de Tópico (b) uma oração na unidade informacional de Comentário e (c) uma relação anafórica de natureza semântica entre algum constituinte da oração em Comentário e o SN em Tópico. Veja-se o exemplo (5.9).

Exemplo (5.9) – bfamdl02

*BAL: [36] a Estefânia /=TOP= apanhou //=COM=

Assim como a TLA entende que não existem relações sintáticas entre constituintes de unidades informacionais diferentes, o SN “a Estefânia”, em Tópico, e o verbo “apanhou”, em Comentário, não podem ser vistos como constituintes de uma mesma oração. Ainda assim, a TLA admite a possibilidade da existência de estruturas oracionais tanto em uma unidade informacional quanto na outra, o que é o caso da unidade de Comentário do enunciado em questão. Uma análise tradicional da oração “apanhou”, em Comentário, como aquela proposta por Cunha (1971), classificaria o seu sujeito como um sujeito oculto determinado, ou seja, aquele que “não está materialmente expresso na oração, mas pode ser identificado”. Assim, existiria uma relação semântica de correferência entre o sujeito do verbo “apanhar”, em Comentário, e o SN “a Estefânia”, em Tópico. Mesmo em um análise menos tradicional, a qual classifique a oração "apanhou" de formas alternativas, o fundamental é perceber a existência de uma relação semântica de correferência entre o SN “a Estefânia”, em Tópico, e algum elemento da oração em Comentário, os quais não podem ser analisados como sendo constituintes de uma mesma oração.

Em face dessa análise, conclui-se que o enunciado (5.9) contém um SN na unidade de Tópico e uma oração na unidade de Comentário, e que o sujeito da oração em Comentário possui uma relação semântica com o SN em Tópico. Assim, (5.9) seria um enunciado com contexto favorável à presença da retomada lembrete.