4. ENFOQUE METODOLÓGICO
4.1. Procedimentos para a análise das amostras de dados
Inicialmente, recorreu-se a acervos de textos orais do Português Brasileiro e do Português Europeu para proceder à coleta de dados. Devido à orientação funcionalista do estudo de gramaticalização e sociofuncionalista do estudo de alternância, a constituição das amostras teve como base a reprodução de trechos que expusessem o contexto discursivo nos quais os dados sob interesse estavam inseridos.
Trabalhar com entrevistas e/ou depoimentos orais acarreta lidar, ainda que indiretamente, com o “paradoxo do observador” (LABOV, 1972), pois, para conseguir registrar a fala mais natural possível, os pesquisadores que estiveram à frente da constituição desses corpora procederam a uma observação sistemática, já que os informantes sabiam que estavam sendo gravados. A inclusão, no presente estudo, de dados provenientes de textos escritos (jornalísticos, narrativas e relatos de opinião), de certa maneira, torna-se um meio de fazer com que a pesquisa se baseie em materiais que, em sua criação, não sofreram qualquer interferência de um documentador e não foram produzidos com o fim de compor um corpus para pesquisa. Labov (1972:209) comenta a questão:
(...) O problema não é sem solução: devemos também descobrir maneiras de complementar as entrevistas informais com outros dados (grifo nosso), ou mudar a estrutura da situação da entrevista de uma forma ou de outra.
Apesar de a fala no registro informal (menos monitorada) ser, geralmente, considerada como mais adequada para a verificação de fenômenos lingüísticos fundamentada no uso da língua, estudos como o de Schiffrin (1994) demonstram que algumas diferenças sintáticas e semânticas são sensíveis aos tipos de texto65 nos quais se inserem, sendo possível encontrar funções discursivas distintas a depender desses tipos. Essa é mais uma razão pela qual esta pesquisa conta com corpora diversos.
Amaral (2002), ao refletir sobre maneiras para minimizar o paradoxo, alega que, em textos nos quais o discurso reportado predomina, há trechos com maior naturalidade nos momentos em que o informante apresenta menor monitoramento de sua fala. Isso ocorre
65 Para a autora, o termo tipos de textos refere-se ao modo de organização textual, já que, em seu estudo, trabalha com narrativas e descrições. Recorreu-se a gêneros/tipos textuais distintos (crônicas, editoriais, notícias e artigos de opinião) por se acreditar que esses textos nem sempre apresentam o mesmo modo de organização predominante (uns são narrativos, outros argumentativos), o que pode implicar o emprego, segundo a autora, de funções discursivas distintas.
porque, normalmente, o falante está envolvido emocionalmente com o que relata66. Por isso, para complementar a amostra de dados com um corpus predominantemente narrativo, decidiu-se recorrer a depoimentos (orais e escritos) da amostra do Projeto Discurso e Gramática67.
Foram coletadas todas as ocorrências encontradas com dar + SN para o estudo do fenômeno de gramaticalização de dar. Os quadros a seguir demonstram as fontes e o número dos textos pesquisados, bem como o número de dados encontrados.
Fontes da coleta de dados N° de textos pesquisados
N° de dados coletados Inquéritos do Projeto NURC/VARPORT 41 78 Inquéritos do Projeto APERJ/VARPORT 37 54
Subcorpus
oral Depoimentos da amostra do Projeto Discurso e Gramática. 279 152 2001-2007 120 122 1976-2000 75 37 1951-1975 75 26 1926-1950 107 23 Textos jornalísticos do Projeto VARPORT e da Biblioteca Nacional do Rio de Janeiro e do site http://www.indekx.com 1901-1925 98 38
Depoimentos da amostra do Projeto Discurso e Gramática. 249 58 P O R T U G U Ê S B R A S I L E I R O Subcorpus escrito
Textos escolares sob avaliação (narrações, dissertações e provas)
177 84
Quadro 10: Fontes da coleta de dados em acervos do Português Brasileiro para estudo da gramaticalização de dar: de verbo predicador a verbo-suporte
66 Amaral (2002:67) constatou que o monitoramento ocorre com menos freqüência em trechos “de fala não- planejada (background), isto é, que não fazia parte da estrutura original da narrativa (...) e em trechos associados ao envolvimento emocional do falante”, enquanto se apresenta com mais freqüência “em eventos de transição, de preparação nos trechos em que não há envolvimento emocional e seguem a estrutura temporal dos eventos de acordo como foram registrados na memória, o que lhe confere o status de fala planejada (foreground)”.
67 Esse projeto desenvolve-se na UFRJ, sob a coordenação do Professor Doutor Mário Eduardo Toscano Martelotta.
Fontes da coleta de dados N° de textos pesquisados
N° de dados coletados Inquéritos do Projeto CRPC/ VARPORT
(ensino superior) 33 46
Subcorpus
oral Inquéritos do Projeto CRPC/VARPORT (semi-alfabetizados) 38 42 2001-2007 120 131 1976-2000 63 13 1951-1975 59 7 1926-1950 64 10 P O R T U G U Ê S E U R O P E U Subcorpus escrito Textos jornalísticos do Projeto VARPORT e da Biblioteca Nacional de Lisboa e do site http://www.indekx.com 1901-1925 76 18
Quadro 11: Fontes da coleta de dados em acervos do Português Europeu para estudo da gramaticalização de dar: de verbo predicador a verbo-suporte
Amostra total (oral e escrita) N° de textos pesquisados N° de dados coletados
PB e PE 1711 939
Quadro 12: Corpus do Português Brasileiro e do Português Europeu para estudo da gramaticalização de dar: de verbo predicador a verbo-suporte
A análise dos dados coletados ocorreu com base na observação: (i) das categorias às quais cada ocorrência de dar pertence, o que permitiu a depreensão de um continuum de gramaticalização (cf. seção 5.1) e (ii) dos aspectos que influenciam o fenômeno, propriedades relacionadas à semântica e à morfossintaxe das construções e freqüência de uso.
Para o estudo da alternância entre perífrases dar + SN (dar notícia, dar pulos) e verbos plenos (noticiar, pular), decidiu-se trabalhar apenas com dados do Português Brasileiro. Para constituir uma amostra do PB, recorreu-se, inicialmente, a acervos de gêneros escritos diferentes (cf. quadro 13) que pudessem ensejar construções textuais com graus de formalidade distintos e com diversidade de recursos lingüísticos/vocabulares. Finalizada essa etapa de coleta, interessou checar o fenômeno quanto à diferença entre modalidades expressivas. Para tanto, complementou-se o corpus até então obtido com dados eliciados de
depoimentos (narrativas e relatos de opinião) orais da amostra do projeto D&G, o que facultou investir naquele interesse de investigação.
No estudo de alternância, nem todas as construções dar + SN encontradas foram coletadas: consideraram-se, no tratamento socionfuncionalista, apenas aquelas com vínculo semântico e morfológico com um verbo predicador simples, à exceção de perífrases dar uma X- ada (dar uma passeada, dar uma pedalada). Segundo Scher (2006:6), as nominalizações X- ada, em estruturas dar uma X- ada, derivam de um verbo e exprimem eventualidades que podem apresentar um efeito de diminutivização que as torna breve, como em “O João deu uma martelada na parede.” (equivalente a “O João martelou a parede” = martelou apenas uma vez). Quando esse efeito não ocorre, como em “O João deu uma martelada no ladrão”, não há um verbo cognato que seja equivalente, ou seja, o segundo exemplo não corresponde a “João martelou o ladrão”, pois “deu uma martelada no ladrão” denota um evento singular “de atingir alguém ou alguma coisa com um objeto específico, um martelo” (SCHER, 2006:8). Será realmente que não é possível compreender o segundo exemplo como equivalente à “O João martelou o ladrão” e como expressão diminutivizada?
Há determinados tipos de construções dar uma X-ada (dar uma olhada, dar uma lida, dar uma nadada) com alta produtividade no corpus; no entanto, é alta a ocorrência de muitos verbos plenos cujos equivalentes do tipo dar uma X-ada são raros (dar uma comunicada, dar uma imaginada, dar uma remediada, dar uma pisada). Considerar, então, todos os tipos de predicadores simples que pudessem apresentar uma perífrase “dar uma X-ada” acarretaria um aumento significativo desses verbos plenos, o que poderia enviesar a análise. Optou-se, assim, por excluir, da análise sociofuncionalista aqui empreendida, dados que estivessem associados a esse tipo de estruturação (dar uma lavada/lavar, dar uma nadada/nadar, dar uma cantada/cantar, dar uma enxugada/enxugar), pois merecem tratamento específico.
As fontes, os números dos textos pesquisados e o número de dados encontrados constam nos quadros a seguir:
Fontes da coleta de dados N° de textos pesquisados N° de dados coletados Notícias 100 123 Editoriais 100 331 Crônicas 75 210 Textos jornalísticos da amostra do Projeto PEUL/UFRJ (Projeto de Estudo dos Usos Lingüísticos) Artigos de opinião 100 406
Depoimentos da amostra do Projeto
Discurso e Gramática. 279 315 P O R T U G U Ê S B R A S I L E I R O Subcorpus escrito
Textos escolares sob avaliação
(narrações, dissertações e provas) 118 230
Quadro 13: Fontes da coleta de dados em acervos do Português Brasileiro (ESCRITO) para estudo da alternância entre construções dar + SN e verbos predicadores cognatos de sentido equivalente.
+
PB Subcorpus oral Depoimentos da amostra do Projeto Discurso e
Gramática
279 226
Quadro 14: Fontes da coleta de dados em acervo do Português Brasileiro (ORAL) para estudo da alternância entre construções dar + SN e verbos predicadores cognatos de sentido equivalente.
Amostra total (oral e escrita) N° de textos pesquisados N° de dados coletados
PB 1051 1841
Quadro 15: Corpus do Português Brasileiro para estudo da alternância entre construções dar + SN e verbos predicadores cognatos de sentido equivalente.
Utilizou-se, para o tratamento estatístico dos dados de alternância, o programa Goldvarb (2001). Para tanto, todas as ocorrências obtidas nos corpora foram codificadas, ou seja, cada dado obteve códigos que representam o seu comportamento em função da variável dependente e das variáveis independentes estabelecidas. Dessa forma, foi possível abrir o arquivo de dados codificados no programa executável que, por sua vez, possui as seguintes funções básicas: (i) criar um arquivo de especificação das variáveis dependentes e independentes; (ii) detectar algum erro de codificação, com base no arquivo de especificação e gerar arquivos corrigidos após mudança feita pelo pesquisador; (iii) produzir arquivos de
células em função de arquivos de condições68 organizados pelo pesquisador; (iv) criar um arquivo que demonstre a relação entre as variáveis independentes e a variável dependente; (v) desenvolver um arquivo que represente a tabulação cruzada de pares de variáveis independentes (cruzamento de variáveis); e (vi) gerar pesos relativos. Os arquivos referentes às funções (iv) e (v) apresentam estatisticamente a produtividade das variantes da variável dependente em relação a cada um dos fatores constitutivos das variáveis independentes. Ao gerar pesos relativos, o programa demonstra o “peso” de cada fator de cada variável independente (acima de .55 e/ou mais próximo de 1.0 é considerado relevante) para o emprego de uma das variantes da variável dependente (denominada fator default ou valor de aplicação), no confronto com todos os demais fatores e, nos níveis de análise de mais de um grupo de fatores, na ponderação da co-atuação dessa variável independente com outra(s). O programa também informa o nível de input do valor de aplicação e de significância estatística da análise das variáveis e das rodadas multivariacionais69 (neste estudo, binária). O input “representa o nível geral de uso” (GUY, 2007) do fator default, ou seja, da variante em foco na análise. Para ser considerado alto, deve estar próximo de 1. A significância estatística das rodadas selecionadas como as “melhores”, por conterem grupos de fatores mais significativos, e das variáveis deve ser, preferencialmente, 0.000 e chegar, no máximo, a 0.05, o que significa haver 95% de confiabilidade dos resultados, ou seja, de chance de as variáveis independentes selecionadas na rodada influenciarem, de fato, o emprego do fator default. O nível de significância das variáveis extraído do primeiro nível de análise (nivel 1) do programa, que apresenta também os valores dos pesos relativos dos fatores, indica o comportamento isolado de cada variável independente.