• Nenhum resultado encontrado

CAPÍTULO II: PROCEDIMENTOS METODOLÓGICOS

2.1 SELEÇÃO E CONSTITUIÇÃO DO CORPUS DE PESQUISA

O corpus da pesquisa foi constituído a partir de dados coletados no Corpus do Português. Este é um banco de dados online, disponível no endereço www.corpusdoportugues.org/. Foi organizado por Mark Davies e Michael Ferreira, em 2006, e tem servido como fonte para muitas pesquisas linguísticas. A plataforma do corpus permite acessar fácil e rapidamente mais de 45 milhões de palavras de quase 57.000 textos escritos em português do século XIV ao século XX. O sistema de ferramenta de buscas permite pesquisar palavras exatas ou frases, curingas, lemas, classes gramaticais, ou qualquer combinação destes. Proporciona também a pesquisa de palavras vizinhas (colocados) com um máximo de dez palavras no contexto à direita ou à esquerda

Cientes de que esse banco de dados apresenta alguns problemas, tais como datação incorreta e repetição de textos, todos os cuidados foram tomados para que o

subcorpus constituído não ficasse problemático. Logo, foram feitas consultas na internet para

comprovação de datas, de autores e de referências dos textos. Destaca-se, portanto, que nenhum desses problemas foi impedimento para que fosse o corpus construído a partir da seleção de ocorrências da construção V1CHEGAR + PREPa + V2infinitivo neste banco de dados.

Anterior à escolha deste corpus, foram, inclusive, realizados alguns levantamentos em outros corpora já existentes, tais como o Corpus do Mineirês, desenvolvido sob a coordenação da Professora Drª. Jânia Martins Ramos, da Universidade Federal de Minas Gerais, e o Corpus do PEUL, organizado por professores da Universidade Federal do Rio de Janeiro, ambos também disponíveis online. Entretanto, estes possibilitariam apenas uma abordagem sincrônica do objeto de estudo, e, ao realizar a análise de alguns dos dados levantados, sentiu-se a autora desafiada a realizar um estudo diacrônico da construção V1CHEGAR + PREPa + V2infinitivo, uma vez que esta parece estar muito recorrente nos dias atuais, o que pode indicar que não é uma construção tão recente na língua.

Quando definida a opção pelo estudo diacrônico, foi feito um cadastro gratuito junto ao site do Corpus do Português, para que pudesse ser realizada uma pesquisa piloto e testada a viabilidade de uso desse corpus. A partir daí, começou-se o levantamento de dados para composição do subcorpus.

Nesta fase de levantamento de dados, foram percorridas algumas diferentes etapas. Primeiro, realizou-se, por meio da ferramenta de busca do próprio sistema, uma pesquisa na base geral do Corpus do Português, compreendendo tanto o português europeu quanto o português brasileiro, com a chave de busca “cheg*”. Nesta busca, foram identificadas todas as ocorrências em linhas de concordância que possuem a base cheg-.

Depois, realizou-se também uma busca na base geral do banco de dados com a chave de busca “[chegar] a [vr*]”. Neste ponto, confirmou-se a hipótese deste estudo de que essa construção já acontecia há mais tempo no português, visto que no século XIV foram encontradas 2 ocorrências dela, conforme mostradas a seguir.

Ocorrência 1: Desapoderãdo sse os homës das cousas deste mundo teuerõ os padres sanctos

que era carreyra per que mays desenbargadamët se poderiã chegar a gaanhar o amor de deus E por esso ouue hy algûû delles que escolherõ sas moradas enos desertos E outros acerca do pobrado pero come apartadamët E taes logares come estes de qual natura quer que seiã chamã lhys moesteyros ou casas de rreligiõ por que estã hy os homës de gram deuoçõ & am cuydado de seruir a deus mais ca doutra guysa (Afonso X. Primeira partida. 1300, grifos nossos)

Ocorrência 2: Ca, en tempo del rey dom Fernando, lhe dava el rey de Graada a meatade de

todas suas rendas que eram apreçadas a seis çentos maravidiis da moeda de Castela. E esta moeda era de tantos dinheiros o maravidil que chegava a valer o maravidil tanto como hûu maravidil d'ouro, por que, en aquel tempo del rey dom Fernando, corria en Castella a moeda dos pipiõoes e no regnado de Leon a moeda dos leoneses; e, daqueles pipiõoes, valia cento e oiteenta o maravidil. (Crônica Geral da Espanha de 1344 (Ms. L). 1300-1400, grifos nossos)

Também, a fim de verificar se seria possível a ocorrência da construção sem a preposição “a”, fez-se uma pesquisa a partir da chave de busca “[chegar] [vr*]”, sendo que os dados encontrados confirmaram a hipótese de que a construção poderia ocorrer sem a preposição.

Para uma melhor visualização dessas etapas percorridas, segue, na próxima página, a tabela 1 com informações numéricas resultantes de cada busca realizada.

Tabela 1 - Resultados numéricos diacrônicos obtidos no Corpus do Português

Chave de busca

Séculos/Número de ocorrências

XIV XV XVI XVII XVIII XIX XX

cheg* 1338 2730 5029 3367 1857 10810 18754

[chegar] a [vr*] 5 25 65 194 205 1080 2593

[chegar] [vr*] 0 4 9 5 1 2 27

Fonte: dados coletados

Após essas etapas, partiu-se para uma análise mais detalhada de todas as linhas de concordância encontradas na primeira etapa para se ter acesso ao contexto expandido das ocorrências, o que impeliu a uma busca na internet para confirmação e/ou complementação de informações sobre o autor daquele trecho/obra onde se dava a ocorrência e posterior conclusão se se tratava de dados do português brasileiro e/ou europeu. No século XX, essa divisão já é feita na própria base de dados do Corpus do Português, além de as ocorrências serem também separadas por quatro diferentes tipologias textuais, quais sejam: ficção, acadêmico, notícia e oral.

A partir dessa pesquisa por contexto expandido, por ser recorte deste trabalho estudar somente o PB, tomou como ponto de partida o século XIX, visto que, pelas linhas de concordância, verificou-se que somente há ocorrências com cheg* oriundas de português brasileiro a partir deste século. Para uma melhor visualização, seguem dados mostrados na tabela 2.

Tabela 2 - Resultados numéricos diacrônicos separados por modalidade do português Chave de

busca

Descrição SÉCULOS

XIV XV XVI XVII XVIII XIX XX

cheg*

Total de ocorrências 1338 2730 5029 3367 1857 10810 18754 Ocorrências PE 1338 2730 5029 3367 1857 2921 8528

Ocorrências PB - - - 7889 10226

A partir do número de ocorrências encontrados oriundas do português brasileiro nos séculos XIX e XX, estipulou-se a coleta25 de 1000 resultados de busca, sendo 500 dados/contextos expandidos em cada século para compor o subcorpus. Ressalta-se, conforme já dito, que os dados do século XX contemplam quatro tipos de textos e que, em nossa coleta, foram todos contemplados de maneira similar (125 dados de cada um dos tipos). Após essa coleta e pós-conferência dos dados referentes à autoria e à datação, foi organizado um arquivo de cada século. Depois, os dois arquivos foram transformados em arquivos.TXT e, finalmente, separadamente, submetidos ao programa de concordância Antconc 3.2.1. A utilização desse programa facilitou a obtenção das linhas de concordâncias relativas à construção objeto deste estudo, uma vez que ele permite a busca por colocados à direita e à esquerda da expressão chave. Então, buscaram-se as ocorrências do verbo chegar com até sete colocados à direita e, a partir dos resultados, manualmente, foram sendo selecionadas as linhas de concordância com a construção V1CHEGAR + PREPa + V2infinitivo. O programa facilitou ainda a seleção das ocorrências em virtude de pessoa, número, tempo e modo verbal.

O quantitativo do subcorpus que servirá de base para as análises do trabalho segue demonstrado na tabela 3.

Tabela 3 - Quantitativo diacrônico do subcorpus da pesquisa em PB

Descrição Séculos/Número de ocorrências

XIX XX

Número de ocorrências de cheg* 500 650

Número de ocorrências da construção V1CHEGAR + PREPa + V2infinitivo

100 (20%) 179 (27,5%) Fonte: dados coletados