• Nenhum resultado encontrado

3 METODOLOGIA DE PESQUISA

3.1 Composição dos corpora

No intuito de ampliar o corpus formado para a pesquisa realizada em nível de mestrado, nossos esforços iniciais, já em nível de doutorado, ocorreram no sentido de dar continuidade à coleta de dados no acervo digital atualizado da revista Veja e na Veja on-line. No entanto, a diversidade de gêneros textuais da revista impressa digitalizada não nos permitia sistematizar as análises com foco em modo argumentativo de organização discursiva, conforme pretendíamos. Além disso, na revista on-line, os dados obtidos, quase exclusivamente, de comentários bastante informais de leitores não estavam acompanhados de material linguístico suficiente para a realização de análises mais aprofundadas. Por essa razão, decidimos substituir a fonte de dados para garantir o rigor da investigação. A mudança, no que se refere à busca de dados da sincronia atual, proporcionou análises ricas e mais criteriosas do que as anteriores, além de mais adequadas à observação da função argumentativa dos marcadores. Em se tratando da busca de dados para o estudo diacrônico, a escassez de material não nos permitiu eleger gêneros ou modos de organização textual, logo, a investigação permeou todos os textos disponíveis.

A pesquisa no recorte sincrônico contemporâneo, referente aos séculos XX e XXI até o ano corrente, foi realizada por meio da coleta de dados no acervo digital de publicações dos diários do Congresso Nacional, que é composto pela Câmara dos Deputados e pelo Senado Federal. Os corpora para o estudo diacrônico, envolvendo textos dos séculos XIII ao XX, foram formados por meio da coleta de dados nos acervos do Corpus do Português e do

Corpus Histórico do Português Tycho Brahe. O Corpus do Português é constituído de mais de

45 milhões de palavras provenientes de aproximadamente 57.000 textos. São contabilizadas 20 milhões de palavras do século XX, 10 milhões do século XIX, e 15 milhões de palavras dos séculos XIII-XVIII. No século XX, o corpus contém seis milhões de palavras de ficção,

seis milhões de jornais e revistas, seis milhões de textos acadêmicos e dois milhões de textos orais. Para cada um desses quatro gêneros e, portanto, na sua totalidade, os textos do século XX estão igualmente divididos entre textos de Portugal e do Brasil. Com uma composição mais modesta, quando comparado ao anteriormente citado, o Corpus Tycho Brahe apresenta 76 textos, em que se encontram 3.302.666 palavras.

Para a realização da coleta dos dados no acervo do Congresso Nacional, seguimos o seguinte passo a passo: (i) Menu; (ii) Legislação e publicações; (iii) Diário do Congresso Nacional; (iv) Diário: optar por Congresso Nacional; (v) Busca: inserir expressão entre aspas e pesquisar. Efetuamos a busca das expressões no Corpus do Português seguindo a seguinte sequência: (i) Gênero histórico; (ii) Pesquisar; (iii) optar por Gráfico; (iv) inserir expressão sem aspas e pesquisar. Em relação ao Corpus Tycho Brahe, procedemos à busca direta em cada um dos textos fornecidos, diferentemente dos métodos anteriores, em que a inserção da expressão no campo de busca gerava resultados provenientes de todo o acervo ou de toda a seção selecionada. Seguimos, então, a seguinte conduta sequencial: (i) Acesso aos textos; (ii) Catálogo de listas ordenadas; (iii) Lista cronológica; (iv) inserir o comando de pesquisa em PDF e buscar as expressões. Apesar de o procedimento demandar mais tempo de pesquisa, a busca particularizada proporcionou a observação de expressões próximas (de mesmo radical) àquelas investigadas, ampliando a ótica sobre o estágio da língua em sincronias específicas e algumas mudanças linguísticas de modo global. A ordem cronológica das listas de textos nesse corpus tem como referência o ano de nascimento dos autores. Procedemos, então, a reordená-los de acordo com o ano de produção dos textos. Na ausência de tal informação no

corpus, relacionamos o texto em questão ao ano de sua primeira edição, consultada em fontes

diversas.

Em cada um dos acervos, inserimos no campo de busca e procedemos à pesquisa de todos os possíveis arranjos combinatórios que preenchessem a estrutura IndutR Loc, na

sequência em que se apresenta, envolvendo os seguintes termos indutor-refreadores (IndutR):

as frases nominais alto e calma e os verbos espera, segura, aguenta e para; e os seguintes pronomes locativos (Loc): aqui, aí, ali, cá, lá e acolá.

No intuito de averiguar as diferentes grafias dos arranjos mencionados, hipotetizando flagrar reduções, justaposições ou aglutinações das construções em foco, nos preocupamos em inserir no campo de busca as variações descritas a seguir:

(i) Elemento indutor-refreador seguido de locativo, separados por espaço (2 vocábulos mórficos).

(ii) Elemento indutor-refreador unido ao locativo, sem separação por espaço, observando os fenômenos de assimilação ou crase (1 vocábulo mórfico).

(iii) Elemento indutor-refreador reduzido seguido de locativo, separados por espaço (2 vocábulos mórficos).

(iv) Elemento indutor-refreador reduzido unido ao locativo, sem separação por espaço, observando os fenômenos de assimilação ou crase (1 vocábulo mórfico).

Cada um dos arranjos considerados válidos, pertencentes a quaisquer dos contextos de mudança difundidos por Diewald (2002, 2006), foram arquivados em documentos digitais, organizados por cruzamento temporal, contextual e intracontextual, conforme quadro a seguir. É válido esclarecer que o quantitativo total de graus por contexto e o apontamento numérico dos arranjos apresentados no Quadro 5 são meramente ilustrativos para imprimir a ideia de sequência e continuidade. Em havendo ausência de dados correspondentes ao primeiro ou único grau do contexto fonte e ao último ou único grau do contexto isolado, recorremos a

corpus complementar, pesquisado na Web, de modo a exemplificar, no capítulo de análise de

dados, a origem e o resultado da trajetória de mudança. A decisão de nos valermos de pesquisas na Web apenas para complementação analítica e ilustrativa dos polos extremos dos contextos objetiva não enviesar o mapeamento da trajetória de mudança.

Quadro 5: Modelo de organização de dados coletados nos corpora Contextos: Fonte Atípico Crítico Isolado Graus: F1 F2 F3 A1 A2 A3 I1 I2 I3 Arranjo 1 IndutR Loc Século XIX Século XX Século XXI Graus: F1 F2 F3 A1 A2 A3 I1 I2 I3 Arranjo 2 IndutR Loc Século XIX Século XX Fonte: Autoral.

Os descartes ocorreram a partir dos critérios a seguir:

(A) Termo nuclear da expressão separado de pronome locativo por pontuação. Exemplos: “ele não aguenta. Aí, [...]”; “o coração não aguenta, aí começa [...]”.

(B) Termo nuclear da expressão em uso não interativo, mais especificamente, não direcionado a 2ª pessoa do singular no discurso (tu) ou a 3ª pessoa do singular no

discurso (você). Exemplo: “Ele não aguenta lá no monte” Eventualmente, foram considerados usos dirigidos às pessoas do plural a título de investigação diacrônica para chegarmos à construção atual. Exemplo: “Esperai lá” > “Espera lá”.

(C) Fragmentos repetidos em publicações complementares, já contabilizados e analisados anteriormente.

(D) Identificação equivocada pelo leitor de busca, fornecendo parônimos do termo inserido (geralmente devido à digitalização de páginas antigas, sem a nitidez ideal). (E) Termo homônimo de alto (= comando de interrupção da marcha), que forma

expressão com elemento subsequente, de significado global oposto a ideia de refreamento. Exemplos: Alto sus = eia age (latim), ânimo, avante (português) = excitação, exortação; Alto-frente = avançar.