• Nenhum resultado encontrado

2 FUNDAMENTOS TEÓRICO-METODOLÓGICOS

2.5 O SUPORTE ESTATÍSTICO COMPUTACIONAL GOLDVARB

2.5.1 Passos para a rodada de dados

Ao abrir o programa, são apresentadas uma janela (UNITLED.tkn) e uma caixa de diálogo adicional (FACTOR SPECIFICATION), conforme a Figura 16. Na janela, são inseridos todos os dados codificados.

Figura 16 – Tela inicial do programa Goldvarb

Fonte: Print screen da execução do software72

Com os dados codificados inseridos no programa, é preciso gerar os fatores de especificação. O Goldvarb faz isso a partir da varredura dos dados codificados, seguindo o comando Tokens > Generate Factor Specification. Também é possível inserir manualmente cada um dos fatores a partir da caixa de diálogo.

Figura 17 – Gerando os fatores de especificação

Os fatores encontrados podem ser visualizados na opção Tokens>Show Factor

Specification. Em caso de divergências, são corrigidos na caixa Factor Specification. As

mudanças são registradas na opção MODIFY GROUP e checadas em Tokens>CHECK

TOKENS.

Figura 18 – Visualização dos fatores de especificação

Após a preparação dos dados, chega-se à análise preliminar dos resultados, a partir dos quais são gerados os dados de frequência, em TOKENS > NO RECODE. O programa abrirá a janela do Arquivo de Condições (Untitled.cnd) em que exclusões e amalgamações de

fatores podem ser feitas em etapas posteriores. Nessa janela, a opção CELLS > LOAD

CELLS TO MEMORY fornecerá os resultados preliminares.

Figura 19 – Geração do arquivo inicial de condições (.cnd)

Caso o arquivo de resultados gerado apresente Knockouts (quando um fator de um grupo apresenta comportamento categórico em relação à variação – 0% ou 100% de frequência de uma das variantes) ou Singleton groups (quando um grupo de fatores apresenta ocorrências para apenas um fator), é necessário rever o arquivo de condições para fazer as exclusões e/ou as amálgamas necessárias e repetir a operação.

Com o arquivo de células livre de Knockouts e Singleton groups, é o momento de gerar o arquivo com os pesos relativos, opção CELLS >BINOMIAL, UP AND DOWN.

Figura 20 – Geração do arquivo de resultados

O programa mostrará os resultados da análise multidimensional, com as rodadas e pesos relativos, no Arquivo de Resultados (.res). Cabe ao linguista ler e interpretar os

resultados, ponderando a necessidade de refazer a análise, testar os fatores e, eventualmente, aplicar a combinação de fatores.

Para o estudo do modo imperativo serão realizadas tantas análises quanto necessárias à compreensão do fenômeno, sendo explicitadas no capítulo de análise de dados as amálgamas e os índices probabilísticos produzidos pelo programa. Serão também comentados os resultados categóricos e demais comportamentos que conduzam à junção de fatores, por acreditarmos serem esses dados também relevantes para a compreensão do fato linguístico.

Ademais, cumpre destacar a possibilidade de o programa realizar cruzamentos entre variáveis dependentes, fornecendo a distribuição do fenômeno em relação à ocorrência de dois fatores simultaneamente. Lançaremos mão desse recurso, quando necessário, a fim de fornecer uma leitura mais abrangente dos efeitos das variáveis dependentes.

É importante reiterar que a ferramenta estatística constitui apenas um suporte para o trabalho analítico da linguagem. Os dados numéricos obtidos pelo Goldvarb não constituem verdades ou juízos categóricos, servem apenas como base para o trabalho de inferência do pesquisador. As apropriadas análise e manipulação do modelo dependem da acuidade do pesquisador sobre seu objeto de estudo e o universo de observação, seja na recolha adequada da amostra, na definição dos grupos de fatores, seja no conhecimento necessário para a interpretação adequada dos resultados.

2.6 CONCLUSÕES DO CAPÍTULO

Neste capítulo, discorremos acerca da fundamentação teórico-metodológica desta tese, o modelo sociolinguístico variacionista laboviano (WEINREICH; LABOV; HERZOG, 2006 [1968]); LABOV, 2008 [1972]), que subjaz à nossa concepção de língua e à leitura sobre o fenômeno linguístico em estudo. A partir das principais considerações teórico-metodológicas da corrente linguística, apresentamos os parâmetros que orientaram a condução da pesquisa, desde a seleção e constituição dos corpora até a delimitação do fenômeno, os seus prováveis condicionamentos e o suporte estatístico computacional utilizado na análise.

Da compreensão da língua como um sistema heterogêneo e sistematizado, parte também a nossa apreensão teórica do português brasileiro, em especial as suas variedades populares. A diversidade que caracteriza o português popular não é, conforme a nossa visão, produto de um processo caótico e resultado exclusivo de um modelo ineficiente de educação em língua materna. A esse quadro contemporâneo, antecipa-se uma motivação histórica que

contribui, ao contrário de uma expropriação do idioma, para uma diversidade, fruto de contatos linguísticos processados em condições sócio-históricas particulares.

A partir dessa realidade, compõem-se, de um lado, normas cultas, decalcadas do modelo lusitano durante a gênese do português brasileiro, e, de outro, as normas populares, erigidas a partir dos contatos linguísticos – entre escravos e seus descendentes com a língua portuguesa – que marcaram uma aquisição de um modelo de português diferenciado, sobretudo, pela adoção de uma morfologia mais reduzida. Essa realidade heterogênea do português brasileiro, consagrada como polarização sociolinguística (LUCCHESI, 2004, 2015), nos serviu de base para a composição dos corpora.

Nosso universo de observação, portanto, teve como objetivo o recorte de variedades populares do português, em suas diferentes nuances, orientadas pelo vetor da urbanização. Assim, partimos das variedades do português da Bahia de comunidades do interior do estado, as comunidades afro-brasileiras isoladas remanescentes de quilombo (Helvécia, Sapé, Cinzento e Barra e Bananal) e as comunidades do interior, de perfil menos isolado e sem uma relação direta com o passado escravocrata – os municípios de Santo Antônio de Jesus e Poções. Juntos, esses corpora constituem o polo rural da nossa análise. Em paralelo a esse universo rural, selecionamos um corpus, também de fala popular, de caráter urbano – as amostras de fala do português popular de Salvador. Assim, nosso estudo, desenvolvido a partir dos corpora constituídos no âmbito do Projeto Vertentes, busca reproduzir as variedades de língua que mais detidamente conservam aspectos que remontem a constituição do português popular, considerando a oposição rural–urbano .

Se divergente em sua constituição, o português faz-se também diferente em seus usos, o que o consagra como um todo plural e polarizado. Dessa forma, sua diversidade pode ser descrita e sistematizada, conforme prevê a teoria sociolinguística. Nesse sentido, destacamos o fenômeno da variação nos usos do modo imperativo, apresentado em função de duas variantes, as formas derivadas do indicativo (canta/não canta) e as formas derivadas do subjuntivo (cante/ não cante).

Nossa variável dependente foi coletada exaustivamente nos corpora. Desse levantamento, emergiram alguns contextos de neutralização da variação, dentre os quais o emprego de formas cristalizadas (músicas e expressões idiomáticas) e a neutralização vocálica do morfema junto ao elemento subsequente (elisão do morfema modo temporal). A exclusão desses contextos fez-se necessária a fim de garantir uma análise mais consistente dos dados.

Como toda variável linguística materializa-se encaixada em sua estrutura linguística e social, coube-nos delimitar as variáveis explanatórias adequadas para a investigação do

fenômeno. Das leituras e reflexões acerca do tema, destacaram-se alguns aspectos sociais e linguísticos importantes que compuseram a nossa chave de codificação das ocorrências.

A fim de identificar os condicionamentos que atuam sobre o imperativo em nossas variedades linguísticas, elencamos aspectos sociais gerais, faixa etária e sexo dos informantes, ao lado de aspectos caracterizadores de nossas amostras, tais como o nível de escolaridade (analfabeto e semialfabetizados), estada fora da comunidade, rede de relações sociais e exposição à mídia como grupos de fatores a serem controlados em nossa análise.

Além disso, foram assumidos como fatores sociais do grupo comunidade os povoados e municípios de fala tratados na pesquisa bem como a divergência zona rural x sede que caracteriza os corpora dos municípios de Santo Antônio de Jesus e Poções, variável tratada sob o rótulo zona (rural ou sede).

Para a investigação dos condicionamentos linguísticos, definimos grupos de fatores ligados ao verbo (morfologia verbal, paradigma flexional do verbo, paralelismo fônico/conjugação verbal, saliência morfofonológica), à estruturação da sentença (polaridade da estrutura, presença do pronome sujeito, presença do pronome complemento, presença do vocativo) e ao discurso (paralelismo discursivo, pronome empregado com o interlocutor, característica da unidade textual, tipo de interlocutor, gradação semântica, tipo de discurso). A descrição dos fatores e das hipóteses apresentadas para os condicionamentos propostos foram descritas ao longo da discussão deste capítulo. No entanto, para alguns fatores, cujos resultados esperados partem de proposições relacionadas especificamente a cada um dos corpora, optamos por apresentá-las por ocasião da análise.

Todos os dados levantados e codificados foram submetidos ao pacote de programas Goldvarb, versão para Windows do programa VARBRUL (PINTZUK, 1988), mantendo-se a ressalva de que o alcance do programa restringe-se ao tratamento quantitativo, o qual, embora tenha muito a nos indicar sobre o funcionamento do fenômeno, está sujeito à capacidade interpretativa do pesquisador.

Cabe destacar que, embora esta pesquisa se construa a partir de um modelo sólido, cujos princípios foram descritos da maneira mais objetiva possível, sobretudo para a definição das variáveis explanatórias, é preciso sublinhar a necessidade de certa flexibilidade. Durante a condução do trabalho de análise, o tratamento dos dados pode requerer a criação de novos arranjos nos grupos de fatores e isso, sem dúvida, é o tratamento esperado para uma análise que não se encerre em si. Destacamos que estes e outros casos que promovam qualquer tipo de mudança em relação ao método aqui exposto serão explicitados ao longo da análise.