• Nenhum resultado encontrado

2 SÂNDI VOCÁLICO EXTERNO: PERSPECTIVAS HISTÓRICAS E

4.4 Instrumento de Pesquisa

Os programas do pacote computacional VARBRUL2S constituiram o instrumento utilizado para a análise estatística dos dados obtidos através das gravações que compõem o

banco VARSUL. O VARBRUL2S calcula um número geral de ocorrências para cada fator das variáveis, além de calcular as suas porcentagens e pesos relativos.

Os programas que compõem o pacote VARBRUL podem ser relacionados a três grupos essenciais para a análise: o grupo que prepara os dados para a performance do algoritmo (CHECKTOK, READTOK, MAKE3000); o que gera o algoritmo (VARB2000) e o grupo que realiza tarefas de apoio (TSORT, TEXTSORT e CROSS3000) (cf. SCHERRE, 1992)

A rodada do CHECKTOK, primeiro programa a ser utilizado, depende da organização prévia do arquivo de dados, devidamente codificados, e do arquivo de especificações. O arquivo de dados é composto pelas ocorrências coletadas sobre o fenômeno em estudo e o arquivo de especificações, pela lista dos símbolos utilizados para codificação de cada fator das variáveis independentes e variantes da variável dependente. O CHECKTOK faz uma comparação entre os símbolos que aparecem nos dois arquivos e verifica possíveis erros de digitação ou codificação, por exemplo: pode indicar a ocorrência de um símbolo x na segunda coluna do arquivo de dados que não está sendo esperado para tal coluna no arquivo de especificações. Após a correção do arquivo de dados, o programa CHECKTOK deverá ser rodado novamente, para que gere o arquivo corrigido, que será utilizado pelo READTOK.

O READTOK tem como função a leitura do arquivo corrigido e a escrita de um novo arquivo, que considere apenas as informações sobre o contexto de ocorrências, oferecidas através dos códigos atribuídos a cada fator. Parênteses iniciais e transcrições das ocorrências, por exemplo, serão eliminados. O arquivo de ocorrências possibilita a rodagem do MAKE3000.

Além do arquivo de ocorrências, para que o MAKE3000 possa ser rodado, faz-se necessária a criação do arquivo de condições. O arquivo de condições é organizado pelo pesquisador, que indicará ao programa como seus dados deverão ser considerados durante a análise. No arquivo de condições as variáveis serão informadas através de um número, o qual representa a sua colocação na ordem como foi feita a codificação. É também nesse arquivo que serão indicados os possíveis amálgamas e cruzamentos. O arquivo gerado pelo MAKE3000 será o arquivo de células, que fornece a percentagem de aplicação para cada fator das variáveis consideradas e o total de aplicação.

O passo seguinte é a realização da rodada do VARB2000, programa que gerará o peso relativo, indicativo da probabilidade de aplicação da regra para cada fator. Para a rodada com o VARB2000, é necessário não só o arquivo de células, como também o de condições, que deverá ser reformulado conforme as informações do arquivo de células. O knockouts, casos de ocorrências de variáveis que apresentam como resultados 100% ou 0% de aplicação, devem ser eliminados da pesquisa, pois não representam variação. O VARB2000 não roda arquivos com número de células maior do que duas mil. Nesses casos as soluções tomadas são: realizar os amálgamas ou rodar variáveis lingüísticas e sociais separadamente.

O VARB2000 é uma etapa do VARBRUL 2S realizada em níveis (LEVELS), organizados de 0 a x, em que x representa o número de variáveis independentes selecionadas como estatisticamente relevantes mais um. Caso todas as variáveis sejam selecionadas como estatisticamente relevante o número de níveis será exatamente igual ao número de variáveis. No nível 0 calcula-se o input, que é a probabilidade de aplicação da regra variável quando o efeito das variáveis é neutro. No nível 1, o programa calcula o peso relativo de cada variável, selecionando aquela que se apresenta como mais significativa. A variável escolhida passa a ser relacionada com as demais, duas a duas, até que outra variável seja selecionada, alterando o processo para três a três e assim realiza-se sucessivamente. O processo que seleciona as variáveis estatisticamente relevantes é chamado de step up.

O step down realiza o processo inverso ao realizado pelo step up, pois seleciona variáveis menos relevantes para a regra em exame de forma regressiva. Possibilita ao pesquisador verificar se as variáveis que não foram selecionadas pelo step up poderão ser eliminadas do estudo.

Os pesos relativos resultantes da análise estatística serão considerados como favorecedores ou não a partir de um ponto de referência, ou valor neutro, 0,50. Todos os fatores em que a aplicação ultrapassa o ponto de referência podem ser considerados favorecedores, já os que estão abaixo de 0,50 são considerados pouco favorecedores.

Os programas de apoio (TSORT, TEXTSORT e CROSS3000) não participam do processamento dos pesos relativos, mas podem ser úteis para a procura por codificações especificas ou para conferência dos dados. O TEXTSORT e o TSORT recebem como entrada o arquivo de dados ou o arquivo corrigido. O primeiro pode realizar a cópia de todas as

ocorrências digitadas para outro arquivo da maneira solicitada pelo pesquisador. Já o segundo, TSORT, realiza a procura de condições específicas, permitindo a criação de um arquivo que contenha apenas os dados desejados pelo pesquisador. Uma das mais importantes utilidades do TSORT é, no entanto, a possibilidade de identificar erros que não poderiam ser encontrados pelo CHECKTOK, como classificação inadequada quanto aos fatores em análise. Em casos como esse, o TSORT possibilita ao pesquisador a criação de um arquivo apenas com os dados que receberam determinada classificação.

O CROSS3000 recebe o arquivo de células como entrada e gera um arquivo de cruzamento entre variáveis independentes, oferecendo uma percentagem geral para cada célula gerada a partir do cruzamento. O arquivo gerado pelo CROSS3000 (arq.cro) permite observar as relações de dependência entre uma e outra variável, ocasionadas pela distribuição não-equilibrada das ocorrências pelas células formadas pelo cruzamento.

Tal recurso mostrou-se de grande importância para a condução do processamento estatístico de algumas variáveis lingüísticas do presente estudo, conforme será demonstrado no próximo capítulo, em que será apresentada a discussão dos resultados.

5 ANÁLISE E DISCUSSÃO DOS RESULTADOS

Este capítulo apresentará os resultados estatísticos obtidos, através da análise do Varbrul 2S, para a aplicação da regra de elisão da vogal média /o/ em Porto Alegre e Curitiba. As variáveis selecionadas como favorecedoras à aplicação de elisão serão destacadas de maneira a relacionar os resultados da análise estatística à análise lingüística.

5.1 Freqüência Global

Documentos relacionados