5 MÉTODOS E TÉCNICAS DE PESQUISA
5.6 O subsídio quantitativo SPSS – Statistical Package for the Social Sciences
Consideramos esse conjunto de softwares de fácil operacionalização. Possibilita facilmente a realização de agrupamentos depois de feita a codificação; o cruzamento dos fatores que o pesquisador desejar selecionar e a observação da significância entre os fatores do mesmo grupo.
5.6.1 Os modelos estatísticos
Sobre os modelos estatísticos, Oliveira, A. (2006) ressalta:
Os modelos estatísticos [...] que permitem que se possa explicar a variabilidade de um fenômeno em relação um conjunto de fatores, são chamados de modelos de regressão. Nos modelos de regressão temos sempre uma variável, chamada variável dependente ou variável resposta, e uma ou mais variáveis explicativas, chamadas de covariáveis, variáveis independentes ou grupo de fatores, que poderão ajudar a explicar a variabilidade na variável resposta. (OLIVEIRA, A. 2006, p. 64).
Para a seleção do modelo estatístico, Oliveira, A. (2006) explica:
A seleção do modelo estatístico a ser utilizado também depende do tipo de variável resposta do estudo. Se a variável resposta fosse contínua, por exemplo, poderíamos optar um modelo de regressão linear.[...]. Esse modelo poderia ser utilizado caso a variável resposta fosse, por exemplo, a freqüência dos formantes de uma vogal, no qual teríamos observações localizadas em uma faixa contínua. Por outro lado, se a variável resposta fosse categórica, poderíamos utilizar o modelo de regressão logística. Esse modelo poderia ser utilizado caso a variável resposta fosse composta de somente duas possibilidades, por exemplo, a presença ou a ausência da marcação de plural em itens nominais. Se a variável resposta fosse categórica e apresentasse mais de duas possibilidades, poderíamos utilizar o modelo logístico multinomial. Tal modelo poderia ser utilizado, por exemplo, no estudo do pronome você, caso fossem consideradas as realizações de mais de duas variantes, considerados por hipótese como categóricas, como você, ocê e cê. (OLIVEIRA, A., 2006, p. 64-65).
Nesta pesquisa, adotaremos o modelo de regressão binomial, incluído no conjunto de softwares SPSS. Analisaremos a variação da vogal média de 2ºgrau com a vogal alta [e ~ i], [ẽ ~ ĩ], [o ~ u], [õ ~ ũ] – alçamento – e variação da vogal média de
2ºgrau com a média de 1ºgrau [e ~ ɛ], [o ~ ɔ] – abertura.
Escolhemos esse modelo em detrimento do modelo de regressão multinomial, uma vez que a variação com as três formas é rara.
Oliveira, A. (2006) explica ainda a hipótese nula e a hipótese alternativa:
Qualquer hipótese levantada para explicar estatisticamente algum fenômeno vem associada a uma segunda hipótese que nega a primeira. Tais hipóteses são chamadas, respectivamente, de hipótese alternativa e hipótese nula. Nos modelos de regressão, por exemplo, um teste estatístico poderia propor testar a hipótese nula de não haver efeito na variável dependente associado a uma variável independente. Assim, a suposição de que a variabilidade em itens lexicais terminados em /l/+vogal possa ser explicada pelo gênero dos falantes vem acompanhada da hipótese nula que sugere que o gênero dos falantes não exerce influência estatisticamente significativa sobre a variabilidade nos itens. A hipótese efetivamente testada é a hipótese nula. (OLIVEIRA, A., 2006, p.66).
Sobre o nível de significância Oliveira, A. (2006) pontua:
A probabilidade máxima aceitável de rejeitarmos a hipótese nula quando ela é de fato verdadeira é chamada de nível de significância. No exemplo acima,
o nível de significância seria a probabilidade máxima de aceitarmos que o
gênero do falante interfere na variabilidade, quando na realidade ele não interfere. O nível de significância é um valor arbitrário, definido segundo critérios do pesquisador. Convencionalmente, na sociolingüística variacionista, assim como em outras ciências, utilizamos um nível de
significância de 0,05. (OLIVEIRA, A., 2006, p.66).
Sobre pesos relativos, Scherre e Naro explicam:
- uma medida projetada, análoga à probabilidade -, que, já sabemos, medem o efeito comparativo de cada fator em relação à primeira variante especificada na rodada (o peso relativo da outra variante é o complemento para 1). O peso relativo é calculado em função de desvios em relação à média da variante analisada. (SCHERRE; NARO, 2003, p. 164)
De acordo com Naro (2003), a interpretação do peso relativo é feita da seguinte forma: é favorável à aplicação da regra, se for superior a 0,5; é inibidor, se for inferior a 0,5; e é neutro se for igual a 0,5.
É importante lembrar que
[...] os resultados numéricos obtidos pelos programas só têm valor estatístico. O valor lingüístico é atribuído e interpretado pelo lingüista. Se o lingüista for bom, certamente os resultados lhe permitirão refutar ou não as hipóteses estabelecidas quando da análise dos dados lingüísticos. Nunca é demais repetir que a estatística é apenas um instrumento valioso que pode nos auxiliar a entender um pouco mais o comportamento de fenômenos lingüísticos. (SCHERRE; NARO, 2003, p.162).
As análises estatísticas permitem ao pesquisador sistematizar uma grande quantidade de dados. Os resultados auxiliam-nos a interpretar fatos de língua, identificar mudanças em progresso e apontar tendências
Fizemos também o teste da razão da máxima verossimilhança para hierarquizar as variáveis.38 Assim, podemos saber qual grupo de fator atua favoravelmente a determinada variante e podemos medir a sua atuação frente aos demais grupos de fatores favorecedores dessa variante.
Comparamos um modelo de regressão com determinada variável (e todas as outras significativas) com outro modelo sem esta variável (com todas as outras significativas). Quando o valor do teste de uma variável independente é maior do que os demais valores dos testes das outras variáveis independentes, é possível dizer que a variável retirada explica mais a respeito da variabilidade observada e quando o valor é menor do que os demais valores, pode-se dizer que a variável explica menos.