• Nenhum resultado encontrado

Esclarecimentos sobre a análise estatística realizada

4.5 Procedimentos de coleta e avaliação dos dados

4.5.4 Esclarecimentos sobre a análise estatística realizada

Nesta pesquisa, os dados considerados – dos estudos transversal e longitudinal –, depois de coletados, transcritos, cadastrados e categorizados, foram analisados auditivamente.

33

As dimensões do referido gravador são: 9,9 centímetros de altura por 3,9 de largura e 2,1 cm de profundidade. O peso é de 68 gramas, incluindo as duas pilhas palito utilizadas no gravador.

Após essa análise auditiva, os dados foram submetidos ao programa estatístico Statistical Package for Social Sciences (doravante SPSS) for Windows, v. 13.034.

Neste trabalho, utilizamos o modelo de regressão do programa SPSS tanto na avaliação dos dados do estudo transversal quanto do estudo longitudinal. Esse modelo estatístico permite que se analise “a variabilidade de um fenômeno em relação a um conjunto de fatores” (OLIVEIRA, A., 2005, p. 64), para que se saiba, por exemplo, no nosso caso, por que um determinado indivíduo apresenta pronúncias diferentes para uma mesma palavra.

Utilizamos o modelo de regressão logística binária35, porque a variável dependente deste estudo, Cancelamento, apresenta apenas duas possibilidades categóricas36: cancelamento ou não-cancelamento dos sons em análise. Nas palavras de Oliveira, A. (2005, p. 64), “Esse modelo é utilizado quando se quer investigar, dado um conjunto de possíveis variáveis independentes, quais delas estão de fato associadas à variável dependente”37. É preciso dizer que, em nossas análises de regressão logística, trabalhamos com dados de peso relativo. Contudo, como o programa SPSS não apresenta resultados de peso relativo diretamente, tivemos de calculá-lo por meio de tais

34

Uma única análise foi feita utilizando-se o programa estatístico Minitab for Windows, versão 13, para dados do estudo longitudinal, o que será visto na seção 6.2, do capítulo 6.

35

As análises dos dados dos estudos transversal e longitudinal com regressão logística binária do SPSS são feitas com base em: método enter e categorical, deviation.

36

Em consonância com Pierrehumbert (2002), reconhecemos a existência da gradiência fonética; sabemos que há efeitos gradientes nos julgamentos fonotáticos. Contudo, neste trabalho, por questões metodológicas, optamos por analisar os fenômenos em estudo segundo essa perspectiva de duas possibilidades categóricas: cancelamento e não-cancelamento dos sons observados.

37

Para maiores informações sobre o modelo estatístico “Regressão logística” e até mesmo sobre parâmetros estatísticos diversos (nível de significância, p-valor, probabilidade, razão de chances, chance, desvio da média, etc.) ou sobre o programa estatístico SPSS, consultar Oliveira, A. (2005). Essa obra é uma referência interessante quanto à questão do uso da estatística na lingüística. O autor chega a fazer uma comparação entre os programas Varbrul (amplamente utilizado nos trabalhos feitos em uma perspectiva sociolingüística) e SPSS. Ao fazer uma avaliação de tais programas, o autor aponta que ele optou pelo SPSS. Contudo, para trabalhos em análise variacionista, ele sugere também o programa estatístico R (disponível em: <http://www.r-project.org/>. Acesso em ago. 2006), gratuito e de código aberto.

análises, as quais têm como um resultado o valor de “Exp(B)”, que é usado para obter o peso relativo com a seguinte fórmula: Exp(B)/ (Exp (B) +1) = valor de peso relativo.

Por meio do programa SPSS, também realizamos análises de contingência38, as quais, além de apresentarem um panorama geral dos dados, apontam para importantes resultados. Tais análises são apresentadas e discutidas para os dados dos estudos transversal e longitudinal, ao longo dos capítulos 5 e 6, respectivamente.

Um outro tipo de análise do programa SPSS aqui utilizado é o de classificação em árvore pelo método Chi-squared Automatic Interaction Detector (doravante, CHAID). O método CHAID permite que se agrupem as categorias de variáveis independentes em grupos homogêneos, chamados nós, com relação à variável dependente. Vale mencionar que as árvores de classificação pelo método CHAID, apresentadas nos dois próximos capítulos, são as próprias saídas do programa SPSS.

4.6 Sumário

Neste capítulo, foi apresentada e discutida a metodologia empregada neste estudo. Primeiramente, discutimos o método adotado, o Estudo Descritivo Exploratório, momento no qual apontamos os dois tipos de coleta aqui realizados: 1) uma coleta com todos os 12 indivíduos selecionados, para o estudo transversal e 2) seis coletas com 2

38

Segundo Oliveira, A. (2006, p. 67), a tabela de contingência é “uma tabela de cruzamento de dados de duas variáveis categóricas”. Nas análises de contingência do programa SPSS, é feita uma relação entre a variável dependente e uma variável independente de cada vez, sendo que se pode obter resultado de teste de Chi-square (ou Qui-quadrado). As tabelas de análise de contingência, assim com as de análise de regressão, apresentadas nos dois próximos capítulos, são baseadas nas saídas do programa SPSS. Tais tabelas passaram por uma edição, a fim de serem mostradas neste trabalho.

desses 12 indivíduos, para o estudo longitudinal. Posteriormente, tratamos da amostra trabalhada e do material aqui utilizado, de todo o aparato e estímulos. Por fim, apresentamos e discutimos os procedimentos de coleta e análise dos dados dos estudos transversal e longitudinal.

Nos próximos dois capítulos, analisamos os dados coletados neste estudo. Nessa ocasião, apresentamos a análise estatística realizada, discutindo os resultados obtidos. Como explicitamos neste capítulo, lidamos com dois tipos de banco de dados que refletem dois tipos de estudo diferentes. Propomos uma análise em separado para cada um desses bancos. Isso é feito a seguir, nos capítulos 5 e 6 que analisam, respectivamente, o banco de dados do estudo transversal e o banco de dados do estudo longitudinal.