Análise acústica - Variabilidade fonética na produção de formas de plural do inglês como segund

CAPÍTULO 4: METODOLOGIA

4.5 Análise acústica

A Tabela 3 sintetiza os experimentos envolvidos nesta tese e indica o cálculo utilizado para identificar o número de dados esperados. Note que cada palavra-alvo foi produzida quatro vezes em ambas as línguas, devido a duas tarefas de produção (contagem de figuras e leitura) e dois contextos de produção (palavras-alvo seguidas de pausa e de vogal). Multiplicando-se os valores de cada linha da Tabela 3, chega-se aos valores totais indicados em negrito penúltima linha (2880 dados esperados por experimento). O total de dados esperados para a tese foi de 11520.

A gravação dos dados foi realizada com o Open Broadcaster Software Studio (OBS, 2021), a uma taxa de amostragem de 48 kHz⁴³. As gravações obtidas foram convertidas para o formato de áudio WAVEform pelo software Adobe Premiere 2020 (ADOBE, 2020), que permite manter a mesma taxa de amostragem dos arquivos originais. Em sequência, os arquivos de extensão .wav foram exportados para o software Praat (BOERSMA; WEENINK, 2021), onde foi realizado o tratamento acústico. A seção seguinte descreve os procedimentos envolvidos na anotação e segmentação acústica dos dados.

áudio, em que as fronteiras de palavras segmentadas incorretamente foram corrigidas pelo pesquisador.

A segmentação dos sons avaliados na tese ocorreu por meio de inspeções visuais. Uma vez que este trabalho investiga sequências de (oclusiva + sibilante) no PB e no IL2, avaliamos a presença ou a ausência de quatro tipos de sons: (1) consoantes oclusivas (e.g. parks [pɑrks]), (2) fricativas/sibilantes alveolares (e.g. bags [bæɡz]), (3) africadas alveopalatais (e.g. potes ['pɔ.tʃis]) e (4) vogais (e.g. cheques ['ʃɛ.kis]). Para segmentar o sinal acústico da fala em softwares como o Praat (BOERSMA; WEENINK, 2021), deve-se considerar interpretações acerca da forma de onda e do espectrograma de banda larga. Os critérios de segmentação dos sons adotados neste estudo foram extraídos do manual de fonética acústica de Barbosa e Madureira (2015) e são explicitados a seguir:

1. Vogais: considerou-se os padrões formânticos (sobretudo F1 e F2) que determinam a qualidade de cada vogal. Também foi considerada a periodicidade das formas das ondas sonoras.

2. Oclusivas: foram considerados o período de silêncio, o ruído transiente (plosão) e o intervalo de tempo até o início do primeiro pulso regular da vogal seguinte.

3. Fricativas: considerou-se, sobretudo, a presença de turbulência/ruído contínuo no espectrograma. Investigou-se, também, a curva de F0, que é contínua nas fricativas vozeadas e interrompida nas não vozeadas. Por último, considerou-se a presença ou a ausência da barra horizontal de sonoridade na parte inferior do espectrograma⁴⁴.

4. Africadas: considerou-se a sequência de silêncio seguido de ruído transiente e ruído contínuo, além da presença da barra horizontal de vozeamento no caso das africadas vozeadas.

Conforme mencionado na seção 4.3, de variáveis e hipóteses, classificamos os dados do inglês em termos de produção de sequências [Cs^±], cujos níveis envolvem a presença ou a ausência de [i]. A Figura 17, a seguir, ilustra uma etapa de segmentação acústica.

44 Durante a segmentação das fricativas alveolares, buscamos não incluir os períodos de produção iniciais e finais destes sons, a fim de evitar possíveis influências coarticulatórias na detecção dos graus de vozeamento. Consideramos, sobretudo, o traçado de intensidade, que apresenta uma ascensão no início da produção das fricativas e um declínio no final da produção destes sons. Priorizou-se, a partir disto, a segmentação de regiões estacionárias visíveis no traçado de intensidade.

Figura 17 - Espectrograma e forma de onda da frase “[...] gates are seen”.

Fonte: o autor.

A Figura 17 exibe o espectrograma e o forma da onda durante a produção da frase “[...]

gates are seen” por dois participantes. No lado direito, é possível observar que ocorreu a produção da vogal [i]. A barra vertical escura (indicada pela seta) representa a pronúncia de tal vogal.

Também é possível observar, à esquerda de [i], uma sequência de silêncio seguido de ruído transiente, característico de uma consoante africada. Ou seja, houve a produção de ['ɡeɪ.tʃis] ao invés de [ɡeɪts]. Em contraste, o lado esquerdo da figura não exibe uma barra escura entre os correlatos acústicos da oclusiva [t] e da fricativa [s], indicando que não houve, neste caso, a produção de [i]. Os critérios de identificação mencionados neste parágrafo também foram utilizados durante a identificação de sequências [Cs^±] e [Cis^±] no PB.

Posteriormente, foi necessário classificar os dados do IL2 e do PB em termos de vozeamento da sibilante final. Considere a Figura 18.

Figura 18 - Espectrograma e forma da onda da frase “[...] bags are [...]”.

Fonte: o autor.

A Figura 18 exibe o espectrograma e a forma da onda durante a produção da frase “[...]

bags are [...]” por três participantes. No lado esquerdo, é possível observar que ocorreu a produção de uma sibilante/fricativa não vozeada [s], pois a barra horizontal escura (indicada pela seta de cor cinza) representa a ausência de vozeamento no sinal acústico. Em contraste, o lado direito da figura indica que houve a produção da sibilante vozeada [z], pois há a presença da barra de vozeamento (indicada pela seta de cor preta) no canto inferior do espectrograma. Por último, a parte central do espectrograma ilustra a produção de uma sibilante cujo grau de vozeamento foi parcial. A seta pontilhada indica a presença de uma barra de vozeamento translúcida.

A dificuldade de identificar visualmente a natureza das sibilantes desta pesquisa, tanto no PB quanto no IL2, motivou a adoção de uma unidade de medida que pudesse calcular de forma precisa o grau de vozeamento das sibilantes. Dentre múltiplas possibilidades, escolhemos o parâmetro razão harmônico-ruído (HNR, descrito na seção 2.2.2), sobretudo pelo fato desta medição se sobressair em ambientes cujas gravações apresentam ruído de fundo, em que outras unidades seriam menos confiáveis (GRADOVILLE, 2011)⁴⁵.

Os valores de HNR podem ser obtidos manualmente no Praat a partir dos seguintes procedimentos: após delimitar as fronteiras de uma sibilante, escolhe-se a opção Analyse

45 Este é o caso das gravações desta tese, que, devido à pandemia de COVID-19, foram capturadas remotamente ao invés de presencialmente (i.e., em cabines de isolamento acústico).

periodicity → To Harmonicity (cc) na janela Praat Objects. Em sequência, seleciona-se o objeto recém-criado e escolhe-se a opção Query → Get mean. Contudo, devido ao elevado número de sibilantes analisadas nesta tese, realizou-se a extração automática dos valores de HNR a partir da execução do script de Silva (2022).

Uma vez realizada a anotação e a segmentação dos dados, as informações foram salvas em arquivos de extensão TextGrid nomeados com um código de identificação do participante (exemplo: S01.TextGrid). Os dados foram encaminhados ao programa de análise estatística R (R CORE TEAM, 2022), através dos seguintes procedimentos:

a) gravação dos dados de cada informante em extensão .TextGrid.

b) conversão dos arquivos de extensão .TextGrid para um único arquivo de extensão .csv, através da execução do script de Silva (2022).

c) leitura de dados do arquivo de extensão .csv pelo programa R.

O R foi escolhido por ser um programa gratuito que oferece uma ampla gama de possibilidades para a análise estatística dos dados e para a plotagem de gráficos. Os procedimentos envolvidos na análise estatística serão apresentados na seção seguinte.

No documento Variabilidade fonética na produção de formas de plural do inglês como segunda língua (páginas 95-99)