• Nenhum resultado encontrado

Segmentação e etiquetagem dos dados

No documento Alessandra Mara de Assis (páginas 63-69)

CAPÍTULO 4: METODOLOGIA

4.5 Segmentação e etiquetagem dos dados

Os dados foram segmentados da seguinte forma: para os dados do Experimento 1, a própria palavra foi utilizada, visto que cada palavra foi pronunciada isoladamente

em resposta às perguntas ou frases incompletas. Para os dados do Experimento 2, foram utilizados a palavra e o contexto seguinte para avaliar o fenômeno em contexto alternativo. Houve três tipos de etiquetagem para designar os dados obtidos no Experimento 1 e no Experimento 2 (seguido de consoante ou de vogal). Cada dado foi etiquetadono PRAAT10 e recebeu um rótulo constituído de um código alfabético de acordo com o Quadro 6.

QUADRO 6 – Categorias utilizadas na etiquetagem dos dados.

Indivíduos A B C D E

Sexo F M

Idade J A

Item 28 palavras elencadas no QUADRO 3

Modo Isolado I seg. de consoante C

seg. de vogal V

Classe de C Sibilantes S Fricativas F Oclusivas O Africadas A Nasais N Tipo de C 14 consoantes avaliadas: s, ʃ, z, ʒ, f, v, p, k, b, g, ʧ (representada pelas

letras tx), ʤ (representada pelas letras dj), m, n.

V precedente i, e, ɛ (representada pela letra y), a, ɔ (representada pela letra w) o e u. Segmento

seguinte V C

Tipo de C ou V Seguindo a mesma notação de vogais e consoantes precedentes.

A primeira posição do rótulo atribuído ao item etiquetado recebeu uma das letras de A a E e indica o participante. A segunda posição teve a letra M (masculino) ou F (feminino) para indicar o sexo do participante. A terceira posição teve as letras J (jovem) ou A (adulto) para indicar a qual faixa etária o participante pertence. Em seguida, em letras minúsculas, apareceu o item lexical analisado. Após o item lexical seguiu uma das letras: I (isolado), C (seguido de consoante) ou V (seguido de vogal) demonstrando se a palavra foi produzida isoladamente ou em contexto alternativo. Em seguida a posição demonstrou qual a classe de consoante que precede a vogal átona

10

Programa de análise de fala, desenvolvido por Paul Boersma e David Weenink, versão 5.3.09. Disponível em <http://www.praat.org>. Acesso em: 03/03/2014.

final: S (sibilante), F (fricativa), O (oclusiva), A (africada) e N (nasal). Após a notação da classe da consoante, apareceu qual das catorze consoantes investigadas precede a vogal átona final. A posição seguinte na etiquetagem tratou da vogal precedente, ou seja, a vogal tônica. Para os itens produzidos em contextos alternativos houve duas outras posições na etiquetagem, a penúltima com as letras C ou V indicando se o contexto seguinte era uma consoante ou uma vogal e a última posição tinha a consoante ou a vogal que seguia o item investigado.

Para melhor esclarecimento seguem dois exemplos. Um dado codificado como EFAchopeIOpo identifica a gravação da palavra chope produzida por uma mulher, quinta participante do grupo adulto que pronunciou a palavra em contexto isolado sendo a vogal final precedida de uma oclusiva [p] e tendo como vogal tônica [o]. O dado codificado como AMJfaceCSsap indica a gravação da palavra face produzida por um homem jovem, primeiro participante do grupo J que pronunciou a palavra tendo como consoante precedente a sibilante [s] e como vogal tônica a vogal [a]; o item foi produzido em contexto alternativo seguido de consoante oclusiva [p]. Os Quadros 7 e 8 explicam essa codificação.

QUADRO 7 – Codificação da palavra chope para EFA

QUADRO 8 – Codificação da palavra face para AMJ AMJfaceCSsap

Cada dado foi etiquetado individualmente no PRAAT e foram definidas cinco camadas de etiquetagem. Considere a Figura 6.

FIGURA 6 – Exemplo de etiquetagem

O exemplo da Figura 6 apresenta a forma de onda na parte superior, o espectrograma na parte medial e as camadas de etiquetagem nas cinco últimas linhas. O exemplo ilustra a palavra bife em que a vogal átona final foi pronunciada e foi categorizada como CMAbifeIFfi.

A primeira camada denominada palavra e marca o início e o término do item lexical em questão para medir a duração da palavra. Para a medição da palavra foi considerado o primeiro pico de onda para início e o último pico de onda para o final da mesma. A segunda camada denominada tônica contém a vogal tônica do item lexical em questão. A terceira camada denominada cons.onset trata da última posição consonantal da palavra. A quarta camada foi denominada de átona.final e mostra o início e o final da vogal a partir do primeiro pico possível de ser determinado na forma de onda até o último pico da forma de onda. A quarta camada foi preenchida quando a vogal final teve formantes explícitos e energia na forma de onda, mostrando assim a existência de uma vogal átona final. A quinta camada denominada de átona.fake foi

preenchida quando houve barra de vozeamento, ou alguma sonoridade, porém sem formantes explícitos e energia na forma de onda suficientes para designar uma vogal átona final. Quando o participante produziu a palavra sem vogal final as camadas quatro e cinco ficaram vazias mostrando o apagamento da vogal átona final. Considere a Figura 7 que ilustra a palavra laje pronunciada com a vogal átona reduzida.

FIGURA 7 – Exemplo de etiquetagem

O dado ilustrado na Figura 7 foi categorizado como BFJlajeISja. Neste caso foi produzido com algum ruído após a sibilante, no local em que deveria ocorrer a vogal átona final. Porém, não houve uma vogal plena porque não há formantes vocálicos e tampouco amplitude na forma de onda; o vozeamento, entretanto foi mantido. Sugerimos que este seja um exemplo de vogal reduzida, que categorizamos como fake (fk), porque a vogal possui forma de onda reduzida, foi produzida com algum grau de sonoridade e não possui formantes tipicamente observáveis em vogais plenas. Considere a Figura 8 que ilustra a palavra bife pronunciada sem vogal átona final.

A Figura 8 ilustra a palavra bife pronunciada sem a vogal final: [bif]. Este dado foi categorizado como CMJbifeIFfi. Como não houve manifestação de vogal átona final e nem mesmo vestígios de formantes as camadas 4 e 5 ficam vazias indicando que a palavra bife foi produzida sem a vogal átona final, ou seja, o informante pronunciou [bif].

Depois de segmentadas e anotadas as cinco camadas do TextGrid foi rodado o scriptcalculate_segment_durations.praat11 para cada um dos informantes nos dois experimentos. A partir dos scripts foram extraídos os dados de duração da palavra, da vogal tônica, da última consoante, da vogal átona plena, da vogal átona reduzida e consoante ou vogal no contexto seguinte. A partir dos scripts foram feitas as análises categórica e acústica. Os dados obtidos por meio dos scripts foram transportados para o Excel onde foram feitas as tabelas e os gráficos para as análises categórica e acústica. A análise estatística foi feita pelo qui-quadrado12, um teste de hipóteses destinado a avaliar a associação existente entre variáveis qualitativas.

11Disponível no site: https://lennes.github.io/spect/.SpeCT - The Speech Corpus Toolkit for Praat

No documento Alessandra Mara de Assis (páginas 63-69)