• Nenhum resultado encontrado

5 OS SONS DA FALA: ALGUNS TÓPICOS SOBRE O SEU ESTUDO

5.1.1. A Fonética Acústica

Como já dito, a Fonética Acústica se volta às propriedades físicas do som, na medida em que ele é transmitido entre a produção do falante e a percepção do ouvinte. Para Kent e Read (2015 [2002]), a relevância dos estudos nessa área se manifesta, justamente, pela possibilidade de, através da observação do sinal acústico, averiguar questões relativas à articulação / fisiologia e à percepção. Segundo os autores:

O sinal acústico da fala é primeiramente o produto das operações da expressão da linguagem e a entrada para o processo de compreensão da linguagem. Assim, a representação acústica da fala é um referente básico para se entender como os humanos usam a linguagem. De certa forma, os processos de produção e compreensão da linguagem podem ser relacionados a padrões acústicos, e o estudo dessas relações é uma razão principal para a aplicação da acústica a campos como linguística,

psicolinguística, patologia de fala-linguagem e engenharia da comunicação. (KENT; READ, 2015 [2002], p.32).

O sinal acústico ajuda a uma compreensão unificada da fala. Ademais, a utilização da acústica em estudos sobre variação linguística, por exemplo, permite que se tenha um testemunho sistemático e fisicamente observável das variantes em estudo, bem como se investiguem os pormenores de um possível condicionamento fonético. Apartam-se, dessa maneira, as observações das impressões subjetivas dos pesquisadores. A denominação Sociofonética é aplicada a esses estudos.

Sobre a Sociofonética, Foulkes et al (2010) afirmam que se trata de um campo de estudos em crescimento, cujos limites vêm se tornando cada vez mais imprecisos, em razão da diversidade de enfoques dados aos seus trabalhos e de diálogos travados com outras disciplinas. Consideram, porém, que os estudos em sociofonética guardam uma identidade:

In general terms, sociophonetics involves the integration of the principles, techniques, and theoretical frameworks of phonetics with those of sociolinguistics.

[…]

In our view, the unifying theme of sociophonetic work is the aim of identifying, and ultimately explaining, the sources, loci, parameters, and communicative functions of socially structured variation in speech. In this view the goals of sociophonetics include accounting for how socially structured variation in the sound system is learned, stored cognitively, subjectively evaluated, and processed in speaking and listening. Such work contributes to the development of theoretical models in phonetics and sociolinguistics, spanning speech production and perception, with a clear focus on the origin and spread of change. Sociophonetic methods and data also contribute to theoretical models in phonology, acquisition, and long-term storage of linguistic knowledge, because of the field’s focus on fine phonetic detail, and structured variation. (FOULKES et al, 2010, p.703-704).83

Assim sendo, os estudos em Sociofonética visam a dar significado sociolinguístico aos parâmetros identificados pela pesquisa em fonética, assumindo o estudo acústico um lugar especial. Revelam, portanto, detalhes acerca da variação, os quais, possivelmente, não seriam apreensíveis ao ouvido do pesquisador e não seriam identificados por meio do suporte quantitativo somente.

83“Em termos gerais, a sociofonética envolve a integração dos princípios, técnicas e quadros teóricos da fonética com aqueles da sociolinguística.

[...]

Em nossa visão, o tema unificador do trabalho em sociofonética é o objetivo de identificar, e, finalmente, explicar, as fontes, loci, parâmetros e funções comunicativas da variação socialmente estruturada na fala. Nessa visão, as metas da sociofonética incluem dar conta de como a variação socialmente estruturada no sistema é aprendida, armazenada cognitivamente, subjetivamente avaliada e processada na fala e na compreensão. Tal trabalho contribui para o desenvolvimento dos modelos teóricos em fonética e sociolinguística, abrangendo a produção e a percepção da fala, com um foco claro na origem e propagação da mudança. Os métodos da sociofonética e seus dados também contribuem para os modelos teóricos em fonologia, aquisição e, em amplo senso, no armazenamento de conhecimento linguístico, por causa do foco do campo em detalhes fonéticos finos e variação estruturada.” (FOULKES et al, 2010, p.703-704, tradução nossa).

Adentrando o estudo acústico, compreende-se que o som da fala, enquanto uma sensação, é fruto de movimentos desempenhados pelo aparelho fonador humano. Esses movimentos são responsáveis pelo deslocamento de partículas de ar, que causam alterações de pressão no meio acústico (JOHNSON, 2012, p. 10).

Compreende-se, então, que uma forma acústica de onda é fruto das flutuações de pressão, que geram som, ao longo de um tempo determinado. A onda acústica é uma onda longitudinal, uma vez que as partículas se movem na mesma direção dela.

Kent e Read (2015 [2002]) pontuam que o sinal análogo armazenado e o sinal digital armazenado são, também, representações do sinal acústico, que derivam da possibilidade de registro e armazenamento da fala humana.

O primeiro pode ser reconhecido nas gravações efetuadas com fitas cassete e se define por preservar as características do sinal acústico, convertendo a energia sonora em energia magnética, a qual pode ser transformada em energia elétrica e energia sonora, na medida em que se recorram aos instrumentos necessários para tocar as gravações.

O segundo, o sinal digital, se refere à conversão do sinal análogo para o computador. Transforma-se, assim, energia em número, dígito. A representação digital da fala é de grande relevância para os estudos acústicos atuais, haja vista a utilização da ferramenta computacional para a realização de tais análises.

Considerando a necessidade de observação das características físicas do som, estabelecem-se, assim, as variáveis frequência, amplitude e duração como relevantes ao estudo acústico dos sons da fala.

As ondas sonoras podem ser classificadas de acordo com sua periodicidade, qualidade e extensão temporal. Esquematizam-se essas categorias na Figura 26, a seguir.

Figura 26 – Tipos de onda sonora

Fonte: Elaborado pela autora com base em Barbosa e Madureira (2015); Kent e Read (2015 [2002]) e Ladefoged (1996).

A Figura 27, adiante, exemplifica uma onda sonora simples, como as produzidas por um diapasão84, em que a noção de período se relaciona ao tempo em que a onda realiza um ciclo completo.

Figura 27 – Onda sonora simples

Para que se compreendam tais noções, aplicadas à fala humana, em específico aos sons do português, é necessário que se tenha em mente o processo de fonação.

Sinteticamente, esse se dá, na medida em que uma corrente de ar é expelida dos pulmões e passa da traqueia à glote. Nessa região, na laringe, estão as pregas vocais, que, movendo-se geram turbulência e fornecem energia para boa parte dos sons da língua portuguesa (em

84 Objeto metálico em forma de forquilha, comumente utilizado para afinar instrumentos musicais. Diz-se que o movimento do diapasão produz ondas sonoras quase simples.

QUANTO À

PERIODICIDADE

Periódicas (propriedades definidas e regulares).

Aperiódicas (irregulares; movimentos aleatórios e bruscos).

QUANTO À

QUALIDADE

Simples (frutos da vibração de um só corpo; suas características se definem em razão das propriedades desse).

Complexas (frutos da vibração de um corpo e do efeito de ressonância em corpos adjacentes; suas características são calculadas em função das ondas simples que lhe constituem).

QUANTO À

EXTENSÃO TEMPORAL

Contínuas (podem ser prolongadas ao longo do tempo).

específico, vogais, nasais e consoantes líquidas). Essa turbulência é direcionada às cavidades supraglóticas (faringe, cavidade oral e nasal). No caso de sons orais, especialmente as vogais e semivogais, que interessam a esta tese, essa onda acústica fundamental, gerada na laringe, terá suas características modificadas ao passar pela cavidade oral, entendida, a esse propósito, como um tubo acústico.

Nesse sentido, as vogais e semivogais orais, são propagadas por ondas sonoras periódicas complexas: são frutos de movimentos regulares das pregas vocais e dos corpos ao longo do trato oral. São, também, contínuas. Exemplificam ondas aperiódicas aquelas geradas pela emissão de uma consoante oclusiva ou de uma consoante fricativa desvozeadas. Em ambos os casos se têm ondas cuja fonte de energia é ora um movimento brusco gerado pela aproximação e afastamento dos articuladores, ora uma fricção produzida pelo estreitamento dos articuladores. Diferenciam-se por serem as oclusivas transientes e as fricativas contínuas.

A frequência de uma onda sonora se refere ao número de ciclos realizados pelas partículas de ar deslocadas, em virtude do movimento desempenhado pelo corpo que vibra. Auditivamente, essa noção se relaciona à sensação de altura (pitch), causando a impressão de um determinado som ser grave (frequências mais baixas) ou agudo (frequências mais altas). A frequência é uma grandeza inversamente proporcional ao período.

A amplitude, por sua vez, correlaciona-se ao desvio máximo de pressão da onda sonora, em relação à pressão atmosférica. Refere-se à sensação auditiva de volume, caracterizando um som como alto ou baixo.

A duração, por sua vez, segundo Barbosa e Madureira (2015, p.69), não é uma propriedade da onda, mas sim a medida do tempo transcorrido ente dois eventos específicos, que se correlacionam. Assim, de acordo com os autores: “O que define a duração de um som vocálico, por outro lado, são eventos assinalando o início e o final de uma característica acústica que os caracterize – nesse caso, uma ressonância produzida no trato vocal.” (BARBOSA; MADUREIRA, 2015, p.70).

Vistas essas definições preliminares, expõem-se, adiante, questões atinentes à análise acústica dos sons da fala e à teoria a ela relacionada, destacando a observação de vogais e ditongos.

5.1.1.1. A teoria fonte-filtro e a análise acústica de vogais e ditongos

Atribuem-se as ideias da teoria acústica de produção da fala, ou teoria fonte-filtro, ao engenheiro sueco Gunnar Fant.

Parte-se da ideia de que todo som precisa de uma fonte de energia. No caso dos sons da fala, de acordo com o processo de fonação brevemente descrito antes, a principal fonte se situa na laringe. Segundo Ladefoged (1996):

The source of with which we are most concerned is the human voice. Here fluctuations in air pressure are caused by a variety of means. The most important of these is the rapid opening and closing of the vocal cords. Each time the vocal folds are closed pressure is built up, which is suddenly released when they are opened. Consequently the rapid opening and closing of the folds causes a series of sharps variations in air pressure. […] the variations in air pressure affect the air in the throat and mouth in such a way that speech sounds are procedure. (LADEFOGED, 1996, p.9)85.

Assim sendo, para a maior parte dos sons da linguagem humana, dentre os quais se destacam as vogais e as semivogais, a laringe e as pregas vocais são consideradas uma fonte sonora. O movimento das pregas, que se fecham e se abrem, geram, dessa maneira, energia sonora, propagada por meio de uma onda periódica complexa. Essa onda é constituída de ondas periódicas simples, dentre as quais uma delas contém a frequência de vibração das pregas vocais (frequência laríngea) e as outras detêm todos os seus múltiplos (harmônicos).

A frequência laríngea é tecnicamente designada frequência fundamental (F0). A frequência fundamental é variável entre falantes e também pode se alterar nas elocuções de um mesmo indivíduo, em razão de questões anatômicas, no primeiro caso, e de aspectos paralinguísticos ou extralinguísticos, no segundo (funções entonacionais diferentes, ênfases, sentimentos etc.).

Como explicitado, o ar movimentado pelas pregas vocais se dirige às cavidades supraglóticas. Para os sons orais, em destaque neste estudo, o trato oral funciona como um filtro, responsável por modificar o tom laríngeo. Essa modificação se deve ao fato de tais cavidades funcionarem como ressoadores, potencializando faixas de frequências. Em síntese, “[...] a fonte sonora [...] fornece a energia, e a ação de filtragem do trato vocal a modifica produzindo os diversos sons da fala. A ação de filtragem equivale a uma modificação no domínio da frequência.” (BARBOSA; MADUREIRA, p.85).

Para a produção das vogais e semivogais orais, deve-se pensar que o ar percorre livremente o caminho da glote aos lábios, ocorrendo movimentos dos articuladores orais, de modo que o estreitamento da cavidade oral não gere obstrução. Constitui-se, assim, um tubo acústico, fechado em uma extremidade (glote) e aberto em outra (lábios).

85 “A fonte da qual nós mais nos ocupamos é a voz humana. Aqui, as flutuações de pressão no ar são causadas por uma variedade de meios. O mais importante deles é a rápida abertura e fechamento das cordas vocais. Cada vez que as pregas vocais são fechadas, a pressão é acumulada, a qual, repentinamente, é liberada. Consequentemente, a rápida abertura e fechamento das pregas causa uma série de variações agudas na pressão de ar. [...] as variações na pressão de ar afetam a faringe e a boca de tal modo que os sons da fala são produzidos.” (LADEFOGED, 1996, p.9, tradução nossa).

Nesse tubo, formam-se ondas estacionárias, cujas frequências de ressonância são determinadas pelo comprimento do tubo e pela seção transversal em função do seu comprimento (em decorrência dos movimentos articulatórios).

Kent e Read (2015 [2002], p.45) afirmam que o a relação entre a fonte e os ressoadores, a esse propósito, são de independência. Ou seja, para um mesmo falante, uma mesma vogal não perderá a sua distintividade fonética ainda que o tom vocal (pitch) seja mais grave ou agudo, uma vez que esse é determinado quase exclusivamente pela vibração das pregas vocais.

As ondas estacionárias ou ondas de ressonância recebem a nomenclatura de formantes. Sobre esses, os autores esclarecem:

Um formante é um modo natural de vibração (ressonância) do trato vocal. Teoreticamente há um número infinito de formantes, mas para propósitos práticos só utilizaremos os três ou quatro formantes mais baixos. Os formantes são identificados pelos seus números, por exemplo, F1, F2, F3, F4, numerados em sucessão a partir das frequências mais baixas dos formantes.

[...]

Os formantes não fornecem energia; eles apenas modificam a energia fornecida por uma fonte. Os formantes são determinados pelo formato e comprimento do trato vocal, mas eles se tornam fisicamente evidentes apenas quando são ativados por uma fonte de som como o vozeamento ou o sussurro. (KENT; READ, 2015 [2002], p.48- 49).

As frequências dos formantes refletem, desse modo, aspectos fisiológicos (tamanho do trato vocal) e linguísticos (relação entre as frequências dos formantes, que caracterizam sons diferentes). Formantes, assim, são propriedades de um tubo acústico. Na medida em que ocorre a ressonância, reforçam-se frequências e criam-se ondas ressonantes. Barbosa e Madureira (2015, p.94) afirmam que apenas os sons bilabiais não possuem formantes, visto que são produzidos nos lábios e, na fala habitual, passam daí para o meio exterior, sem que se forme um tubo.

Neste estudo, no que concerne às observações acústicas que se propõem, serão verificados os valores das frequências do primeiro (F1) e do segundo formantes (F2).

No que tange à relação acústico-articulatória, para as vogais, deve-se compreender que essas se distingam por dois movimentos: (i) elevação da língua (altura) e (ii) avanço-recuo da língua (constrição). Associa-se o primeiro movimento a F1, enquanto o segundo é correlato de F2.

O valor de F1 é inversamente proporcional à elevação da língua: quanto mais alta a vogal, menor o valor de F1. O valor de F2 se relaciona com o avanço-recuo da língua na medida em que quanto mais anterior seja uma vogal, maior o seu valor de F2. No PB, portanto, as

vogais [a] e [E] possuiriam maiores valores para F1 do que as vogais [i] e [u]. As vogais [i] e [e], por sua vez, teriam maiores valores para F2 do que as vogais [u] e [o].

A análise espectrográfica de vogais leva em consideração o fato de, visualmente, representarem mais energia do que outros sons ressoantes e apresentarem um período estático (BARBOSA; MADUREIRA, 2015, p.180).

Na medida em que os ditongos são compreendidos como “[...] uma vogal que muda uma vez de timbre, no curso de sua emissão, de modo que se ouve certa qualidade vocal no início e outra no fim.” (DUBOIS et al, 2006, p.202), a sua análise é similar à que se propõe para as vogais. Diferem-se dessas últimas pela dinamicidade; pela rápida mudança na configuração do trato vocal: “Os ditongos e glides são associados com uma estrutura formântica em mudança gradual.” (KENT; READ, 2015 [2002], p.87).

Dessa maneira, durante uma análise espectrográfica de ditongos é possível estabelecer critérios para separar seus elementos constitutivos, desde que se identifiquem os pontos em que há mudança na trajetória dos formantes.

Expostas, brevemente, as questões pertinentes à teoria acústica da fala, apresentam-se, a seguir, estudos referentes à descrição acústica de vogais de variedades do PB.

5.1.1.2 As vogais do português sob a perspectiva acústica

Nesta seção, destacam-se alguns trabalhos relativos às vogais do PB, sob o escopo da Fonética Acústica.

Antes de abordar os estudos especificamente voltados para o português, porém, vale tratar do método das vogais cardeais, determinado por Daniel Jones, em 1917, e desenvolvido por Abercrombie, em 1967. Esse método, de modo geral, valida os estudos sobre vogais. Por meio desse sistema, adotam-se pontos de referência para descrever as vogais. Segundo Silva (1999):

As vogais cardeais são de qualidade invariável e exatamente determinadas. A descrição de vogais específicas de uma língua tomará como referência os pontos correspondentes às vogais cardeais. Por definição as vogais cardeais são auditivamente eqüidistantes, sendo localizadas no limite da área vocálica. (SILVA, 1999, p.129).

As vogais cardeais, são, portanto, recursos descritivos, definidas dentro daquilo que se convenciona como “área vocálica”. Essa área se estabelece no limite em que não ocorra fricção na passagem do ar na cavidade oral. Todos os segmentos articulados sem qualquer fricção são considerados vogais ou semivogais. Deve-se compreender, no entanto, que as vogais cardeais são referências, podendo coincidir, aproximar-se ou não de vogais encontradas em línguas naturais.

É comum que se definam essas vogais em termos articulatórios ou auditivos, dispondo- as em uma forma trapezoide, em que se apresentam vogais cardeais primárias e vogais cardeais secundárias. Segundo Catford (2001 [1988], p.133): “[...] the CV86s are a set of eigth tongue- configurations, five of them with unrounded lips, the remaining three with rounded lips. There is also a set of eight secondary CVs with exactly the same tongue-configurations, but opposite lip-positions87.”. Assim, para a vogal cardeal primária [i] (alta, anterior, não arredondada) associa-se a vogal cardeal secundária [y] (alta, anterior, arredondada), por exemplo.

Destacam-se, dentre as suas características, o fato de serem sempre vogais tensas e monotongos.

Em referência à configuração acústica dessas vogais, Catford (2001 [1988]) estabelece os valores para os dois primeiros formantes vocálicos. Apresentam-se no Quadro 8, a seguir, os valores de F1 e F2 para as vogais do português brasileiro.

Quadro 8 – Valores de F1 e F2 (em Hz) para as vogais cardeais

VOGAL F1 F2 [i] 240 2 400 [e] 390 2 300 [E] 610 1 900 [a] 850 1 610 [o] 360 640 [ç] 500 700 [u] 250 595 Fonte: Catford (2001 [1988], p.154).

Informa-se que a exposição desses dados se deve à necessidade de tomá-los como uma das referências necessárias para a investigação acústica que se apresenta nesta tese.

No intuito de esmiuçar as particularidades acústicas das vogais do português, relevam- se os estudos que apresentam resultados para as vogais tônicas, de diferentes variedades dessa língua. Reconhece-se, todavia, que haja resultados conhecidos para o PE (a exemplo do trabalho pioneiro de Delgado-Martins (1973)) ou outros, que lidem com o PB, mas que se reportem às

86 Do inglês “Cardinal Vowels”.

87 “As VC são um quadro de oito configurações da língua, cinco das quais com arredondamento dos lábios, as três restantes sem arredondamento dos lábios. Há, também, um quadro de oito VC secundárias com exatamente a mesma configuração da língua, mas posições dos lábios oposta”. (CATFORD, 1988, p.133, tradução nossa).

vogais átonas pretônicas ou postônicas. O recorte, entretanto, faz-se necessário, na medida em que esta tese lidará com sílabas tônicas88, no estudo acústico que ora se apresenta.

Os trabalhos, de modo geral, partem da descrição fonológica do PB apresentada por Câmara Jr. (2008 [1953]), que demonstra a existência de sete vogais orais tônicas para o português do Brasil, as quais se distribuem num sistema triangular. Esse sistema vocálico pode ser evidenciado no Quadro 9.

Quadro 9 – Vogais tônicas do PB ELEVAÇÃO DA

LÍNGUA

AVANÇO-RECUO DA LÍNGUA

ANTERIORES CENTRAL POSTERIORES

ALTAS [i] [u]

MÉDIA-ALTAS [e] [o]

MÉDIA-BAIXAS [E] [ç]

BAIXA [a]

Fonte: elaborado a partir de Câmara Jr. (2008 [1953]).

A partir dessa compreensão, os estudos testam, com base nos valores encontrados para o primeiro e o segundo formantes, as vogais existentes nos quadros fonético-fonológicos de cada variedade.

O primeiro trabalho que se cita é o de Cagliari e Abaurre (1986), que visa, inicialmente, à compreensão das relações entre padrões rítmicos e processos fonológicos no PB. Para isso, partem da leitura de um enunciado (“Amanhã vou estudar fonologia com a Bernadete”), por 12 informantes, procedentes de diversas partes do país, homens e mulheres, adultos89, de diferentes

idades.

Na análise acústica, os autores levantaram os valores de F1 e F2 para as vogais presentes no enunciado. No tratamento da duração, levaram em consideração os arranjos fonológicos