• Nenhum resultado encontrado

Anexo IV – Paradigmas de comportamento vocal – Valores totais de intensidade relativa dos parciais

Em 4.2, estes processos serão objecto de uma análise mais aprofundada, quando nos detivermos nos aspectos químicos da transmissão de informações através do sistema nervoso.

6. Indicadores vocais da emoção – Introdução

6.2. Parâmetros acústicos da voz

Antes de se proceder à análise das alterações vocais e a sua relação com estados afectivos, é necessário definir os parâmetros acústicos que caracterizam a voz, bem como a sua génese muscular e respiratória.

Para começar, o conceito de ‘altura do som’. Quando nos referimos à voz falada, é mais correcto identificá-la como ‘frequência de fonação’. No caso da voz cantada, embora se trate de um fenómeno semelhante, apresenta várias características que a distinguem como um caso específico. Em primeiro lugar, a frequência de fonação é uma característica individual, e as suas variações são de amplitude muito menor do que as que constituem uma obra musical. Em segundo, estas dependem apenas do indivíduo, variando com aspectos específicos da prosódia, como a expressão que se pretende atribuir a determinados aspectos do discurso, ou ao estado afectivo do sujeito no momento da elocução. As variações de altura de um texto musical cantado foram previamente determinadas pelo compositor, e o intérprete está obrigado a respeitá-las com todo o rigor. De qualquer modo, a altura do som corresponde à sua frequência, isto é, em termos acústicos, ao número de vezes que as cordas vocais abrem e fecham por segundo. Há vários processos que fazem variar este parâmetro, sendo o aumento da pressão subglótica e o grau de tensão da musculatura laríngea os mais relevantes. A pressão subglótica é determinada pela pressão exercida pelos grupos musculares envolvidos no processo da respiração, tanto expiratórios como inspiratórios. Embora esta questão seja específica da técnica vocal, pelo que não será aprofundada, importa sublinhar que a pressão subglótica depende da relação entre a pressão exercida sobre os pulmões pelos músculos expiratórios e o grau de adução das cordas vocais. Este processo segue a lei de Bernoulli, ou seja, logo que a pressão do ar ultrapassa a tensão exercida pelas cordas vocais, estas deixam escapar o ar até que a tensão volta a impedir a sua saída. No entanto, o aumento da pressão subglótica não tem como efeito, por si só, o aumento de frequência. Esta varia devido a outros factores, como o ajustamento da pressão ao grau de tensão das cordas vocais, determinado pelos músculos de que dependem. No caso do canto, este processo é muito mais complexo, e obriga ao desenvolvimento da capacidade de emitir sons com variações muito elevadas de altura sem que haja um aumento correspondente da pressão subglótica, que está directamente relacionada com a intensidade.78 No entanto, embora o aumento de intensidade dependa do aumento de pressão, independentemente da frequência, o aumento de frequência também é acompanhado de um ligeiro aumento de pressão,

78 - Muitas vezes, quando nos referimos à voz falada, a intensidade é designada como ‘altura’, como quando se diz de alguém que está a falar muito alto, ou muito baixo. Neste trabalho, este indicador será sempre designado como ‘intensidade’, embora se possam definir vários padrões para o cálculo da intensidade, que podemos resumir a três situações distintas: a intensidade do som na proximidade do emissor, na do ouvinte, e à intensidade como parâmetro subjectivo, dependente de outras variáveis que modificam a percepção, como estados afectivos ou situações sociais, por exemplo.

mesmo quando a intensidade permanece constante (RUBIN ET AL., 1967). Para aumentar a frequência sem aumentar a intensidade, é necessário um ajustamento da relação entre a pressão subglótica e o grau de tensão das cordas vocais, que varia com o aumento da distância entre as suas estruturas terminais, as cartilagens tiróide e aritenóide, através da contracção dos músculos cricotiróides (SUNDBERG, 1987).

A emissão da voz depende de três factores complementares, cujos agentes são os componentes do tracto vocal. Em primeiro lugar, é necessário que o ar contido nos pulmões seja pressionado, o que é feito através dos músculos inspiratórios e expiratórios. O diafragma é o mais importante músculo inspiratório, mas não o único. Nesta função, é ajudado por outros músculos que aumentam o volume torácico, como os intercostais, o esternocleidomastoideu ou o pectoralis

minor. A acção dos intercostais, no entanto, parece ser limitada79, contraindo-se para se oporem à

pressão atmosférica (PINA, 1999). No entanto, à medida que os níveis de domínio da técnica vocal aumentam, o cantor vai desenvolvendo uma capacidade de controlo muito mais eficaz de todos os grupos musculares envolvidos no processo. A expiração é provocada pela distensão do diafragma, que regressa à sua posição inicial, e pelos grupos musculares que diminuem o volume torácico, como os abdominais e os intercostais. Esta primeira função é a de compressão, e é ela que possibilita a segunda, a produção de som, por meio da vibração das cordas vocais, que funcionam como oscilador. O som original, a fonte sonora, é transformado em som vocal através da acção dos ressoadores, que constituem o tracto vocal, e alterado por meio dos articuladores, os lábios, a língua, o palato mole (velum palatinum) e a maxila. O som produzido na sua forma primária, nas cordas vocais, é formado no início do tracto vocal, e possui apenas algumas características básicas, como a altura e a intensidade, e é virtualmente igual para todas as vozes. O seu espectro é constituído por um conjunto de sons, designados ‘parciais’, de que o mais grave é a fundamental, designado por F0. Os restantes são os harmónicos, múltiplos de F0. A frequência dos parciais constitui uma série de harmónicos, sendo a frequência de um parcial N igual a N×F0. Este conjunto de sons é transmitido para o tracto vocal pelo oscilador glotal, as cordas vocais, e é levado até à extremidade aberta, definida pelo espaço entre os lábios. Nesta segunda fase, o tracto vocal, funcionando como ressoador, transforma o som original num som com características distintivas, denominado ‘som vocal’.

As características do som vocal variam devido a alterações ao nível da pressão, ao nível da emissão do som, ou ao nível dos ressoadores. A pressão do ar pode sofrer variações tanto a nível dos músculos respiratórios, alterando a pressão exercida sobre o volume torácico, como dos músculos laríngeos, alterando o grau de tensão glotal. A relação entre estes dois factores vai definir

79 - Os músculos intercostais não podem ser considerados músculos inspiratórios ou expiratórios (Pina, 1999).

o grau de pressão subglótica e o tipo de voz emitido, que pode variar desde a voz tensa, quando há excesso de pressão expiratória e de tensão do músculo vocal, à voz soprada, no caso inverso, quando há hipotonicidade muscular, com tensão insuficiente no músculo vocal e consequente abaixamento da pressão do ar. Entre ambos os quadros, teremos uma variedade de tipos de voz, desde a voz frouxa à voz plena, relacionados com estados emocionais e afectivos específicos. Podemos considerar três casos diferentes de emissão soprada, desde o sussurro, geralmente voluntário, em que há uma abdução parcial das cordas vocais, formando um espaço mais largo no terminal posterior da glote, entre as cartilagens aritenóides. As cordas vocais encontram-se simultaneamente sob grande tensão e grande abdução, pelo que não chegam a entrar em vibração, resultando num ruído característico devido à elevada turbulência. Outro caso é o da emissão acompanhada de sopro, em que a glote assume uma forma de [Y], mantendo uma abertura triangular mesmo durante a fase fechada, que passa a quase fechada neste caso. Este quadro resulta de uma deficiente contracção dos músculos inter-aritenóides, com origem na superfície posterior de uma cartilagem aritenóide e inserção na superfície correspondente da outra, responsáveis pela adução dos processos vocais das cartilagens aritenóides. Como resultado desta configuração, temos uma fonação caracterizada por um espectro harmónico misturado com um ruído sibilante de alta-frequência constante, provocado pelo ar que se escapa sem ter participado no processo vibratório provocado pelas cordas vocais. Pode haver um terceiro tipo de emissão soprada, causada por uma incapacidade de as cordas vocais fazerem contacto ao longo de todo o seu comprimento, resultando numa espécie de sussurro com uma componente falada.

No caso em que a resistência glotal é muito elevada, determinada pelo grau de adução dos músculos laríngeos associada a um fluxo de ar transglotal extremamente reduzido, mesmo sob grande pressão subglótica, o resultado é a voz tensa, ou pressionada, que pode chegar a soar a voz forçada.

As alterações a nível da emissão vão provocar alterações na altura do som, a nível da frequência. As características do timbre de um som vocal dependem da distribuição relativa da energia pelos formantes parciais, determinada pelo comprimento e pela forma que o tracto vocal assume durante a emissão.80 O comprimento é determinado pela distância da glote até à abertura labial e a forma varia ao longo do seu eixo longitudinal, quer aumentando ou diminuindo a área de cada secção transversal, quer a sua forma, através dos ressoadores e dos articuladores.

O comprimento do tracto vocal pode ser alterado aumentando a distância entre a glote e os lábios, quer pela elevação ou abaixamento da laringe, quer pela retracção ou protrusão labial. Um

80 - O tracto vocal tem a capacidade de ajustar a sua forma de modo a conseguir uma optimização da transferência das formantes parciais, ou seja, as frequências parciais próximas de uma formante podem ser ajudadas no seu caminho em direcção à saída, tornando se mais fortes no som radiado pela abertura labial do que as outras parciais mais afastadas (Sundberg, 1987).

alongamento do tracto provoca um aumento da energia nas frequências formantes mais baixas, e um encurtamento, uma diminuição. O efeito das alterações na forma da secção transversal ao longo do tracto pelos articuladores é bastante mais complexo, e difícil de sistematizar. No entanto, é possível relacionar algumas dessas modificações com determinadas alterações dos parâmetros acústicos. Por exemplo, os lábios podem ser arredondados, afastados, esticados ou retraídos. A mandíbula pode ser movida para cima ou para baixo, para a frente e para trás. A língua pode tomar uma série de formas e posições: subir e ser empurrada para a frente, contra o palato duro; pode subir e ser puxada para trás, aproximando-se do velum, ou ser puxada para trás e para baixo, constringindo a cavidade faríngea. O velum pode ser elevado, fechando a ligação entre o tracto vocal e o tracto nasal, ou abaixado, mantendo aberta a passagem entre as cavidades da boca e do nariz. A laringe pode ser elevada ou abaixada, mas também pode sofrer algumas alterações na forma devido à mobilidade das cartilagens aritenóides. Qualquer movimento executado por um articulador irá reflectir-se na frequência de todos os formantes. A protrusão dos lábios ou o estreitamento da abertura labial provocam um abaixamento nas frequências formantes, como se pode ver abaixo, no Gráfico 1. O mesmo sucede com o abaixamento da laringe (Gráfico 3). O aumento da abertura maxilar provoca um aumento da frequência de F1 (Gráficos 5 e 6). A posição da língua reflecte-se sobretudo em F2. Quando a língua se aproxima do palato causando constrição na parte anterior do tracto, como no caso da vogal [i], esta é elevada maximamente (Gráfico 7). Quando a constrição se verifica a nível velar, F2 atinge um nível muito baixo (Gráfico 8). Se a constrição se der a nível da faringe, esse abaixamento é menor (Gráfico 4). No caso de haver simultaneamente constrição labiovelar do tracto vocal e protrusão labial, como no caso da vogal [u], F2 atinge o seu valor mais baixo (Gráfico 9). A posição da ponta da língua determina o espaço definido entre a sua secção anterior e os incisivos. Quanto mais se aproxima, menor é o espaço, o que se traduz numa elevação de F3. Quando este espaço é grande, a frequência de F3 é baixa, o que acontece quando aumenta a distância entre a ponta da língua e os incisivos.

As frequências formantes mais baixas dependem mais directamente da posição dos articuladores, sendo por isso as mais decisivas na definição da qualidade das vogais. Num adulto masculino, F1 pode variar entre 250 e 1000 Hz, F2 entre 600 e 2500 Hz, e F3 entre 1700 e 3500 Hz. F4 e F5 dependem mais do comprimento do tracto vocal do que dos articuladores, estando F4 mais dependente da forma do tubo laríngeo (SUNDBERG, 1987).

Podemos ver abaixo a representação gráfica da relação de intensidade dos parciais até F7 com a fundamental durante a emissão da vogal [a], com protrusão e retracção labial. É bastante claro o aumento de intensidade dos formantes mais baixos provocado pelo alongamento do tracto através da protrusão ou arredondamento labial.

Gráfico 1 – protrusão labial Gráfico 2 – retracção e elevação labial

De seguida, podemos observar uma situação semelhante decorrente do abaixamento e elevação da laringe. O alongamento do tracto nestas condições provoca um aumento muito sensível de F2 e F4, ao passo que o seu encurtamento favorece uma concentração superior de energia em F3.

Gráfico 3 – abaixamento da laringe Gráfico 4 – elevação da laringe

Nos dois gráficos seguintes, a alteração da relação de intensidade dos parciais provocada pela abertura maxilar, sendo particularmente sensível o aumento de F1:

Nos gráficos 7 e 8, as diferenças resultantes da constrição da zona anterior do tracto vocal, através da aproximação da língua do palato duro e da zona velar. É particularmente significativa a grande variação de F2, que apresenta um ganho de intensidade notável no primeiro caso, contrastando com a drástica descida no segundo, e o aumento muito significativo de F1 e dos restantes parciais a partir de F3, no segundo caso.

Gráfico 7 – aproximação da língua ao palato Gráfico 8 – aproximação da língua à zona velar

No gráfico 9 temos o caso da vogal [u], onde se verificam simultaneamente a protrusão labial com o consequente estreitamento da abertura labial, e a oclusão velar, resultando na diminuição máxima de F2:

Gráfico 9 – protrusão labial e oclusão velar (vogal [u])

No caso da voz cantada, as principais diferenças relativamente à voz falada dependem do desenvolvimento técnico do cantor. Na fase inicial do estudo, o som emitido pelo aluno não apresenta grandes diferenças. As características distintivas vão-se acentuando à medida que o nível técnico aumenta. Em primeiro lugar, temos as diferenças de altura da frequência fundamental. Na fala, mesmo sob condições emocionais intensas, como a ira ou o desespero, talvez os casos mais extremos, a sua amplitude de variação da altura é muito menor do que a requerida mesmo para cantar, mesmo uma peça de grande simplicidade técnica e musical. Na maior parte dos casos, a

amplitude requerida para a execução de uma peça é superior a uma 12ª. A intensidade também é muito superior no caso de uma obra cantada, porque o cantor tem que ser ouvido por um público de largas centenas ou, por vezes, mesmo milhares de pessoas, sem outra amplificação que a fornecida pelas suas capacidades técnicas. Mesmo no caso de um recital acompanhado por um instrumento, numa sala relativamente pequena, o cantor está a comunicar com um público constituído, no mínimo, por muitas dezenas de pessoas. Mesmo quando o cantor pretende simular uma emissão de intensidade muito baixa, é necessário aplicar mecanismos técnicos que permitam a sua inteligibilidade.

A maior diferença entre a voz falada e cantada reside na distribuição da energia pelas frequências formantes. Podemos observar na figura 8 o espectro de um som emitido por uma voz masculina falada, emitindo a vogal [a] e na figura 9 a mesma vogal cantada (Lá2). É evidente a amplitude de banda muito superior no caso da voz cantada com técnica vocal, com uma concentração de energia em duas zonas distintas, a primeira entre F0 e F5, e a segunda, acima de F12, na região entre 2800 Hz e os 3300Hz. É também claramente visível o vibrato, fenómeno distinto do shimmer e do jitter, tipos de perturbação da onda que serão analisados em 6.4, quando forem abordados os diversos tipos de ruído. O vibrato é produzido por um conjunto bastante complexo de processos técnicos, cuja análise transcende os objectivos deste trabalho, mas que é claramente mais sensível nos parciais mais afastados da fundamental, ao contrário dos diversos tipos de tremor.

Figura 12 – Vogal [a] – voz masculina falada Figura 13 – Vogal [a] – voz masculina cantada

Verifica-se a mesma diferença de qualidade e quantidade dos formantes no caso de uma voz cantada sem técnica vocal. Abaixo podemos ver a vogal [a] por uma voz feminina falada, na figura 10, cantada sem técnica vocal, na figura 11, e cantada com técnica vocal, na figura 12.

Figura 14 – Vogal [a] – voz feminina falada

Figura 15 – Vogal [a] – voz feminina cantada sem técnica

vocal

Figura 16 – Vogal [a] – voz feminina cantada com técnica

vocal

É visível uma amplitude de banda muito superior quando se aplica a técnica vocal, com uma distribuição de energia que atinge zonas muito afastadas da fundamental, a que se convencionou chamar “formante do cantor”, embora não se trate de um parcial específico, mas de um pico de energia de vários parciais de elevada frequência na zona dos 3 kHz, um fenómeno referenciado pela primeira vez por Bartholomew (BARTHOLOMEW, 1934), e comentado por Winckel (WINCKEL, 1952; 1953; 1954; 1956; SUNDBERG, 1968; 1969; 1972; 1987; apud SUNDBERG, 2003)81.

81 - “O termo formante é um tanto ou quanto problemático neste contexto. O formante do cantor é mais um pico de espectro do que um formante. Chamar-lhe formante está de acordo com a ideia de que um formante é equivalente a um pico no espectro. Esta ideia pode ser útil para aplicações relativas à fala, mas não ao canto: numa fundamental de 880 Hz, cada parcial é um pico no espectro. Deste modo, com esta definição de formante, cada parcial torna-se um formante. Apesar disso, o termo ‘formante do cantor’ é hoje amplamente aceite”. (Sundberg, 2003)

6.3. Indução de estados emocionais através da alteração de parâmetros acústicos na fala e no

Outline

Documentos relacionados