As Propriedades acústicas - Vogais Altas e Glides no Português Brasileiro e no Inglês Britânico

Ao utilizar os órgãos da fala, movimentamos as moléculas de ar próximas de nossa boca e as deslocamos. Quando uma molécula de ar colide em outra e oscila para frente e para trás em relação ao seu ponto de repouso, produz o som, no caso, o som da fala. Estas moléculas no trato vocal são postas em movimento pela ação das cordas vocais. Toda vez

que as cordas vocais abrem e fecham, produz-se um pulso de ar e estes pulsos vibram o ar no trato vocal, produzindo um número de freqüências distintas.

O movimento máximo das moléculas de ar para longe do ponto de repouso é chamada de amplitude de vibração. Um ciclo completo a partir deste ponto à amplitude máxima em uma direção e novamente de volta é denominado um ciclo. O período de tempo que a molécula leva para fazer o ciclo é denominado período do ciclo e freqüência de vibração é o número de ciclos – movimento das moléculas de ar para frente e para trás – a cada segundo. É também o número de aberturas e fechamentos das cordas vocais em um segundo. Sua unidade de medida é o Hertz (Hz). Por exemplo, se as cordas vocais fazem 100 movimentos em um segundo, dizemos que a freqüência deste som é de 100 Hz.

A altura melódica (“pitch”) está relacionada à freqüência de vibração, ou seja, quanto mais alta a freqüência, mais alto o tom, (O’Connor, 1973). As vogais são acusticamente definidas por dois ou três tons característicos ou formantes, podendo ser visualizados no padrão de espectro de um som da fala. (Ladefoged, 1982). Entendemos como formante, a concentração de energia acústica, ou a ressonância do trato vocal na produção de um som da fala, (Picket, 1999). Os formantes que caracterizam as vogais são resultantes dos formatos diferentes da língua no trato vocal.

Usamos o espectrógrafo para ter a representação visual dos traços acústicos dos sons da fala, na forma do espectrograma. Este é uma representação visual dos traços acústicos dos sons da fala e mostra o espectro de um som. Por sua vez, espectro é a gama de freqüências que compõem uma onda sonora. Ao analisar uma vogal no espectrograma, a intensidade de cada freqüência é mostrada pelos traços mais escuros da marca. As barras

horizontais escuras são os formantes (O’Connor, 1973). Em uma análise espectrográfica, o eixo horizontal representa a freqüência e o vertical representa a amplitude. Por exemplo, os componentes acústicos da vogal alta longa [_{i:] representando as ressonâncias no trato vocal} durante sua produção, podem ser mostrados no espectro de freqüência abaixo:

FIGURA 7 Vogal alta falada por um homem a uma freqüência fundamental7 de 120 Hz.

FONTE - CRYSTAL,1997. P. 135.

Cada pico ou amplitude de algumas freqüências demonstrados na ilustração acima, representa um formante. O primeiro formante é representado por F1, o segundo por F2 e o terceiro por F3, todos caracterizam a vogal alta anterior longa [i].

Todas as vogais e algumas consoantes têm formantes e a disposição dos formantes, principalmente os dois primeiros é que possibilita diferenciar vogais, ou reconhecê-las na fala de dois ou mais falantes distintos (Crystal, 1997).

Trataremos aqui, da caracterização acústica de vogais e glides. Vimos que glides correspondem a segmentos vocálicos sem proeminência acentual (cf. seção 5.7). Sendo

7_{Freqüência fundamental é a freqüência básica na qual um som vibra, geralmente abreviado como F0}

assim, a discussão que se segue menciona a categoria vogal, porém na prática, engloba tanto as vogais quanto os glides.

Os segmentos vocálicos são caracterizados, em geral, por três formantes e os demais formantes (F4, F5, etc.) não são necessários para a especificação lingüística de um segmento vocálico, (O’Connor, 1973). Os formantes são numerados de acordo com a ordem de suas freqüências, do mais baixo ao mais alto. São chamados de primeiro formante (F1), segundo formante (F2), terceiro formante (F3) e assim por diante. O primeiro e o segundo formantes estão intimamente ligados ao formato do trato vocal, ou seja, ao movimento dos lábios, língua, faringe e mandíbula, na articulação das vogais e consoantes. É importante primeiramente, concentrar-se nos dois primeiros formantes na produção de segmentos vocálicos. A freqüência dos formantes é determinada por três fatores, (Picket, 1999): o comprimento do trato orofaríngeo, o local de constrição no trato e o grau de estreitamento das constrições. E de acordo com estes fatores, Picket delineou regras a seguir.

O comprimento do trato orofaríngeo depende do tamanho físico do falante. Este afeta os locais de freqüência de todos os formantes do segmento vocálico, permitindo prever onde estará o pico do formante no caso de crianças, mulheres ou homens. As freqüências médias dos formantes da vogal estão inversamente proporcionais ao comprimento do trato orofaríngeo.

As formas articulatórias diferentes do trato orofaríngeo afetam os locais dos formantes. Para tal, devemos considerar os pontos de constrição na articulação das vogais, ou seja, a primeira regra é que a freqüência de F1 diminui por qualquer constrição na

metade frontal da parte oral do trato vocal. Quanto maior a constrição, menor o F1. Portanto, se a parte mais alta da língua estiver próxima ao meio do palato ou à frente deste, o F1 é mais baixo em freqüência que 500 Hz, que é a medida neutra. (Picket, 1999).

A vogal alta anterior [i] é um exemplo disso. Na TAB. 4 abaixo, as vogais [i] e [] têm a freqüência do F1 mais baixa que 500 Hz, que são 300 Hz e 360 Hz respectivamente. Como a constrição desta vogal é grande e é feita na parte frontal do trato vocal, a freqüência de F1 diminui. Quanto maior a constrição, menor a freqüência do F1.

TABELA 4

Resultados de J.C. Wells, obtidos em 1962

F1 F2 i: heed 300 Hz 2300 Hz  hid 360 Hz 2100 Hz  hood 380 Hz 950 Hz u: who 300 Hz 940 Hz FONTE: GIMSON, 1970. p.98

A segunda regra de Picket (1999), relaciona o F2 com a constrição da parte traseira da língua. A freqüência de F2 tende a abaixar devido a uma constrição na parte traseira da língua e quanto maior a constrição, menor o F2. A vogal alta [u], por exemplo, é articulada com a língua elevada na parte traseira do palato. O efeito é abaixar a freqüência de F2. De fato, esta vogal é formada por um estreitamento grande, a parte traseira da língua fica muito próxima ao palato mole, portanto freqüência de F2 é baixa por causa desta constrição pequena. Nos dados abaixo, em relação às F2 das vogais altas anteriores, as

posteriores [] e [u], têm as freqüências de F2 mais baixas, ou seja, 950 Hz e 940 Hz em relação a 2300 Hz e 2100 Hz.

A terceira regra apresentada em Picket (1999), relaciona a constrição anterior da língua com o F2. Ou seja, a freqüência de F2 aumenta em uma constrição anterior da língua. E quanto maior a constrição na parte anterior da língua, maior a freqüência do F2. (Picket, 1999). A constrição da vogal alta [_{i] é a maior, portanto, sua freqüência no F2 é} mais alta. Podemos observar este fato nos dados de Wells (1962), apud Gimson (1970), que são apresentados na TAB. 4, na página anterior. Também podemos observar nesta tabela, que o F1 da vogal alta anterior [i] é mais afastado que o F2 em comparação à vogal alta posterior [u], (Cagliari, 1997).

A regra final proposta por Picket (1999), relaciona os efeitos do arredondamento dos lábios nos formantes. As freqüências de todos os formantes abaixam com o arredondamento dos lábios. Portanto, quanto mais arredondada a vogal, maior a constrição e mais baixos são os formantes. Nos dados de Wells da TAB. 4, a vogal [_{u] é a mais} arredondada e suas freqüências de formantes são as mais baixas.

Os glides [w] e [j] possuem os traços acústicos das vogais altas [u] e [i]

respectivamente, por isso são chamados com freqüência de semi-vogais. (Crystal, 1997). Ou seja, a estrutura dos dois ou três primeiros formantes do [i] é semelhante ao do [j]. E de maneira análoga a estrutura dos dois ou três primeiros formantes do [u] é semelhante ao do [w]. O primeiro formante, F1, pode ser aproximadamente 240 Hz para os dois glides e

o F2 pode variar de 2.280 a 3.600 Hz para [j]. Já para o [w], o segundo formante pode variar de 360 a 840 Hz (Gimson,1970, p. 213). Os formantes dos glides podem também variar de acordo com as vogais adjacentes, por exemplo em [aja], o primeiro formante desce e o segundo sobe à medida que a língua movimenta de [a] para [j]. Então, o primeiro formante sobe e o segundo desce novamente, à medida que a língua volta à sua posição original da vogal [a].

Contudo, o glide [w] difere da vogal [u] em três aspectos. Primeiramente, há uma

constrição maior nos lábios no [w] em relação à vogal, isto abaixa a intensidade dos formantes F1 e F2 e causa uma maior redução no F3 e nos formantes mais altos. O segundo aspecto que difere o glide [w] da vogal [u], é que a posição da língua na produção do glide pode variar de acordo com as vogais adjacentes. Uma constrição levemente posterior da língua pode acompanhar a constrição do [w] nos lábios. Por outro lado, o segmento vocálico [_{u] precisa ter uma constrição na parte posterior da língua junto} com a constrição nos lábios.

O terceiro aspecto que diferencia o glide [w] da vogal [u] está na velocidade do movimento do trato oral na produção de cada segmento. Esta é maior na produção do [w]

nos movimentos entre duas vogais. Por exemplo, a transição de F1 na abertura de [w] para [_{a] é mais rápida que na transição de [w] para [i]}8.

Podemos perceber através de análise espectrográfica, que um ditongo é realmente um movimento, um deslize entre dois elementos vocálicos, (além de envolver um movimento articulatório perceptível), pois o espectrograma mostra a transição de formantes a partir de posições típicas de uma vogal para posições características de outra vogal, (Gimson, 1970). Os ditongos são semelhantes às vogais longas, ou seja, sua duração é maior.

Nesta seção, apresentamos a descrição das propriedades acústicas das vogais altas e os glides. Vimos que as vogais podem ser especificadas pela freqüência dos dois primeiros formantes, F1 e F2. Quanto maior a constrição da língua em relação ao palato na articulação das vogais, menor o valor de F1. E quanto maior a constrição na parte traseira da língua, menor o valor de F2. Portanto, na articulação da vogal alta anterior [i], o valor de F1 é baixo e o valor de F2 é alto.

Na vogal alta posterior [u], o valor de F1 e o de F2 são baixos (TAB. 4), os ditongos têm a duração de uma vogal longa, visível no espectrograma. É também possível visualizar a mudança de posição da freqüência do primeiro para o segundo formante, durante a modificação do formato do trato vocal na configuração de uma vogal para a outra. Os glides [j,w] quando combinados com vogais têm as freqüências semelhantes aos

8_{Não encontramos como correlato articulatório a comparação entre}_{[i] e [j]. Contudo, evidências}

ditongos. A diferença é que a constrição no trato oral na articulação dos glides é maior em relação às suas vogais altas correspondentes [i, u].

No documento Vogais Altas e Glides no Português Brasileiro e no Inglês Britânico (páginas 45-53)