• Nenhum resultado encontrado

2.3 Modelo de produção para o português europeu

4.1.1 Composição gestual

Depois de convertido em transcrição fonética (ARPABET) e automaticamente silabificado, mediante a aplicação de um algoritmo, o texto de entrada é associado a um conjunto de gestos, segundo as especificações de um dicionário, que contém a configuração gestual de cada um dos segmentos do inglês.

Neste dicionário, os gestos são representados simbolicamente por quatro parâmetros funda- mentais: articulador envolvido na produção (organ), tipo de oscilador (osc), variável do tracto (TV) e constrição (constr), conforme exemplificado no quadro 4.1, para a fricativa [Z]1. O exemplo foi direc- tamente extraído do dicionário gestual (TADA/gest/english/gestures_english.xls) do TADA (Browman

et alii, 2001-2006), referente ao inglês.

Tabela 4.1: Definição gestual da consoante inglesa [Z], segundo os parâmetros do dicionário gestual do TADA (fonte: Browman et alii, 2001-2006). A consoante encontra-se foneticamente representada em AR- PABET (ARPA) e os gestos a ela associados são caracterizados pelo articulador (Organ), oscilador (Osc), variável do tracto (TV) e constrição (Const). Os pontos indicam que estão a ser utilizados os valores de target e stiff (rigidez da mola) pré-definidos em ficheiro independente.

ARPA Organ Osc TV Const Target Stiff

Z TT crt TTCL ALV . . TT ctr TTCD CRIT 0,16 . TT rel TTCL REL . . TT rel TTCD REL . . TB crt TBCL VEL . . TB crt TBCD WIDE . .

Velum crt VEL CLO . .

Seguindo os pressupostos da FA (vd. capítulo 2, ponto 2.2.1), os gestos traduzem-se em

cinco possíveis variáveis do tracto (TV) - Lábios (L), Ponta da Língua (TT), Corpo da Língua (TB), Velo (VEL) e Glote (GLO) - que se referem simultaneamente a duas dimensões, local (CL) e grau de constrição (CD), ambas especificadas sob a designação geral de constrição (Const)2.

Quanto à variável CL, estão previstos os seguintes descritores gestuais: os lábios podem re- ceber a especificação de dental[DENT], protruído[PRO], distendido[REL]; à ponta da língua são atribuídas as etiquetas dental[DENT], alveolar[ALV], alveolo-palatal [ALVPAL], palatal[PAL]

e distendido[REL]; o corpo da língua pode ser palatal[PAL], velar[VEL], uvular[UVU], uvofa- ríngeo[UVUPHAR]e faríngeo[PHAR].

Já o CD, divide-se em fechado[CLO], crítico[CRIT], estreito[NAR], largo[WIDE]e vocálico[V].

O parâmetro constrição é quantitativamente especificado em valores dinâmicos, num fi- cheiro independente (vd. anexo A), de acordo com os campos enumerados a seguir:

target, que corresponde à posição de equilíbrio da variável do tracto e é definido em milímetros

(CD) e em graus (CL);

alpha, um índice numérico que traduz o peso do gesto, quando este se sobrepõe a um outro

gesto pertencente à mesma variável do tracto (blending). Quanto mais alto o valor, maior a contribuição do gesto em causa.

art_wts, um indicador, fundamentado em dados reais, do envolvimento (ou peso) de cada arti-

culador na produção de uma determinada constrição. Os valores das variáveis são distribuídos percentualmente entre os verdadeiros articuladores (e.g. LX- protrusão labial; JA- ângulo da mandíbula, UH - movimento do lábio superior, LH - movimento do lábio inferior, etc.), no sentido de gerar a trajectória dos corpos físicos concretos. A execução de um gesto labial, por exemplo, implica a mobilização não só dos lábios, mas também da mandíbula. Considera-se, no entanto, estes participam na tarefa em diferentes proporções: quanto maior o valor associado a um determinado articulador, menor o seu movimento no sentido da execução da constrição em causa (vd. anexo A). Os pontos indicam tão somente que um determinado articulador não foi activado.

Adicionalmente a estes parâmetros, são definidos outros valores por defeito, mais directa- mente relacionados com a equação dinâmica simples, do tipo massa-mola, que modela os gestos. São eles a frequência natural da variável do tracto (TV frequency), estipulada em 4 HZ para todos os gestos vocálicos (associados ao oscilador v) e em 8 Hz para todos os outros, e o amortecimento do

sistema (damping ratio), cujo valor é 1.

Excepções a estes valores podem ser directamente assinaladas no dicionário de segmentos, que inclui, para além dos tópicos já referidos - organ, osc, TV e constr - campos para o target e o

stiffness3. Esta possibilidade é exemplificada na tabela 4.1, a propósito do [Z], onde o valor do target do TTCD - definido como[CRIT], o que corresponde a um target de 1 mm (vd. anexo A) - foi alterado para 0.16 mm, de modo a gerar mais fricção.

O tipo de oscilador (osc) identifica o oscilador associado ao gesto e é representativo do comportamento deste em termos de coordenação temporal. As várias classes de osciladores são espe- cificadas logo após a identificação dos articuladores envolvidos na produção, agrupados sob a desig- nação geral de organ. Às oclusivas, fricativas e glides correspondem, respectivamente, os osciladores

clo, crt, nar, associados, quase sempre (mas não obrigatoriamente), a um oscilador de release (rel). A

segunda articulação das líquidas é representada por um oscilador de tipo voc, enquanto os gestos da glote e do véu palatino implicam os osciladores h e n, respectivamente. Já as vogais estão associadas a uma constrição do corpo da língua (oscilador v) e outra dos lábios (oscilador v_round).

A composição gestual de Ataques e Codas complexas é definida como a combinatória dos gestos que compõem cada um dos segmentos da sequência. A possibilidade de um destes gestos desaparecer, em virtude da posição ocupada na estrutura da sílaba, é contemplada num conjunto de regras de excepção, que determinam o gesto a eliminar, bem como a TV subjacente4. Paralelamente, este tipo de regras permite estipular novos valores para os parâmetros constantes do dicionários de segmentos.

4.1.2 Coordenação intergestual

Durante a geração dos coupling graph, a informação sobre o tipo de oscilador correspondente a uma determinada constrição é usada na determinação automática do tipo de sincronização entre os gestos. Após o cálculo dos parâmetros de cada oscilador, que determinam os intervalos de activação dos respectivos gestos, são especificados, numa segunda fase, os padrões de coordenação entre gestos consecutivos.

A explicitação dos parâmetros do ciclo oscilatório tem como referência a equação dinâmica enunciada a seguir:

¨

xI,i = −αi˙x + βxi˙xi+ γ ˙x3i + ω 2

0ixi (4.1)

Os campos considerados incluem:

3

Tal como referido no capítulo 2 (ponto 2.2.1), o stiffness determina as características temporais dos gestos. Segundo Roon et alii (2007, p.409), “Stiffness is a measurement of articulator movement that characterizes speed independent of its displacement (...). In the motor control literature, it is an abstract control parameter with a complex of consequences in the time-space behavior of the system. For an intuitive idea of what stiffness is, imagine two springs alike in all aspects other than the material they are made of. If each spring is extended the same distance, the one that returns to its resting position faster has higher stiffness”.

4

Um dos exemplos destas regras é aquela que actua sobre o já referido (capítulo 2, ponto 2.2.2) grupo consonântico /sp/, em que o gesto de abertura glotal do /p/ é apagado.

NatFreq, definida como a frequência natural do oscilador ω0 , expressa em Hz. O algoritmo automático fixa em 6 Hz a frequência natural dos osciladores associados a gestos consonânticos, enquanto os osciladores vocálicos assumem o valor por defeito de 3 Hz;

m:n, que corresponde à frequência do oscilador expressa em valores inteiros, usada no cálculo

da razão entre m e n de qualquer par de osciladores, que, por sua vez, está na base da relação de fase entre ambos. Tendo em conta as referidas diferenças de NatFreq entre osciladores vocálicos e consonânticos, os valores correspondentes para m:n são 1 e 2, respectivamente;

escap, parâmetro utilizado no cálculo dos coeficientesα, β e γ do ciclo do oscilador;

amp_init, que corresponde à amplitude emt0 e é sempre igual a 1;

phase-init, que indica a fase do oscilador emt0, cujo valor é aleatório.

Os restantes campos (riseramp, plateau, fallramp) especificam, em graus, as fases de acti- vação e desactivação dos gestos. De um modo geral, os valores indicados por defeito mostram que os gestos V permanecem activos durante uma porção maior do seu ciclo oscilatório do que os gestos C, a que correspondem intervalos de activação mais curtos. Por sua vez, os gestos clo estão activos durante mais tempo do que as respectivas rel. Finalmente, a posição na sílaba - Ataque ou Coda - determina intervalos de activação distintos para os osciladores, sendo que em Coda estes são menores do que em Ataque.

Quanto ao tipo de coordenação estabelecida entre dois gestos consecutivos, são considera- dos três tipos de relações intergestuais, seguindo a proposta inicial de Browman & Goldstein (1986, 1989, 1990b), desenvolvida a posteriori por Gafos (2002): 1) coordenação entre gestos pertencentes à mesma sílaba; 2) interligações entre osciladores de sílabas distintas; 3) relações de gestos em fron- teira de palavra. As várias possibilidades de coordenação entre os osciladores associados aos gestos, contempladas no TADA, encontram-se no anexo B.

Tomando como entrada um determinado coupling graph, o sistema TADA é capaz de cal- cular automaticamente os intervalos de activação (entrada para o modelo task-dynamics) de cada um dos gestos presentes num dado enunciado, conforme ilustrado na figura 4.1.

As linhas coloridas simbolizam as relações de sincronismo estabelecidas entre gestos con- secutivos: o verde representa uma coordenação em fase (0 graus); o vermelho está associado a coor- denações desfasadas 180 graus; e o amarelo refere-se a todas as outras coordenações possíveis.

Figura 4.1: Pauta gestual e coupling graph da sequência tip ten, geradas automaticamente pelo TADA (fonte: Browman et alii, 2001-2006). Encontram-se representados o sinal acústico (linha superior) e pauta gestual (linhas 2 a 5). Cada rectângulo corresponde ao intervalo de activação de uma determinada variável do tracto (LA, TBCD, TTCD, VEL, GLO). As linhas coloridas simbolizam as coordenações entre os gestos.