Capítulo 1 Revisão Bibliográfica
1.1 O segmental e o suprassegmental
1.1.3 Entoação
Ladd (1996) inicia seu livro dizendo que uma das dificuldades de se escrever sobre o tema “entoação” é que esse termo significa coisas diferentes para pessoas diferentes. Em Nunes (2011), fazemos uma breve discussão sobre o esforço da literatura em distinguir, definir ou delimitar prosódia e entoação e suas funções. Grosso modo, podemos dizer que são domínios que se sobrepõem, uma vez que apresentam parâmetros suprassegmentais comuns.
A entoação, para Hirst e Di Cristo (1998), por exemplo, é uma representação abstrata que representa a competência linguística do falante (cognitivo), mas também fonética, no sentido amplo, representando a produção propriamente dita e associando os níveis físico e fonológico.
85 Intonation, as will use the term, refers to the use of suprasegmental phonetic features to convey ‘postlexical’ or sentence-level pragmatic meanings in a linguistically structured way.17
Consciente da confusão entre as propriedades físicas e psicofísicas da entoação, Ladd (1996), assim como muito outros autores, restringem- na aos parâmetros frequência fundamental (F0), intensidade e duração. Ao longo deste trabalho, vamos perceber que, apesar de podermos descrevê-los separadamente, esses parâmetros têm uma relação de interdependência e concomitância e que por isso devem ser sempre relativizados. São desses parâmetros, ditos mais relevantes para os estudos prosódicos/entonacionais, que vamos tratar a seguir.
Frequência fundamental e pitch
Vamos tentar explicar rapidamente o que seriam esses dois parâmetros. O sinal de fala é um sinal complexo. Quando o som de fala produzido é realizado com as pregas vocais em vibração, dizemos que esse sinal de fala é periódico. Nesse sinal periódico, existe um período (um pulso glotal, ou seja, o tempo de uma vibração das pregas vocais) que se repete várias vezes. A frequência de um período (T) do sinal de fala é uma frequência básica, chamada de frequência fundamental, ou F0, ou primeiro harmônico, e corresponde ao inverso do período (F0=1/T) (REETZ; JONGMAN, 2009). Assim, os valores de F0 são obtidos em Hertz a partir da fórmula F0= 1/T, sendo F0 = frequência fundamental e T = Período. Um período corresponde ao tempo que as pregas vocais levam para se afastarem e se aproximarem em cada ciclo vibratório. A frequência de vibração das pregas vocais (F0) depende da espessura dessas pregas, quanto mais espessa mais lenta a sua vibração. Por essa razão, um homem adulto que tem pregas vocais espessas vibra suas pregas em média 120 vezes por segundo; uma mulher, com pregas
17
“O termo entoação refere-se à utilização de recursos fonéticos suprassegmentais para transmitir significados pragmáticos no nível frase de uma forma linguisticamente estruturada.” (LADD, 1996, p. 6, tradução nossa).
86
menos espessas, vibra em média 240 vezes por segundo; e uma criança, com pregas menos espessas ainda, vibra em média 400 vezes por segundo. Essa frequência de vibração das pregas vocais (F0) pode ser aumentada e diminuída intencionalmente quando queremos passar informações prosódico-entonacionais (VAISSIÈRE, 2006).
O pitch é o correlato perceptual da frequência fundamental, ou seja, diz respeito às variações de altura do tom laríngeo. Embora pudesse ser traduzido como altura melódica, a literatura da área mantém pitch (empréstimo do inglês) para designar entoação, por oposição a stress, que está relacionado ao acento de intensidade (DUBOIS, 1997).
Pitch e F0 estão intimamente relacionados. Entretanto, não podem ser sinônimos, pois estão em níveis distintos. O ouvido humano é muito sensível às diferenças de frequência (RUSSO & BEHLAU, 1993). Segundo Laver (1994), alterações a partir de 1 Hz já podem ser perceptíveis em ambientes sem ruído. As análises realizadas por Gussenhoven e Rietveld (1985) revelaram que 1,5 semitons (st) são suficientes para percebermos mudanças de tons. ‘t Hart (1981), analisando a variação de tom para o holandês, chegou à conclusão de que o ouvido será sensível a mudanças de mais de 2 semitons. Consoni e Ferreira Netto (2008) replicaram a pesquisa de ‘t Hart (1981) no português brasileiro (doravante PB) e encontraram os mesmos resultados. Milan (2015), que estuda o falar de Curitiba, no sul do Brasil, também quis investigar quantos semitons são necessários para serem percebidos auditivamente. Para isso, realizou um teste de percepção de discriminação em que os juízes ouviam um estímulo (palavras extraídas das sentenças do corpus Amper) de fala natural e um de fala manipulada. A pesquisadora ora manipulou a palavra inteira, ora apenas a tônica, variando a frequência de 1 a 4 semitons. O teste revelou que a maioria dos juízes percebe quando a diferença é de três ou quatro semitons. Estaremos baseados nessas pesquisas para realizar inferências sobre mudanças relevantes de tom. Na escala de variância, o aumento de um
87 semitom corresponde a um aumento na frequência fundamental na
ordem de 6% (PIERCE, 1983; MILLER, 2007 apud MILAN, 201518).
Sendo a frequência e, consequentemente o pitch, muito importantes para a descrição prosódica, a literatura se dedica aos desdobramentos desses parâmetros em busca de pistas que revelem fenômenos dialetais, linguísticos ou paralinguísticos. A variação de F0, seja em um movimento específico interno à vogal, seja do enunciado, por exemplo, tem sido um parâmetro adotado por pesquisadores para a descrição de diferenças de significados, inclusive de curvas atitudinais. Prieto (2014), em um trabalho intitulado The role of pitch range in establishing intonational contrasts19, traz resultados que fornecem evidências de que a variação de pitch pode ser utilizada para distinções entonacionais em algumas línguas.
Para autores como Fox (2000) e Prieto (2014), pitch range refere- se à distância ou intervalo entre o menor e o maior valor de F0 observados em um enunciado (um vale e um pico, respectivamente). A literatura em inglês também toma emprestado da música o termo tessitura para designar pitch range. Então, pitch range e tessitura são termos encontrados na literatura prosódica para designar o mesmo fenômeno (CRYSTAL, 2008). Fox (2000) acrescenta ainda que outros “pitchs” podem fazer um enunciado diferir de outro. O pitch height, por exemplo, diz respeito ao nível médio normal do falante que também é conhecido por registro e o pitch slope trata da tendência descendente ou ascendente, ou seja, da inclinação. Para o autor, pode-se dizer que, até certo ponto, são parâmetros que se sobrepõem e se influenciam. Estudos da área no PB ainda demonstram dificuldades em acomodar os termos. Scarpa e Fernandes-Svatman (2012), em um trabalho sobre a entoação na fala de crianças, chamaram esse espaço entre o ponto mais alto e o ponto mais baixo de “âmbito de altura”. Entretanto, alguns
18 PIERCE, John R. The Science of musical sound. Scientific American books. Nova Iorque: Freeman and Company, p. 123-126, 1983. MILLER, S. Puckette. Theory and Technique of Eletronic Music. World Scientific Publishing Co. Pte. Ltd, 2007. 19 “O papel do pitch range no estabelecimento de contrastes entonacionais” (tradução nossa).
88
pesquisadores (TENANI, 2003; ANTUNES, 2007; LIRA, 2009; BODOLAY, 2014) optam pelo termo tessitura, como Cagliari e Massini-Cagliari (2001), que usam o termo tessitura para “a escala melódica do falante, i. e. os limites em que se situam os seus valores mais altos e mais baixos de F0, quando fala normalmente” (MATEUS, 1990 apud CAGLIARI; MASSINI- CAGLIARI, 2001, p. 1)20. Tenani (2006) utiliza variação de altura de F0 para
tratar especificamente da extensão de um movimento melódico ascendente ou descendente na curva entonacional. Adotaremos para esse trabalho o termo tessitura para a variação de F0 (pontos mínimo e máximo) do enunciado e utilizaremos variação de altura de F0 no movimento de subida e variação de altura de F0 na tônica para variações específicas de F0. Entretanto, sabemos que muitos autores utilizam a nomenclatura gama tonal para definir a amplitude de variação local de F0, como Campos (2012), que analisou a diferença entonacional entre a fala coloquial e a fala do profissional de rádio; ou Souza (2007), que analisou a prosódia no comando militar.
Intensidade e loudness
Se ouvimos um som, por mais breve e baixo que nos pareça, é porque o sinal de fala já compõe uma sequência mínima perceptível. Nesse nível, já temos ciclos sucessivos que desenham a curva de F0 e o volume já tem seu o correlato perceptual.
A intensidade, medida em decibéis, é o resultado das variações de pressões de ar subglóticas e, sendo assim, tem estreita relação com a amplitude sonora. Quanto maior for a amplitude de vibração das partículas de ar, maior é a quantidade de energia transportada por essas partículas e maior é a sensação auditiva de intensidade do som (MIRA MATEUS, 2005).
O loudness é o correlato perceptual da intensidade que pode ser ordenado subjetivamente por ouvintes em uma escala de suave a forte. A sensibilidade do ouvido humano para diferenças de intensidade não é tão aguçada quanto para a frequência. “Precisamos de pelo menos um
20MATEUS, M. H. M.; ANDRADE, A.; VIANA, M. do C.; VILLALVA. A. Fonética, Fonologia e Morfologia do Português. Lisboa: Universidade Aberta, 1990.
89 dB de intervalo para percebermos diferenças na intensidade sonora, o que corresponde a uma mudança de 10%, isso possibilita cerca de 100 intervalos discrimináveis entre o limiar de audição e o de desconforto” (RUSSO; BEHLAU, 1993, p. 11).
Duração e ritmo
“A duração é o termo da fonética que se refere a um período de tempo gasto na articulação de um som ou uma sílaba” (CRYSTAL, 2008, p. 159). A duração de um enunciado depende da velocidade de fala, da qualidade (característica dos traços) do segmento de fala e de como se dá o encadeamento de unidades menores. Segmentos nasais ou vocálicos, por exemplo, podem ter influência na duração de segmentos vizinhos. Consequentemente, o arranjo do continuum da fala faz com que todos esses elementos se tornem variáveis que interagem entre si e que fazem com que esse parâmetro seja tomado, preferencialmente, como um valor relativo.
Para muitas correntes teóricas, o ritmo foi e é a percepção da regularidade de proeminências no discurso. Para Cagliari (2007), é um tipo de simetria, uma harmonia resultante de certas combinações e proporções regulares. Os parâmetros entonacionais juntos parecem definir o ritmo de uma língua; no entanto, é a duração o parâmetro mais atuante, já que está diretamente ligada à ideia de tempo. É a regularidade temporal, ou seja, a isocronia entre dois pontos distintos da curva que distingue dois ritmos de língua: o silábico e o ritmo acentual.
Entretanto, identificar e classificar o ritmo de uma língua pode não ser uma tarefa fácil, principalmente num país de mais de 200 milhões de falantes, como o Brasil. Segundo Frota e Vigário (2000), existem duas características constantemente presentes na literatura sobre o ritmo do PB: (i) além do acento principal de uma palavra, existem outros acentos que fazem alternar sílabas fortes e sílabas fracas. (ii) todas as discussões acerca do ritmo do PB feitas através da dicotomia entre ritmo silábico (tendência à isocronia entre sílabas) e ritmo acentual (tendência à isocronia entre acentos) tendem a atribuição de um ritmo misto. Cagliari (2012) defende que o português é prioritariamente uma língua de ritmo acentual. Entretanto, o autor afirma que há uma diferença marcante
90
entre dialetos do Sul (mais silábicos) e as demais variedades do Brasil (mais acentuais). Para Barbosa (2000), as teorias têm se sustentado a partir de rótulos. Segundo ele, Pike, precursor dos estudos sobre ritmo, precaveu-se de não classificar as línguas por um ritmo específico, de modo que não pudesse apresentar outro, mas, com o tempo, os pesquisadores foram forçando uma classificação estrita. Algumas propostas, como a de Dauer (1983), são estritamente fonológicas, o que finda por não dar conta da gradiência, esse continuum expresso, observado, através de parâmetros fonéticos. O pesquisador mostra que, para taxas de elocução mais rápidas, o PB é mais silábico do que o thai e o inglês, mas mais acentual do que o italiano ou o grego, por exemplo. É ponto pacífico a dificuldade em distinguir ritmos, e por isso, muitas vezes, a demonstração é impressionista – uma vez que as metodologias distintas não permitem que os estudos sejam de fato comparáveis – e considerada uma “ilusão perceptiva” (FROTA; VIGÁRIO, 2000, p. 7). Segundo Frota e Vigário (2000), durante anos estudos tentaram, sem sucesso, confirmar o tipo rítmico de línguas como o inglês e o italiano, já postuladas como sendo de um ou de outro e, o mesmo acontece com o PB. Para as autoras, “o PB não é apenas caracterizado por um número maior de acentos e por uma alternância rítmica acentual, mas também por um número maior de tons e por uma alternância tonal H/L” (FROTA; VIGÁRIO, 2000, p. 16). Sendo assim, em relação à duração, nos ateremos apenas ao registro da taxa de elocução dos locutores de cada ponto de inquérito, sem entrarmos em discussões acerca do ritmo de cada região aqui investigada. Compararemos as taxas de elocução encontradas com outros resultados apresentados na literatura, como os apresentados em Meireles e Barbosa (2009) Meireles e Gambarini (2011), Oliveira (2011) e Dias e Seara (2013).