A arquitetura da TO - TEORIA DA OTIMALIDADE

5.1 TEORIA DA OTIMALIDADE

5.1.2 A arquitetura da TO

A gramática da TO, conforme já explicitado, opera com a noção de mapeamento entre formas de input e formas de output. Devido a esse funcionamento, emprega, a partir de um dado input, um mecanismo denominado GEN (gerador de output, do inglês generator), gerador de possíveis outputs. Além desse dispositivo, a TO apresenta um mecanismo avaliativo denominado EVAL (avaliador de output, do inglês evaluator), que tem como objetivos a associação de um output real a um input e a eliminação do que não for aceitável. A partir de um elemento chamado LEXICON, GEN gera candidatos a output, e EVAL mapeia esses possíveis outputs baseado em um

80 conjunto universal de restrições CON (do inglês constraints) que devem ser organizadas em uma escala de relevância.

LEXICON é o componente que tem a responsabilidade de fornecer as especificações do input, uma vez que, no léxico, encontram-se as propriedades contrastivas dos morfemas. O input, por sua vez, não se submete à ação das restrições, ou seja, a forma subjacente não está sujeita a avaliações (LIMA, 2008: 29).

O mecanismo GEN, como já mencionado, cria outputs a partir de um input. Para um determinado input, existirá um conjunto de realizações que o sistema da língua admite como possíveis (ou impossíveis). Na prática, alguns outputs não ocorrem e, então, são eliminados. Outros representam candidatos com diferentes graus de aceitabilidade, pelo fato de serem mais ou menos Análise, pois exige que o input esteja presente em cada candidato. O princípio de Consistência de Exponência impede que GEN altere especificações fonológicas (segmentos, moras, etc.) de um morfema (LIMA, 2008:

30).

Como já explicado, CON diz respeito ao conjunto de restrições violáveis.

Os restritores empregados na TO estão presentes em todas as línguas e o que distingue uma língua de outra é o grau de atuação e relevância de cada

81 restrição. Sendo assim, os restritores são universais, a despeito de apresentarem distintos níveis de relevância. A hierarquia que cada língua apresenta estabelece a relevância e a atuação das restrições. Nessa ótica, uma restrição pode estar no mais alto posto da hierarquia de uma dada língua e estar mal cotada na hierarquia de outra.

No que tange às restrições, Schwindt (2005, p. 266) postula que, basicamente, são de dois tipos: restrições de marcação e restrições de fidelidade. A família fidelidade opera em favor da manutenção da identidade entre input e output; dessa maneira, o output considerado ótimo não deve apresentar discrepância em relação à forma subjacente, o input. As restrições que proíbem apagamentos e inserções, por exemplo, fazem parte dessa família. A família marcação, por sua vez, milita em favor da manutenção de estruturas mais básicas e, com isso, busca evitar que formas marcadas cheguem à superfície (LIMA, 2008: 30). De acordo com Schwindt (2005, p.

266), por exemplo, existe uma tendência universal que evidencia a predileção por sílabas abertas (padrão CV), o que faz, portanto, com que as sílabas sem coda e com onset sejam consideradas formas não marcadas.

O mecanismo EVAL, elemento responsável por selecionar, empregando o conjunto universal de restrições (CON), o output ótimo a partir do grupo de candidatos criado por GEN, é o componente central da TO. Conforme Costa (2001, p. 134),

EVAL cria uma ordem (ou ranking) entre as restrições de acordo com sua relativa harmonia, ou seja, de acordo com o poder que cada uma delas tem de agir, permitindo ou não violações e, desta forma, fazendo as devidas seleções entre os candidatos do output.

82 5.2. BASES METODOLÓGICAS

Como já foi afirmado na Introdução, o objetivo desta tese é mostrar o que favorece e o que desfavorece a realização fonética de acrônimos, que processos fonológicos atuam sobre essas unidades e se esses processos diferem acrônimos de palavras comuns; os alfabetismos não serão, portanto, contemplados na análise. Para chegarmos à conclusão de quais formações são acrônimos e quais são alfabetismos, foi necessária a aplicação de testes de leitura a diversos informantes.

Em primeiro lugar, chegamos ao conjunto de siglas que o português apresenta, que constitui o corpus geral do presente estudo, a partir de três fontes diferentes: (a) dicionários eletrônicos, como o Aurélio e o Houaiss, por meio das ferramentas de busca que as obras apresentam; (b) rastreamento, por meio da exemplificação fornecida, nas obras referenciadas ao longo do capítulo 3: gramáticas tradicionais e manuais de morfologia do português; (c) os corpora utilizados por Abreu, em sua dissertação de mestrado (ABREU, 2004) e em sua tese de doutorado (ABREU, 2009); (d) uma coleta paralela foi feita em jornais e revistas durante a elaboração do trabalho (de janeiro de 2012 até junho de 2013); (e) palavras ouvidas em situações de fala real nesse mesmo período. As siglas a que chegamos constam do Anexo 1. Concluído esse levantamento, demos início à pesquisa de produção oral das siglas por meio de testes com falantes do português (variedade carioca).

A pesquisa foi dividida em duas partes. Na primeira parte, analisaram-se apenas siglas constituídas por duas ou três letras. Foram realizados 2 testes diferentes, com 18 enunciados cada teste, contendo siglas de todas as

83 combinações possíveis de V e C, em que “C” se refere à palavra “consoante”, e

“V”, à “vogal”, para duas ou três letras: VV, CC, VC, CV, CVV, CCV, CCC, VCC, VVC, VVV, VCV e CVC. Foram selecionadas 3 siglas para cada formato, ou seja, 36 siglas, sendo 18 para cada teste, como já mencionado. Os testes aplicados encontram-se disponíveis no Anexo 2 desta tese. Os enunciados foram trechos, retirados de sites da internet, que continham uma sigla, como, por exemplo: “A DRE coordena, assina e centraliza os registros e controles acadêmicos e a emissão de documentos a eles relativos.”.

O objetivo dos testes foi verificar como os informantes pronunciavam as siglas contidas nos enunciados apresentados, para que, dessa forma, pudéssemos separar acrônimos de alfabetismos. Cada teste foi lido por 10 informantes (5 homens e 5 mulheres, todos maiores de 16 anos), totalizando, nesse primeiro momento, 360 dados para análise na primeira parte da pesquisa. Os dados foram gravados em formato digital (aparelho de telefone celular com esse recurso) e posteriormente transcritos, considerando-se a escuta por parte do pesquisador e eventualmente do orientador, em caso de dúvida. As transcrições fonéticas foram feitas com base nos símbolos do Alfabeto Fonético Internacional, o IPA.

A segunda parte da pesquisa refere-se exclusivamente às siglas de quatro letras, que possuem 16 formatos possíveis: VVVV, VCCC, VVCC, VVVC, CCCC, CVVV, CCVV, CCCV, VCCV, CVVC, CCVC, VVCV, VCVV, CVCC, VCVC e CVCV. Para os testes, foram selecionadas 3 siglas de cada formato, gerando 46 enunciados, que foram distribuídos em 3 testes diferentes,

84 com 15 enunciados em 2 testes e 16 enunciados em outro²⁵. Da mesma forma que os demais testes aplicados na primeira parte, também foram ouvidos 10 informantes maiores de 16 anos, sendo 5 do sexo masculino e 5 do sexo feminino. Dessa forma, na segunda parte da pesquisa, obtiveram-se 460 dados para análise. Esses testes relacionados às siglas de quatro letras encontram-se no Anexo 3 desta tese.

No que tange aos informantes, convém salientar que todos são fluminenses, naturais da Região dos Lagos, predominantemente Arraial do Cabo, onde leciono, e, como já mencionado, maiores de 16 anos. Essa informação é relevante para que se note que a transcrição fonética que se fará dos acrônimos nesta tese é conforme o dialeto carioca, uma vez que os informantes, a despeito de serem fluminenses, tendem a adotar como norma esse padrão de realização.

Concluída a aplicação dos testes, observamos quais siglas se encaixam no grupo dos acrônimos e quais se encaixam no grupo dos alfabetismos. A partir da observação atenta aos dados, passou-se à descrição dos formatos das siglas a partir das generalizações fonológicas e estruturais possíveis reveladas nos testes e à proposição de candidatos para a análise, seguindo o modelo teórico adotado, a Teoria da Otimalidade, conforme apresentado na seção 5.1.

O capítulo 6, como já explicitado na Introdução, tratará da análise otimalista do processo da Siglagem. Para efeito de um melhor entendimento do trabalho, salientamos que, na análise pela TO, posicionamos o candidato ótimo

25 A assimetria na totalização dos dados se explica porque só foi encontrada uma sigla com o formato VVVV. Assim, o somatório das 3 siglas de cada um dos outros 15 formatos com essa única sigla de formato VVV resulta em 46 siglas.

85 sempre na primeira linha do tableau²⁶. Com relação aos candidatos propostos, não foi possível trabalhar com o mesmo número em todas as análises, em virtude de, em alguns casos, como acrônimos monossilábicos, ser difícil propor candidatos variados.

Abaixo, em (08), nota-se o funcionamento de um tableau:

(08)

/pasta/ *COMPLEX NO-CODA

a. pas.ta *

b. pa.sta *!

Nesse exemplo, o candidato “b” foi eliminado da disputa pelo fato de violar a restrição mais alta da hierarquia, *COMPLEX, uma vez que pa.sta possui um ataque com dois segmentos na segunda sílaba, e esse restritor desfavorece ataques complexos. A violação é marcada por meio de um asterisco (*) e, nesse caso, indica uma violação fatal, representada por um ponto de exclamação (!), visto que o candidato “b” está fora da competição a partir daquele ponto de análise. O candidato “a”, apesar de ter infringido uma restrição, ao permitir uma consoante travando a primeira sílaba, sai como vitorioso, pois o restritor NO-CODA, que desfavorece codas, é menos cotado na hierarquia que *COMPLEX. O candidato vencedor é apontado pelo símbolo

, e as células sombreadas indicam que ali o mecanismo de avaliação é irrelevante.

26 “A expressão tableau é utilizada para designar tabelas ou quadros que contêm, na horizontal, as restrições, hierarquizadas por relações de dominância e, na vertical, os outputs possíveis, a partir de um dado input” (LIMA, 2008: 34).

86 Cabe ressaltar que a análise restringir-se-á aos acrônimos de duas, três e quatro letras. De acordo com Barbosa et alii (2003), em trabalho que será resenhado na seção 6.1 desta tese, quando há mais de quatro letras em uma sigla, a tendência é que ocorram acrônimos, “a menos que quatro ou mais consoantes estejam em sequência” (BARBOSA et alii, 2003: 03), originando, nesse caso, alfabetismos. Siglas com mais de quatro letras que sejam alfabetismos e não se insiram nesse último caso devem, segundo os autores, ser tratadas como exceções. Justifica-se, dessa forma, a opção por uma análise restrita a acrônimos de duas, três e quatro letras.

87 6. ANÁLISE

Este capítulo divide-se em duas seções: na primeira, expomos a visão de Barbosa et alii (2003) a respeito da pronúncia das siglas; na segunda, fazemos a análise, nos moldes da TO, dos diversos formatos das siglas de duas, três e quatro letras. O capítulo é aberto com as informações de Barbosa et alii (op. cit.), uma vez que se trata de um trabalho pioneiro no que tange à pronúncia de siglas no português brasileiro. No decorrer da análise otimalista, quando tratarmos de pronúncia, estabeleceremos um paralelo com esse trabalho e, assim, algumas informações contidas nele poderão ser ratificadas, e outras, aprofundadas.

6.1. A PRONÚNCIA DAS SIGLAS CONFORME BARBOSA ET ALII (2003)

Barbosa et alii (2003), em artigo intitulado Algoritmo para leitura de siglas em um sintetizador de voz, apresentam um algoritmo que determina a sequência fonética que deve ser produzida por um sintetizador de voz na leitura de uma sigla. Trata-se de um artigo produzido por engenheiros e linguistas. Os linguistas que assinam o texto são Maria Carlota Rosa e Carlos Alexandre Gonçalves.

Para a leitura das siglas, os autores levam em consideração dois fatores, a saber: o número de letras envolvidas e as distintas possibilidades de composição das sequências de letras, no que concerne à combinação de vogais e consoantes. “Desta combinação resultará ou uma leitura soletrada ou

88 uma leitura como sílaba e, associados a essas realizações, diferentes padrões de acentuação” (p. 1).

Levados em conta os parâmetros expostos no parágrafo anterior, os autores chegam aos seguintes resultados:

(i) Siglas de duas letras são sempre soletradas, independente da composição entre consoantes e vogais;

(ii) Siglas de três letras que são constituídas por três vogais (VVV) ou três consoantes (CCC) são sempre soletradas;

(iii) Siglas de três letras que seguem o formato CVC (Consoante-Vogal-Consoante) são silabadas, a menos que C1 seja <H> (nesse caso, são soletradas);

(iv) Siglas de três letras que seguem o formato CVV (Consoante-Vogal-Vogal) são sempre silabadas;

(v) Siglas de três letras que seguem o formato CCV (Consoante-Consoante-Vogal) são sempre soletradas;

(vi) Siglas de três letras que seguem o formato VVC (Vogal-Vogal-Consoante) são soletradas, a menos que C seja <S, R, L, M, N> (nesse caso, são silabadas);

(vii) Siglas de três letras que seguem o formato VCC (Vogal-Consoante-Consoante) são soletradas, a menos que C1 seja <S, R, L> (nesse caso, são silabadas);

(viii) Siglas de três letras que seguem o formato VCV (Vogal-Consoante-Vogal) são silabadas, a menos que V2 seja <I> (nesse caso, são soletradas).

(ix) Siglas de quatro letras constituídas por quatro vogais (VVVV) ou quatro consoantes (CCCC) são soletradas;

89 (x) Siglas de quatro letras que seguem os formatos VCVC (Voga-Consoante-Vogal-Consoante) e CVCV (Consoante-Vogal-Consoante-Vogal) são silabadas;

(xi) Siglas de quatro letras que seguem o formato CVVC (Consoante-Vogal-Vogal-Consoante) são soletradas, a menos que as vogais sejam iguais (nesse caso, são silabadas);

(xii) Siglas de quatro letras que seguem o formato CCVV (Consoante-Consoante-Vogal-Vogal) são soletradas, a menos que C2 seja <R, L> (nesse caso, são silabadas);

(xiii) Siglas de quatro letras que seguem os formatos VCCV (Vogal-Consoante-Consoante-Vogal) ou VVCC (Vogal-Vogal-Consoante-Consoante) são soletradas, a menos que C1 seja <R, L, S, M, N, V> (nesse caso, são silabadas);

(xiv) Siglas que apresentam a combinação de V e 3 C (VCCC, CVCC, CCVC e CCCV), sendo <S> o último grafema, são silabadas (caso <S> não seja o último grafema, são soletradas);

(xv) Siglas que apresentam o formato CVCC (Consoante-Vogal-Consoante-Consoante), sendo <S> o último grafema, são silabadas (caso <S>

não seja o último grafema, são soletradas)²⁷.

Barbosa et alii asseveram que as vogais <E> e <O>, se estiverem em posição tônica e não precederem uma consoante nasal, serão sempre abertas.

Como exemplos, citam TRE (Tribunal Regional Eleitoral) e OVNI (Objeto Voador Não Identificado).

27 Barbosa et alii (2003), no esquema em que mostram os resultados das combinações C/V, não tratam das siglas de quatro letras que seguem o formato C + 3V (CVVV, VCVV, VVCV e VVVC).

90 Os autores tratam apenas das siglas de duas, três e quatro letras.

Afirmam que, quando existem mais de quatro letras em uma sigla, a regra é que se faça silabação, “a menos que quatro ou mais consoantes estejam em sequência”, ocorrendo, nesse caso, soletração. Siglas com mais de quatro letras que sejam soletradas e não se insiram nesse último caso citado devem ser tratadas, conforme os autores, como exceções. O resumo da proposta é sintetizado na seguinte árvore de decisões²⁸, em (09), extraída de Barbosa et alii, 2003: 02:

28Barbosa et alii (2003) afirmam que uma árvore de decisões “consiste numa lista hierárquica de perguntas com respostas simples, sim/não, formuladas a partir do estabelecimento de regras categóricas. As regras são propostas de modo a determinar que tipo de sequência fonética se deve associar às siglas presentes no texto escrito. O nó inicial da árvore verifica se a palavra é uma sigla. A seleção dos nós subsequentes dependerá da resposta, sim ou não, sobre o contexto, até que não caibam mais perguntas” (p. 01 e 02).

91 (09)

No que toca à acentuação das siglas, os autores argumentam que

Siglas soletradas são sempre lidas com acento primário na sílaba tônica resultante da leitura da última letra que compõe a sigla: HU [a.ga.ˈu], [...]. As siglas lidas como sílabas terão como default a leitura como paroxítonas:

92 [...], FALE [ˈfa.lɪ]. No entanto, siglas que respondem ao comando Silabar compostas por mais de quatro letras serão oxítonas se terminadas nas consoantes <L>,

<M>, <N> ou <R> (ANEEL, CETEM, DETRAN, CONAR); mas paroxítonas, caso terminem em <S>

(ANDES, CENPES) (BARBOSA et alii, 2003: 3).

6.2. ANÁLISE VIA TEORIA DA OTIMALIDADE

6.2.1. As siglas de duas letras

São quatro os formatos possíveis para as siglas de duas letras:

(i) CC (Consoante-Consoante)

Exemplos: PR, para Partido da República; FL, para Faculdade de Letras; PT, para Partido dos Trabalhadores; MP, para Ministério Público ou Medida Provisória; BC, para Banco Central.

(ii) VV (Vogal-Vogal)

Exemplos: UE, para União Europeia; AA, para Alcoólicos Anônimos; IE, para Instituto de Economia; UA, para Universidade do Amazonas; IO, para Instituto Oceanográfico.

(iii) CV (Consoante-Vogal)

Exemplos: BO, para Boletim de Ocorrência; QI, para Quociente de Inteligência;

DE, para Dedicação Exclusiva; NA, para Narcóticos Anônimos; PE, para Polícia do Exército.

93 (iv) VC (Vogal-Consoante)

Exemplos: AN, para Agência da Notícia; EM, para Ensino Médio; UP, para Universidade do Porto; AL, para América Latina; IF, para Instituto Federal ou Instituto de Física.

Os dados revelados nos testes mostram que as siglas de duas letras são sempre alfabetismos, com exceção do padrão VC, quando C for uma obstruinte (fricativa labial ou oclusiva)²⁹. Em (10), a seguir, observa-se como cada uma das combinações C/V explicitadas acima foi realizada pela maioria dos informantes que participaram dos testes³⁰:

(10)

CC VV CV VC

PR: [pe.ˈɛ.xɪ] UE: [u.ˈɛ] BO: [be.ˈɔ] AN: [a.ˈ .nɪ]

FL: [ɛ.fi.ˈɛ.lɪ] AA: [a.ˈa] QI: [ke.ˈi] EM: [ɛ.ˈ .mɪ]

PT: [pe.ˈte] IE: [i.ˈɛ] DE: [de.ˈɛ] UP: [u.ˈpe]

MP .mi.ˈpe] UA: [u.ˈa] NA .ni.ˈa] AL: [a.ˈɛ.lɪ]

BC: [be.ˈse] IO: [i.ˈɔ] PE: [pe.ˈɛ] IF: [ˈi.fɪ]

Desse modo, somente na combinação VC, com C sendo representando uma obstruinte, pode-se ter um acrônimo (a sigla IG, para Internet Grátis, é um

29 Estamos, aqui, endossando a ideia de que sibilantes não são propriamente obstruintes (WETZELS, 1992; CLEMENTS & HUME, 1995).

30É necessário ressaltar que nem todos os segmentos obstruintes empregados no formato VC levam à produção de um acrônimo. Os testes revelaram, por exemplo, que UP, para Universidade do Porto, é um alfabetismo.

94 bom exemplo), o que explicita que o formato VC é variável. Barbosa et alii (2003) não preveem essa variação e indicam que siglas de duas letras devem ser sempre soletradas. Em (11), a seguir, comprova-se o caráter variável desse padrão. Observe-se que a presença de nasais, laterais e vibrantes leva a sigla a ser soletrada:

(11)

EN (Escola Naval): C é nasal

→

alfabetismo

→

[ɛ.ˈ .nɪ]

IL (Instituto de Letras): C é lateral

→

alfabetismo

→

[i.ˈɛ.lɪ]

IR (Imposto de Renda): C é vibrante

→

alfabetismo

→

[i.ˈɛ.xɪ]

IF (Instituto Federal): C é obstruinte

→

acrônimo

→

[ˈi.fɪ]

A observação atenta aos acrônimos de duas letras nos remete a questões interessantes sobre a organização fonológica do português. Em primeiro lugar, essas formações acronímicas jamais criam monossílabos;

constituem sempre dissílabos paroxítonos, ocorrendo, nesses casos, a epêntese da vogal [ɪ] junto ao segmento obstruinte. Dessa forma, IF (Instituto Federal ou Instituto de Física), por exemplo, pronuncia-se como [ˈi.fɪ]. A inserção desse segmento vocálico para resolver questões referentes à sílaba é encontrada em diversas situações:

(a) nos grupos consonânticos ditos impróprios, a exemplo de ritmo, pacto, afta (CÂMARA Jr., 1970);

95 (GONÇALVES, 2004c), como em mares, fregueses e túneis.

Esses fatos revelam que [ɪ] é a vogal epentética por excelência em português, o que se confirma na produção de acrônimos como um todo, como teremos a oportunidade de ressaltar mais adiante.

Os dados observados sobre os acrônimos de duas letras evidenciam, além disso, a ideia de palavra mínima em português. Esta, como se sabe, é constituída por um monossílabo pesado ou por um dissílabo com duas sílabas leves, como é o caso das formações em exame. Tratar da questão da palavra mínima nesta tese, que analisa um processo não-concatenativo de formação de palavras, é relevante, uma vez que, assim como ocorre com os acrônimos, condições de palavra mínima também se impõem, por exemplo, aos hipocorísticos³¹, processo que bloqueia qualquer formação maior que duas sílabas e que não contenha pelo menos um pé.

Conforme Gonçalves (2004b), o troqueu moraico³² tem papel de destaque em processos de minimização, sendo, por isso, extremamente relevante na morfologia portuguesa (GONÇALVES, 2004b: 12). Cabré (1994),

31 Hipocorização é o processo morfológico por meio do qual antropônimos são encurtados de forma afetiva, gerando uma forma diminuta que mantém identidade com o prenome. Sendo assim, “Chico” é o hipocorístico de “Francisco”, e “Dedé” é a forma hipocorística de “André”, por exemplo.

32 O troqueu moraico considera o peso silábico, isto é, conta as moras (unidades de tempo de que as sílabas são constituídas). Cada duas moras formam um pé, com cabeça à esquerda.

Sílabas pesadas têm duas moras, logo formam sozinhas um pé.

96 analisando o catalão, defende que o argumento principal para que o troqueu moraico seja considerado como pé básico é sua pertinência em processos de minimização. Essas questões, como se pode perceber, trazem à luz a tese de que o pé básico do português é o troqueu moraico.

De acordo com a hierarquia prosódica proposta por Nespor & Vogel (1986), o pé é o constituinte que se situa entre a sílaba e a palavra fonológica.

Na ótica de Gonçalves (2004b), ocorre palavra mínima todas as vezes em que a palavra fonológica dominar um e somente um pé. Dessa maneira, monossílabos com rima ramificada (lar, mel e véu) e dissílabos com sílaba final leve (mala, neve e tolo) constituem palavras mínimas na língua portuguesa. Em se tratando dos monossílabos com rima ramificada, as duas moras do troqueu

No documento Universidade Federal do Rio de Janeiro (páginas 79-0)