• Nenhum resultado encontrado

A Teoria da Otimidade Estocástica e o Algoritmo de Aprendizagem Gradual

versão 1.4 online

2.2 Pressupostos da Teoria da Otimidade

2.2.1 A Teoria da Otimidade Estocástica e o Algoritmo de Aprendizagem Gradual

Uma característica interessante da Teoria da Otimidade nos estudos em aquisição da linguagem, conforme Prince e Smolensky (1993, 2004), deve-se a sua capacidade de prever tipologias de língua, o que permite que algoritmos de aprendizagem sejam associados a ela. Os algoritmos funcionam, basicamente, a partir de uma amostra da língua que pretendamos analisar como sendo o alvo da aquisição. O algoritmo, então, tentará encontrar uma gramática que se adapte a tais dados. Se esses dados apresentam informações suficientes sobre todos os aspectos da língua alvo, o algoritmo encontrará uma gramática que abarque todas as suas características. Conforme Boersma e Hayes (2001), para a TO, a língua é uma potencialidade infinita de conjunto de pares de formas de input e output e uma gramática é um conjunto de restrições ranqueadas. Um algoritmo de aprendizagem, para a TO, determina um conjunto finito de pares input-output e tenta encontrar um ranqueamento de restrições que acomode esses pares de maneira ótima.

A TO de Prince e Smolensky considera apenas línguas ideais, em que toda forma de input tem uma única forma de output ótima. Os autores implementaram essa proposta de unidade, estabelecendo que as restrições estejam ordenadas em uma hierarquia totalmente ranqueada e que o ranqueamento das restrições não varie de avaliação para avaliação. Para essa proposta original de TO, Tesar e Smolensky elaboraram uma família de algoritmos chamada de Demoção de Restrições (Constraint Demotion Algorithm, CDA). Esses algoritmos são notadamente convergentes. Por exemplo, dado um conjunto de dados rico, é garantido que encontraremos, pelo menos, uma hierarquia totalmente ranqueada, que seja apropriada para a língua alvo.

Porém, há um fenômeno natural da linguagem que parece revelar múltiplas formas de output para um único input: a assim chamada variação linguística. Em TO, tais variações nas línguas têm sido analisadas em termos de variação livre entre gramáticas gerais (KIPARSKY, 1993), restrições flutuantes dentro da gramática, (REYNOLDS, 1994; NAGY e REYNOLDS, 1997), ranqueamento parcial (ANTTILA, 1997) e ranqueamento ruidoso (BOERSMA, 1997; BOERSMA e HAYES, 2001). Conforme tais estudos em variação, o ranqueamento de restrições está em total ordem durante qualquer avaliação: toda vez que é apresentado um input à gramática, ela apresenta um único output ótimo. Contudo, variações aleatórias no

ordenamento das restrições, durante as instâncias de avaliação, podem produzir variações nos resultados. Dentre as propostas de TO que são capazes de representar a variação, a TO Estocástica (BOERSMA, 1997; BOERSMA e HAYES, 2001) é a única que traz, associado à teoria, um algoritmo de aprendizagem.

Para poder dar conta de outputs variáveis, a TO Estocástica incorpora a avaliação de ruído à sua análise de rankings: o ranqueamento de restrições compreende valores dentro de uma escala numérica contínua; valores esses que são sujeitos a variações aleatórias toda vez que a gramática é usada para avaliar um conjunto de candidatos. O ranking total que é disso derivado varia, assim, ao longo das avaliações6. O ruído na gramática do aprendiz tem o papel de modelar a aquisição gradual da hierarquia alvo. Em combinação com um algoritmo de aprendizagem que ajuste a gramática gradualmente, a avaliação do ruído produz realísticas curvas sigmóides de aprendizado.

O Algoritmo de Aprendizagem Gradual (doravante TO-GLA) tem a característica de ser capaz de encontrar a gramática que reproduz a distribuição de probabilidades sobre as formas de output dos dados de aprendizagem, se essa distribuição puder ser representada pela TO Estocástica. Além de ser capaz de aprender hierarquias de línguas com suas variações, o TO-GLA se diferencia do CDA por sua robustez em face de um número moderado de erros nos dados de aprendizado e por exibir curvas de aprendizado gradual, tais como as observadas na aquisição de uma língua natural, conforme Boersma (1997) e Boersma e Levelt (2000). De fato, o ranqueamento de restrições baseado em probabilidades estatísticas, conforme os outputs de uma amostra, é um avanço significativo com relação aos modelos anteriores. Tais atributos são desejáveis se a teoria de aprendizado estiver relacionada a um modelo empírico de aquisição da linguagem.

No entanto, esse modelo ainda não dá conta da capacidade associativa que um modelo dinâmico de linguagem prevê (ALBANO, 2008)7, pois as gramáticas ainda são categóricas, no sentido de proverem rankings estatisticamente determinados, os quais são estáticos para cada momento de avaliação (COETZEE, 2009)8. Tal modelo também não prevê que, por associação, novos padrões linguísticos possam ser adquiridos. A TO Estocástica ainda conta com um conceito de universalidade gerativo, o que constitui, em parte, uma contradição, do

6

Tal escala é organizada de acordo com unidades arbitrárias que a princípio não estão ranqueadas, sendo definidas conforme uma gama de possibilidades de ranqueamento dependentes das formas de output da língua. Os valores são definidos através da atribuição de pesos estatisticamente atribuídos para cada restrição. Podem também ser atribuídos valores iniciais às restrições, que são determinados pelo pesquisador a partir dos dados.

7

Observações feitas no curso ministrado no encontro do DINAFON em setembro de 2008 na UFPR, Curitiba, PR.

8

ponto de vista teórico, isto é, concebe que haja princípios pré-estabelecidos, simbolicamente, da linguagem –, enquanto se propõe a comprovar a aquisição da linguagem por um viés empírico, pois estabelece as hierarquias das línguas pela probabilidade provida por amostras de língua real.

Por isso, uma proposta que conceba, não dois níveis de representação, mas, sim, um único nível fonético-fonológico, a partir do qual as hierarquias de línguas estariam calcadas na frequência lexical e nas condições de percepção/produção promovidas pelo meio, tem condições de oferecer uma descrição e uma análise mais realísticas das línguas naturais, bem como do processo de aquisição da linguagem.