O modelo param´etrico em Villavicencio (2002)

3.3 Outras modelagens

3.3.2 O modelo param´etrico em Villavicencio (2002)

Neste estudo, Villavicencio (2002) apresenta um MCA composto por uma GU associada a parâmetros e um algoritmo de aprendizagem, de acordo com a Teoria de Princ´ıpios de Parâmetros. O estudo se concentra na aquisi¸cão de grades de subcategoriza¸cão e da ordem de palavras. A abordagem é probabil´ıstica e o aprendiz é concebido para ser robusto à ru´ıdos e ambiguidade nos dados de entrada, composto no modelo por senten¸cas de um corpus de fala espontânea dirigida à crian¸ca, cujos enunciados foram anotados com as respectivas formas lógicas. A GU é implementada como uma Gramática Categorial Generalizada Baseada em Unifica¸cão, um formalismo lexicalizado, de modo que a gramática (categorias e regras) está codificada diretamente no léxico, embutida numa rede de heran¸ca de padrões.

Em tais redes, generaliza¸cões abrangentes da gramática são capturadas de modo econô- mico, através da especifica¸cão de tipos gerais, cujas caracter´ısticas são herdadas por seus sub-tipos que, por sua vez, acrescentam caracter´ısticas próprias e podem também apresentar sub-tipos próprios, que herdam suas caracter´ısticas e assim sucessivamente, de acordo com a necessidade. A GU pode conter ainda regras lexicais, que permitem derivar itens lexicais a partir de outros (como, por exemplo, deriver verbos flexionados em terceira pessoa do singular, a partir da forma base). Assim, o léxico se constitui de uma parte básica e de outra derivada.

Os parâmetros assumidos no modelo também são codificados como tipos na rede de heran¸ca, de modo que possam ter valores finitos especificados como não-configurados, padrão e não-padrão (absolutos). Tais propriedades podem, então, ser herdadas por sub-parâmetros vinculados a um dado parâmetro. Há dois conjuntos de parâmetros no modelo de Villavi- cencio: categoriais e de ordem de palavras. Os primeiros, definem as categorias permitidas pela gramática num dado momento, no curso da aquisi¸cão. São 89 parâmetros, agrupados de acordo com o tipo sintático das respectivas categorias e ordenados de acordo com sua valência.

Por exemplo, o parâmetro para verbos transitivos é um sub-tipo do parâmetro para verbos intransitivos, visto que no modelo verbos transitivos são definidos com base em verbos intransitivos (i.e., herdam a caracter´ıstica de ter um sujeito). Em rela¸cão à ordem, são 18 parâmetros, também implementados como tipos na hierarquia da rede. O parâmetro inicial é o relativo à ordem geral da l´ıngua, havendo sub-parâmetros para elementos espec´ıficos, tais como o sujeito ou outros argumentos do verbo. Todos os sub-parâmetros herdam o valor dos parâmetros mais altos na hierarquia, mas podem, de acordo com a experiência, alterar o valor.

O modelo inclui aquisi¸cão lexical, modelada conforme a adapta¸cão de Waldron (1999, apud Villavicencio, 2002) do algoritmo proposto em Siskind (1996). A principal diferen¸ca, segundo a autora, é que na adapta¸cão de Waldron os itens funcionais possuem conteúdo semântico, ao contrário de Siskind, que os assume como elementos semanticamente vazios. Em rela¸cão ao corpus utilizado, o algoritmo de aquisi¸cão lexical conseguiu processar 63,6% dos enunciados (num total de 1517 que compõem o corpus), dos quais 95,23% eram corretos, ou seja, um total de 965 enunciados. Esta sa´ıda da aquisi¸cão lexical é então enviada para o procedimento responsável por identificar as categorias sintáticas apropriadas a cada palavra.

O procedimento para aquisi¸cão sintática, numa execu¸cão t´ıpica, atingiu 52,6% de enunciados processados (dos 965). Porém, do total de 508 enunciados processados, apenas 4,7% eram atribui¸cões de categorias sintáticas corretas, com o restante contendo pelo menos uma categoria incorreta. Para contornar este problema, o modelo conta com um procedimento para descartar atribui¸cões inválidas, aumentando o número de enunciados aproveitados den- tre os 508.14 _{Após obter uma atribui¸cão válida, a sintaxe envia as categorias para o módulo} de deteçcão e processamento de gatilhos, responsável por identificar os gatilhos providos pelo dado e configurar os parâmetros respectivos.

A natureza desta etapa da aprendizagem ´e probabil´ıstica, concebida para determinar

a configura¸cão paramétrica da gramática mais adequada para descrever os gatilhos contidos no dado de entrada. Villavicencio (2002) conduz então uma série de simula¸cões, controlando algumas variáveis como n´ıvel de ru´ıdo ou ambiguidade (envolvendo PPs locativos). A autora mostra que o modelo converge para a gramática-alvo nas simula¸cões, mostrando-se, assim, robusto a ru´ıdos e ambiguidade, alterando os parâmetros apenas quando encontra fortes evidências para isso.

Entre os pontos fracos da modelagem, dentro daquilo que idealmente se espera, vale ressaltar a assun¸cão de uma GU espec´ıfica para o inglês, o que indica que o modelo é restrito em termos translingu´ısticos, e o baixo número de enunciados de fato utilizados para aquisi¸cão paramétrica, o que pode ser ind´ıcio – dado que esta convergiu mesmo assim – de algum viés próprio aos procedimentos de aquisi¸cão ou aos dados de entrada, de modo a propiciar a convergência com base em uma baixa quantidade de dados (especialmente dado o caráter probabil´ıstico do modelo).

Por outro lado, o estudo de Villavicencio possui várias propriedades interessantes. Pri- meiramente, é uma tentativa concreta de modelar uma visão paramétrica do conhecimento lingu´ıstico, ao mesmo tempo em que a autora não idealiza demasiadamente a tarefa, visto que cabe ao aprendiz adquirir o léxico, identificar as categorias sintáticas das palavras para, só então, extrair os gatilhos dos enunciados e configurar os parâmetros. Em segundo lugar, o fato de mesclar uma abordagem probabil´ıstica (para configura¸cão paramétrica) com uma relativamente determin´ıstica (para aquisi¸cão lexical e sintática), é basicamente inédito no que diz respeito a MCAs.

Uma terceira virtude é o uso de um corpus de senten¸cas dirigidas à crian¸ca, o que confere maior plausibilidade ao modelo, embora corpora artificiais possam ser adaptados de modo a refletir certas propriedades distribucionais observadas em corpus de fala dirigida à crian¸ca. Outro aspecto interessante desta proposta é que ela implementa (através da no¸cão de hierarquia) a ideia de que certos parâmetros (quando configurados) devem ter impacto

noutros aspectos da gramática e não apenas um efeito isolado. Por fim, a disponibiliza¸cão de medidas quantitativas dos resultados obtidos é importante, na medida em que permite alguma compara¸cão mais direta com resultados obtidos noutras modelagens.

No documento Um modelo computacional de aquisição de primeira língua (páginas 109-112)