3.3 Outras modelagens
3.3.2 O modelo param´etrico em Villavicencio (2002)
Neste estudo, Villavicencio (2002) apresenta um MCA composto por uma GU associada a parˆametros e um algoritmo de aprendizagem, de acordo com a Teoria de Princ´ıpios de Parˆametros. O estudo se concentra na aquisi¸c˜ao de grades de subcategoriza¸c˜ao e da ordem de palavras. A abordagem ´e probabil´ıstica e o aprendiz ´e concebido para ser robusto `a ru´ıdos e ambiguidade nos dados de entrada, composto no modelo por senten¸cas de um corpus de fala espontˆanea dirigida `a crian¸ca, cujos enunciados foram anotados com as respectivas formas l´ogicas. A GU ´e implementada como uma Gram´atica Categorial Generalizada Baseada em Unifica¸c˜ao, um formalismo lexicalizado, de modo que a gram´atica (categorias e regras) est´a codificada diretamente no l´exico, embutida numa rede de heran¸ca de padr˜oes.
Em tais redes, generaliza¸c˜oes abrangentes da gram´atica s˜ao capturadas de modo econˆo- mico, atrav´es da especifica¸c˜ao de tipos gerais, cujas caracter´ısticas s˜ao herdadas por seus sub-tipos que, por sua vez, acrescentam caracter´ısticas pr´oprias e podem tamb´em apresentar sub-tipos pr´oprios, que herdam suas caracter´ısticas e assim sucessivamente, de acordo com a necessidade. A GU pode conter ainda regras lexicais, que permitem derivar itens lexicais a partir de outros (como, por exemplo, deriver verbos flexionados em terceira pessoa do singular, a partir da forma base). Assim, o l´exico se constitui de uma parte b´asica e de outra derivada.
Os parˆametros assumidos no modelo tamb´em s˜ao codificados como tipos na rede de heran¸ca, de modo que possam ter valores finitos especificados como n˜ao-configurados, padr˜ao e n˜ao-padr˜ao (absolutos). Tais propriedades podem, ent˜ao, ser herdadas por sub-parˆametros vinculados a um dado parˆametro. H´a dois conjuntos de parˆametros no modelo de Villavi- cencio: categoriais e de ordem de palavras. Os primeiros, definem as categorias permitidas pela gram´atica num dado momento, no curso da aquisi¸c˜ao. S˜ao 89 parˆametros, agrupados de acordo com o tipo sint´atico das respectivas categorias e ordenados de acordo com sua valˆencia.
Por exemplo, o parˆametro para verbos transitivos ´e um sub-tipo do parˆametro para verbos intransitivos, visto que no modelo verbos transitivos s˜ao definidos com base em verbos intransitivos (i.e., herdam a caracter´ıstica de ter um sujeito). Em rela¸c˜ao `a ordem, s˜ao 18 parˆametros, tamb´em implementados como tipos na hierarquia da rede. O parˆametro inicial ´e o relativo `a ordem geral da l´ıngua, havendo sub-parˆametros para elementos espec´ıficos, tais como o sujeito ou outros argumentos do verbo. Todos os sub-parˆametros herdam o valor dos parˆametros mais altos na hierarquia, mas podem, de acordo com a experiˆencia, alterar o valor.
O modelo inclui aquisi¸c˜ao lexical, modelada conforme a adapta¸c˜ao de Waldron (1999, apud Villavicencio, 2002) do algoritmo proposto em Siskind (1996). A principal diferen¸ca, segundo a autora, ´e que na adapta¸c˜ao de Waldron os itens funcionais possuem conte´udo semˆantico, ao contr´ario de Siskind, que os assume como elementos semanticamente vazios. Em rela¸c˜ao ao corpus utilizado, o algoritmo de aquisi¸c˜ao lexical conseguiu processar 63,6% dos enunciados (num total de 1517 que comp˜oem o corpus), dos quais 95,23% eram corretos, ou seja, um total de 965 enunciados. Esta sa´ıda da aquisi¸c˜ao lexical ´e ent˜ao enviada para o procedimento respons´avel por identificar as categorias sint´aticas apropriadas a cada palavra.
O procedimento para aquisi¸c˜ao sint´atica, numa execu¸c˜ao t´ıpica, atingiu 52,6% de enun- ciados processados (dos 965). Por´em, do total de 508 enunciados processados, apenas 4,7% eram atribui¸c˜oes de categorias sint´aticas corretas, com o restante contendo pelo menos uma categoria incorreta. Para contornar este problema, o modelo conta com um procedimento para descartar atribui¸c˜oes inv´alidas, aumentando o n´umero de enunciados aproveitados den- tre os 508.14 Ap´os obter uma atribui¸c˜ao v´alida, a sintaxe envia as categorias para o m´odulo de detec¸c˜ao e processamento de gatilhos, respons´avel por identificar os gatilhos providos pelo dado e configurar os parˆametros respectivos.
A natureza desta etapa da aprendizagem ´e probabil´ıstica, concebida para determinar
a configura¸c˜ao param´etrica da gram´atica mais adequada para descrever os gatilhos contidos no dado de entrada. Villavicencio (2002) conduz ent˜ao uma s´erie de simula¸c˜oes, controlando algumas vari´aveis como n´ıvel de ru´ıdo ou ambiguidade (envolvendo PPs locativos). A autora mostra que o modelo converge para a gram´atica-alvo nas simula¸c˜oes, mostrando-se, assim, robusto a ru´ıdos e ambiguidade, alterando os parˆametros apenas quando encontra fortes evidˆencias para isso.
Entre os pontos fracos da modelagem, dentro daquilo que idealmente se espera, vale ressaltar a assun¸c˜ao de uma GU espec´ıfica para o inglˆes, o que indica que o modelo ´e restrito em termos translingu´ısticos, e o baixo n´umero de enunciados de fato utilizados para aquisi¸c˜ao param´etrica, o que pode ser ind´ıcio – dado que esta convergiu mesmo assim – de algum vi´es pr´oprio aos procedimentos de aquisi¸c˜ao ou aos dados de entrada, de modo a propiciar a convergˆencia com base em uma baixa quantidade de dados (especialmente dado o car´ater probabil´ıstico do modelo).
Por outro lado, o estudo de Villavicencio possui v´arias propriedades interessantes. Pri- meiramente, ´e uma tentativa concreta de modelar uma vis˜ao param´etrica do conhecimento lingu´ıstico, ao mesmo tempo em que a autora n˜ao idealiza demasiadamente a tarefa, visto que cabe ao aprendiz adquirir o l´exico, identificar as categorias sint´aticas das palavras para, s´o ent˜ao, extrair os gatilhos dos enunciados e configurar os parˆametros. Em segundo lugar, o fato de mesclar uma abordagem probabil´ıstica (para configura¸c˜ao param´etrica) com uma relativamente determin´ıstica (para aquisi¸c˜ao lexical e sint´atica), ´e basicamente in´edito no que diz respeito a MCAs.
Uma terceira virtude ´e o uso de um corpus de senten¸cas dirigidas `a crian¸ca, o que confere maior plausibilidade ao modelo, embora corpora artificiais possam ser adaptados de modo a refletir certas propriedades distribucionais observadas em corpus de fala dirigida `a crian¸ca. Outro aspecto interessante desta proposta ´e que ela implementa (atrav´es da no¸c˜ao de hierarquia) a ideia de que certos parˆametros (quando configurados) devem ter impacto
noutros aspectos da gram´atica e n˜ao apenas um efeito isolado. Por fim, a disponibiliza¸c˜ao de medidas quantitativas dos resultados obtidos ´e importante, na medida em que permite alguma compara¸c˜ao mais direta com resultados obtidos noutras modelagens.