• Nenhum resultado encontrado

Sobre os Modelos Estatísticos

No documento Métodos para Análise Discursiva Automática (páginas 134-137)

5. Modelos Estatísticos para Análise Discursiva Automática

6.2. Sobre os Modelos Estatísticos

Os modelos estatísticos apresentados nesta tese de doutorado são o resultado da investigação de uma grande quantidade de modelos desenvolvidos, testados e aprimorados. Diferentemente da abordagem simbólica, na abordagem estatística, uma vez que a modelagem é definida, um modelo é rapidamente treinado e testado, com custo significativamente menor. Entretanto, o conhecimento produzido por estes modelos é muito dependente do método de aprendizado utilizado e do próprio formalismo dos modelos, sendo, portanto, de difícil interpretação por humanos. Além disso, por ser uma linha empírica de investigação, o desenvolvimento e aprimoramento dos modelos se dá, basicamente, por testes exaustivos, considerando- se diversos parâmetros e possibilidades.

Os modelos para análise discursiva, baseados em unidades de informação de crescente complexidade (palavras, conceitos e estruturas argumentais) apresentaram resultados promissores. São modelos inéditos aplicados a uma tarefa ainda não tratada desta forma anteriormente. Esses modelos foram treinados e testados para a língua inglesa e para uma única relação de discurso, a relação causa-efeito, similar à relação

cause-effect de Kehler (2002).

O resultado dos testes dos modelos apontou a necessidade do aprendizado de estruturas argumentais, já que esta tarefa não foi satisfatoriamente cumprida pelo último dos modelos testados. Com isso, foi desenvolvido um modelo estatístico dedicado a este aprendizado, produzindo bons resultados. Esse modelo foi treinado com os 1.500 verbos mais freqüentes do inglês, resultando em um repositório chamado ArgBank.

6.2.1. Aplicações em PLN

Como Marcu e Popescu (2005) discutem, os modelos estatísticos têm sido a base de avanços significativos em PLN. Os autores mostram como esses modelos podem ser utilizados para a realização de inferências e de aprendizado de conhecimento de mundo. Acredita-se que os modelos apresentados nesta tese dão mais um passo nesta direção.

Em tradução automática estatística, a partir dos parâmetros probabilísticos aprendidos, pode-se (a) traduzir uma sentença em uma língua fonte para uma sentença em uma língua destino ou (b) reconhecer sentenças que são traduções umas das outras. O uso dos modelos estatísticos desenvolvidos neste trabalho refere-se ao item (b) acima, isto é, o uso dos parâmetros aprendidos para determinação das relações de discurso entre proposições. A aplicação do item (a), no âmbito deste trabalho, refere- se à possível tradução de uma causa em seus efeitos ou vice-versa, ou seja, a predição dos efeitos possíveis para uma dada causa ou vice-versa. Em um teste realizado, o modelo baseado em estruturas argumentais foi testado desta forma. Foi desenvolvido um decodificador (veja Seção 5.1 do capítulo anterior) que, a partir do conjunto de parâmetros de causa-efeito aprendido pelo método EM durante o treinamento do modelo baseado em estruturas argumentais (isto é, os parâmetros ce), procura pelos efeitos mais prováveis dada uma causa ou vice-versa. Por exemplo, dada a estrutura

argumental de causa was(he,insane), o decodificador sugere como possível efeito

argue(lawyers,innocence).

Em uma avaliação subjetiva, por um único lingüista computacional, obtiveram-se os seguintes resultados para a predição de efeitos: em 40% dos casos, as predições faziam sentido, consideradas passíveis de ocorrência no mundo real; em 25% dos casos, não foi possível determinar com certeza se as predições eram plausíveis; em 35% dos casos, os efeitos previstos não faziam sentido. Nos casos em que não foi possível determinar se os efeitos eram plausíveis ou não, dois problemas foram identificados nas estruturas argumentais sugeridas: presença de nomes próprios e presença de palavras estranhas ou desconhecidas, como ocorrem nas estruturas

killed(capano,fahey) e shut(camp,unher). Acredita-se que, melhorando-se a qualidade

dos pares de causa-efeito aprendidos pelo modelo baseado em estruturas argumentais, os resultados da predição devem melhorar também. Como pesquisa futura, isso pode ocorrer com o uso do modelo de aprendizado de estruturas argumentais proposto.

O repositório de estruturas argumentais produzido pode ser utilizado para diversos fins em PLN. Uma utilização natural desse repositório é no auxílio à interpretação semântica de textos, pela identificação da estrutura argumental mais provável em uma sentença, por exemplo. Em aplicações de geração automática de textos, o repositório pode servir como indicador da qualidade do texto gerado: caso alguma estrutura do repositório seja observada no texto, pode haver grandes chances do texto ser semanticamente bem formado; caso contrário, pode-se refazer o texto.

6.2.2. Extensões

Os modelos apresentados podem ser treinados para todas as relações do discurso que se deseje e para diferentes línguas. O treinamento para outras relações é possível devido à generalidade das modelagens propostas. O uso dos modelos para outras línguas depende, entretanto, da disponibilidade dos recursos e ferramentas de PLN necessários.

Repositórios de conhecimento podem ser acoplados aos modelos, tornando-os mais informados para a tarefa que realizam. Por exemplo, os modelos de análise discursiva, quando aplicados às relações causa-efeito, podem assumir como conhecimento pré-definido ou complementar as relações de causa entre os verbos

previstas na WordNet. Por exemplo, para o verbo kill (“matar”, em português), especifica-se, na WordNet, os efeitos die e pass away (“morrer”, em português), entre outros.

O modelo desenvolvido para o aprendizado das estruturas argumentais dos verbos deverá, no futuro, ser aplicado ao português do Brasil, produzindo um repositório similar ao ArgBank. Diferentemente da língua inglesa, para a qual há repositórios como a FrameNet, a VerbNet e o PropBank, para o português não há nenhum.

6.2.3. Limitações

Os modelos estatísticos propostos podem ser aprimorados para serem capazes de lidar com sentenças longas e que contenham construções lingüísticas complexas.

Em seu estágio atual, o modelo para o aprendizado das estruturas argumentais dos verbos é treinado com sentenças de, no máximo, 10 palavras, e restringe a 3 o número de argumentos possíveis para um verbo. Além disso, o modelo não é capaz de detectar phrasal verbs e tratá-los adequadamente.

Essas limitações constituem trabalhos futuros para o aprimoramento dos modelos.

No documento Métodos para Análise Discursiva Automática (páginas 134-137)