• Nenhum resultado encontrado

Alinhamento entre Ontologias e a FrameNet

No documento alexandramoreira (páginas 97-103)

4 FUNDAMENTOS COMPUTACIONAIS ADOTADOS

4.4 Alinhamento entre Ontologias e a FrameNet

A combinação da FrameNet e ontologias não é nova. Existe um projeto que combina a ontologia de nível topo SUMO com a FrameNet para fins de inferência linguística (SCHEFFCZYK; PEASE; ELLSWORTH, 2006). Nesse caso, os tipos semânticos da FrameNet são mapeados para os conceitos da Ontologia. Esta combinação é importante porque combina a capacidade inferencial das ontologias (que falta na FrameNet) com os recursos linguísticos da FrameNet (que faltam nas ontologias).

Em Chishman (2009) é proposta uma integração entre léxicos semânticos e ontologias para o domínio jurídico tendo como base teórica os estudos de Lenci et al. (2002) e Guarino (1998). Em sua proposta, são apresentadas duas iniciativas do grupo de pesquisa SEMANTEC da Unisinos, cujo objetivo é desenvolver estudos semântico- computacionais voltados para a construção de léxicos e ontologias.

Uma das iniciativas trata do desenvolvimento de uma ontologia de verbos para o domínio jurídico, tendo por base um corpus composto de seis acórdãos judiciais relacionados com o tema “acidentes rodoviários”.

A segunda iniciativa trata da análise, sob o ponto de vista ontológico, dos adjetivos que ocorrem em acórdãos do Instituto das Tecnologias de Informação na Justiça de Portugal, totalizando 40 textos. No primeiro caso, os verbos foram sistematizados segundo os aspectos da semântica verbal, focando principalmente nas relações lógico-semânticas (antonímia, hiponímia etc.), papéis semânticos (agente, paciente, instrumento etc.) e elementos de frames. A organização na forma de ontologia permitiu a generalização de consultas, tais como a capacidade de incluir motocicletas, carros, ônibus e conceitos correlatos em respostas às perguntas como: que veículos

automotores mais se acidentam? (CHISHMAN, 2009).

A especificação dos frames onde ocorrem os verbos permite que se observe a necessidade da ocorrência de determinados argumentos, para compor a cena relacionada com o verbo. Além disso, a ontologia determina restrições em relação à natureza dos argumentos. No caso dos adjetivos, o foco foi a análise das várias categorias de adjetivos (classificadores, qualificadores, intensionais remissivos, valenciais, modalizadores etc.) e, conforme cada caso, relacionando-os com os elementos da ontologia. Por exemplo, os adjetivos classificadores do domínio jurídico (público, administrativo, jurídico etc.) são de grande importância para uma taxonomia estrutural do domínio, explicitando relações tais como hiponímia/hiperonímia (CHISHMAN, 2009).

Chow e Webster (2007) propuseram a integração da FrameNet com a WordNet e a ontologia SUMO, com o propósito de realizar a classificação de verbos de acordo com a análise da metafunção Ideacional da Gramática Sistêmico-Funcional (GSF) (HALLIDAY, 1994). Nessa pesquisa, as unidades léxicas da classe de verbos da FrameNet foram mapeadas para os synsets de verbos da WordNet. Após isso, foi

utilizado o mapeamento WordNet/SUMO realizado por Niles e Pease (2003), para realizar o mapeamento FrameNet/SUMO. A FIG. 18 esquematiza o mapeamento realizado.

FIGURA 18 – A rede relacional do mapeamento entre FrameNet, WordNet e SUMO. FONTE – CHOW & WEBSTER, 2007. p.6.

López et al. (2008) utilizaram a FrameNet alinhada com a ontologia DOLCE para descrever emoções. O sistema está sendo usado no desenvolvimento de interfaces computacionais sensíveis à expressão de emoções.

Burchardt e Pennacchiotti (2008) investigaram as razões do baixo desempenho de sistemas que utilizam a estrutura argumental na tarefa de reconhecer inferência textual. A tarefa de reconhecer inferência textual (Recognizing Textual Entailment

Track, RTE) é um projeto patrocinado pela agência NIST (National Institute of Standards and Technology) do governo americano. Consiste do reconhecimento

automático da relação inferencial entre pares de sentenças T e H, onde T representa “Texto” e H representa “Hipótese”. O RTE disponibiliza um conjunto desses pares para a análise, sendo que o critério para existência da relação inferencial é o seu

reconhecimento por falantes típicos da língua. Por exemplo, nas sentenças a seguir, um falante da língua inglesa reconheceria que a sentença T implica na sentença H:

T – Kiesbauer was target of a letter bomb in June 1995. Her secretary got injured.

H – A letter bomb was sent to Kiesbauer.

Em tarefas como essa é importante entender o papel dos participantes em cada cena, de modo a relacioná-las. Em T, Kiesbauer é o recipiente da carta bomba e em H ele é o destinatário da carta. Portanto, recursos lexicais que levam em conta a estrutura argumental e identificam os papéis semânticos possuem um potencial para contribuir com sistemas para RTE. No entanto, segundo os autores, o único sistema baseado na FrameNet obteve um desempenho apenas mediano. Os autores especulam que as razões podem estar entre as seguintes: a) baixa cobertura lexical; b) confiabilidade limitada dos

parsers semânticos de frames; c) utilização não otimizada da informação semântica dos

frames no módulo de raciocínio.

O primeiro passo da investigação de Burchardt e Pennacchiotti foi a anotação da base do RTE, composta por 800 pares de sentenças, com a informação existente na FrameNet. Após a realização dessa etapa, foi verificado que apenas 8% dos elementos evocadores de frames não possuíam frames na base da FrameNet. Portanto, a baixa cobertura lexical foi descartada como sendo a responsável pelo baixo desempenho e os autores concluíram que outras análises deveriam ser realizadas, para identificar os gargalos da utilização da FrameNet na RTE.

Ovchinnikova et al. (2010) propuseram melhorar a estrutura da FrameNet por meio de sua integração com a ontologia DOLCE, com o objetivo de ampliar seu uso em tarefas intensivas de processamento de linguagem natural. Segundo os autores, isso é necessário devido a algumas limitações atuais da FrameNet, tais como baixa cobertura lexical, incompletude das relações, inconsistências na herança de propriedades e falta de axiomatização (ver seção sobre limitações da FrameNet). Para contornar as limitações, a FrameNet foi mapeada para as categorias da DOLCE e suas relações foram formalizadas. Por exemplo, a relação de subframe para eventos foi formalizada da seguinte forma:

∀p1 p2 (sub_ev (p1 , p2 ) → (strict_temp_inc(p2 , p1 ) ∧ spatially_includes(p2 , p1 )))

Parafraseando: um evento é subevento de outro se está incluído temporal e

espacialmente no outro.

Após o alinhamento, axiomatização e ajuste das relações da FrameNet, foi feito um estudo de caso em um conjunto de pares (t,h) de textos relacionados com o domínio médico. A TAB. 1 mostra o resultado do estudo de caso:

Tabela 1 – Comparação sobre inferência textual no domínio médico.

Sem anotação de frames Com anotação de frames Com anotação de frames + axiomatização Provas corretas 1 4 7 Provas erradas 1 1 1 Precisão geral 0,56 0,5 0,61

FONTE – Adaptado de OVCHINNIKOVA et al., 2010. p.7.

Pode-se observar que a axiomatização permitiu um número maior de inferências corretas e um aumento na precisão geral.

Em Bārzdiņš et al. (2008, p.1) é sugerido que a FrameNet seria beneficiada pela formalização de seus tipos ontológicos, de modo a permitir um melhor uso por dispositivos computacionais. Com esse objetivo eles geraram, a partir das sentenças do

corpus anotado da FrameNet, uma estrutura multidimensional: a dimensão dos frames, a

dimensão das unidades léxicas, a dimensão dos elementos de frames e a dimensão das valências. Segundo os autores, essa estrutura multimensional, juntamente com todos os elementos do corpus anotado, formam a ontologia da FrameNet. É importante ressaltar que isso não é o que é considerado como ontologia neste trabalho.

Ofoghi et al. (2007) e Ofoghi (2009) propuseram estender a FrameNet por meio de uma ontologia, para permitir a implementação de um sistema de perguntas e respostas que fosse capaz de lidar com perguntas das quais as respostas envolvessem o tratamento de cadeias de predicados. Cadeias de predicados, como definido por Morris e Hirst (1991), são cadeias de unidades lexicais que são sequências de termos relacionados semanticamente. Por exemplo, a sentença apresentada em Ofoghi (2009), “In 1974, using beams of electrons and antielectrones, or positrons, Richter discovered a particle that came to be called Psi/J. It contained two quarks possessing a previously unknown flavor called charm...”, forma a cadeia de predicados ilustrada na FIG. 19:

FIGURA 19 – Cadeia de predicados de uma sentença. FONTE – OFOGHI, 2009. p.120.

Outra área onde a combinação da FrameNet com ontologias é útil é na interpretação de metáforas. A FrameNet não faz distinções entre uso metafórico e literal de unidades lexicais. Cada uso da unidade é um sentido distinto.

Essa abordagem é adequada para o entendimento de cenas, mas limita o uso em inferências, já que existe um isomorfismo entre estruturas literais e metafóricas e esse isomorfismo pode ser utilizado para realização de inferências e entendimento de um texto. Como já foi mencionado anteriormente, o uso metafórico de ULs tem sido anotado na FrameNet, mas ligações metafóricas entre os frames ainda não são aplicadas.

Gedigian et al. (2006) mostraram que a combinação da FrameNet com outros recursos lexicais que distinguem o uso metafórico do literal pode ser utilizada para ajudar na realização de inferências textuais. O uso combinado das ontologias com a

FrameNet também pode ser empregado para este fim. Por exemplo, no domínio fonte (mais concreto) algum elemento participante da estrutura teve alguma propriedade ontológica flexibilizada, para permitir a ocorrência de elementos mais abstratos na estrutura de alvo (mais abstrata). Seja o verbo pegar em seu uso literal. Neste caso, um ente animado tomou posse de um objeto concreto. Já no uso metafórico do verbo pegar, como na frase “pegar uma ideia”, o objeto que foi “pegado” passou de concreto particular para um objeto abstrato. Especulamos que as alterações das propriedades ontológicas não são grandes, de forma a permitirem que o ouvinte perceba a intenção do falante.

Finalmente, o uso combinado de ontologias e frames permite o estabelecimento de novas ligações entre os frames (relações de semelhanças de propriedades ontológicas), permitindo uma melhor verificação da adequação de determinados frames e indicação da necessidade de criação de novos. Um benefício adicional dessa ligação é o fornecimento de uma explicação plausível para o processo de criação de metáforas. Além disso, torna-se possível estabelecer o contexto para a identificação de frames, o que facilita a extração automática de informações. Estas aplicações serão mais exploradas na próxima seção.

No documento alexandramoreira (páginas 97-103)