• Nenhum resultado encontrado

5.3 Balan¸co

5.3.2 Contribui¸c˜ oes

Independentemente dos problemas pontuais referidos na sec¸c˜ao anterior, a an´alise experi- mental revelou a utilidade da metodologia proposta. Numa perspectiva mais abrangente sobre este trabalho de investiga¸c˜ao, consideramos que as principais contribui¸c˜oes s˜ao:

• caracteriza¸c˜ao de t´ecnicas, metodologias e sistemas

Descreveram-se os componentes existentes numa arquitectura t´ıpica de SPR: an´alise da pergunta, recupera¸c˜ao de documentos, an´alise do respectivo conte´udo e ex- trac¸c˜ao de respostas. Foi elaborado um levantamento de t´ecnicas aplicadas em cada uma destas fases, enquadradas em diferentes abordagens, com a indica¸c˜ao de alguns sistemas em que s˜ao empregues.

• modelo te´orico com inspira¸c˜ao humana

Responder a uma pergunta, num sistema de ˆambito geral, envolve normalmente o processamento de documentos escritos em l´ıngua natural. N˜ao h´a melhor en- tendedor da linguagem humana que o pr´oprio Homem. Pelo senso comum, se uma pessoa n˜ao tem a resposta a uma pergunta, ent˜ao documenta-se, por exemplo numa enciclop´edia, ou pesquisando na Web. Esse mesmo procedimento pode ser usado, n˜ao para encontrar a resposta, mas para obter uma confirma¸c˜ao em caso de incerteza. Perante v´arias poss´ıveis respostas, ´e consensual que uma pessoa faz uma pondera¸c˜ao sobre a validade de cada uma. A tendˆencia ´e escolher a resposta que se mostrar mais apropriada, em fun¸c˜ao das informa¸c˜oes que lhe est˜ao associ- adas na sua mem´oria, incluindo os significados poss´ıveis e cen´arios ou contextos

de incidˆencia do respectivo conceito. O modelo tenta imitar a referˆencia humana, adoptando procedimentos correspondentes a:

– procura de respostas quando a mem´oria n˜ao tem a solu¸c˜ao

– confirma¸c˜ao pela consulta de fontes de informa¸c˜ao, incluindo a Web

– determina¸c˜ao da resposta por analogia entre os resultados poss´ıveis, com base nas informa¸c˜oes dispon´ıveis, que s˜ao em primeiro lugar as recorda¸c˜oes susci- tadas na mem´oria por cada um desses resultados.

• contextualiza¸c˜ao plena

As respostas candidatas s˜ao caracterizadas de uma forma mais rica que o usual, sendo associadas n˜ao s´o a um contexto semˆantico, mas tamb´em a contextos tem- poral e espacial. A defini¸c˜ao deste ambiente torna mais natural a aceita¸c˜ao de diferentes respostas correctas para a mesma pergunta, cada uma v´alida em deter- minada regi˜ao geogr´afica, por exemplo. O contexto temporal dota o modelo da expressividade para considerar a evolu¸c˜ao das respostas ao longo do tempo.

• espa¸co multidimensional de respostas

Para dar corpo ao contexto em que se inserem os resultados, o espa¸co multidi- mensional de respostas ´e a estrutura concreta que armazena respostas candidatas e permite a compara¸c˜ao das mesmas sob diversas perspectivas. Ao facilitar a dife- rencia¸c˜ao entre os resultados da fase de extrac¸c˜ao, a v´arios n´ıveis, esta estrutura serve de suporte `as t´ecnicas de aprecia¸c˜ao de respostas candidatas, com o objectivo de melhorar a taxa de acerto do sistema.

• rede semˆantica e propaga¸c˜ao de activa¸c˜ao

Este modelo recorre a uma rede semˆantica para representa¸c˜ao de respostas candi- datas, em particular para o eixo semˆantico do espa¸co multidimensional e para as respostas formadas por texto. Com esta estrutura associativa, ´e poss´ıvel agregar to- dos os resultados a considerar e ainda elementos semˆanticos individuais ou comuns a v´arias respostas. A malha semˆantica, resultante do processo de expans˜ao dos n´os resposta, permite lidar com a ambiguidade atrav´es da representa¸c˜ao de todos os significados conhecidos para um conceito. Nessas situa¸c˜oes, o significado relevante encontrar´a eco noutra resposta candidata, eventualmente, emergindo entre os de- mais. A propaga¸c˜ao de activa¸c˜ao ´e o procedimento pr´atico para a identifica¸c˜ao destes significados e outros elementos semˆanticos relevantes para cada resposta candidata, necess´arios para a reaprecia¸c˜ao dos resultados da fase de extrac¸c˜ao.

• inferˆencia como complemento `a extrac¸c˜ao directa

O modelo responde `as perguntas n˜ao apenas pelo fornecimento de resultados en- contrados em fontes de informa¸c˜ao, qualquer que seja a natureza das mesmas, mas

tamb´em com respostas calculadas, resultantes de um processo de inferˆencia. O processo de resposta complementa a extrac¸c˜ao directa com regras l´ogicas que com- binam m´ultiplos elementos de informa¸c˜ao, no sentido de inferir uma solu¸c˜ao para a pergunta. A base de conhecimento inicial do sistema ´e um reposit´orio semˆantico essencial ao motor de inferˆencia.

• proposta e avalia¸c˜ao de t´ecnicas de aprecia¸c˜ao de respostas candidatas Para al´em dos princ´ıpios gerais do modelo, foram descritas t´ecnicas concretas para a aprecia¸c˜ao de respostas candidatas num SPR. Tirando partido da organiza¸c˜ao que o modelo prevˆe para os resultados provis´orios, estas t´ecnicas s˜ao de uso ge- ral para respostas de texto. Quantidades e datas podem ser processadas com o mesmo princ´ıpio, mudando apenas a implementa¸c˜ao. Estas t´ecnicas foram ainda avaliadas para um conjunto representativo de perguntas de v´arias categorias, com o resultado apresentado no cap´ıtulo 4.

• sistema senso

Para al´em do modelo, dos princ´ıpios que influenciam a respectiva metodologia e das t´ecnicas delineadas para resolver aspectos chave no tratamento de uma per- gunta, este trabalho de investiga¸c˜ao resultou tamb´em na implementa¸c˜ao do sistema senso. Mais que um prot´otipo para testar t´ecnicas espec´ıficas, o sistema desen- volvido ´e efectivamente um SPR. Real¸camos ainda o facto deste sistema ter sido aplicado ao Portuguˆes, n˜ao por ser um requisito, mas por op¸c˜ao. A metodologia, em termos gerais, n˜ao depende da l´ıngua. Isso sucede apenas em elementos concre- tos, como os padr˜oes textuais usados nas regras de an´alise textual ou o analisador morfo-sint´actico, mas poderiam adaptar-se para outros idiomas.