As i nformações para a formulaç:ão do modelo do usuário fo ram portanto , também no caso da I In, obtidas na etapa de entrevista
EVENTUALMENTE A ALGUNS OU TODOS OS DOCUMENTOS DESSA CONSULTA Em sint ese, pode-se resumi r os passos metodológi cos seguidos para
a elaboração do modelo propost o para a II n e de suas
funcional idades, no seguinte:
- esc.oJ ha .. clos ___ parâm_etros. que .. Jrão .... compor _ o_ . modelo ... do ... vsvá.r..io ; os parâmetros est abel ec idos como operaciona ú:: e passíveis de serem mani pulados pela IIn com . a final idade de graduar o seu funcionamento foram: i nt eresse do usuário por revocação ou precisão e número máxi mo de documentos que o usuár· i o goE�tari a de e xami nar. Est es· parâmet ros seri am obt idos i nt errogando o usuá rio, através de um diálogo/ent rev ista est ruturado, · e de ex pressões característ i cas (estruturas sintát i co-semânt i cas) obt idas da - própri a consult a formul ada pel o usuári o em LN.
- .e.l.ahorai;:ão ... . .do . . formalis.mo . . lingüístico : para ist o, em pr·i meiro
lugar foi exami nado um det ermi nado número de consult as em linguagem nat ural ( sessent a consultas) ; foi efetuada uma anál i se sintát i ca, de acordo com as categorias do português, de modo a reconhecer os componentes s i ntát i cos bási cos de uma consult a formulada em l inguagem nat ural ; analisou-se pri mei ramente quais destes componentes sintát i cos seriam rel evantes para a formul acão da expressão bool eana, obt endo-se assi m uma estrutura s i ntát i co semânt i ca i ni cial para um� consulta em l inguagem nat ural, a exemplo de formal i smos l i ngüist icos ut i l i zados e m si stemas simi lares ( gramát i ca semant i ca ) ; foi realizada uma cat egorização tentativa i ni ci a l dos diferent es t ipos de consul ta , de ac ordo a existência ou não de padrões gramat i cais e de componentes
/
relevantes para a formulação da expressão booleana; estes componentes foram estabelecidos então como categorias gramaticais e baseado neles foi então proposta uma gramática sintático semântica, capaz de analisar as consultas em linguagem natural.
Esta gramática está orientada para categorias sintático semânticas estabelecidas em funç ão de sua relevância para a formulação final d a expressão booleana. Em função dessas categorias sintático-semânt icas, reclassificou-se definitivamente as consultas da massa de teste.
Se o formalismo proposto não reconhecer uma apelará para um formalismo l ingüistico mais "string-search/busca ao dicionário".
consulta, a IIn tosco, a técnica Com este formalismo procurou-se obter uma expressão booleana inicial tão boa quanto possivel, que servisse de ponto de partida inicial para a interação com o SRI; o passo lingüistico é de importância fundamental para o desempenho da I In, uma vez que, partindo de uma expressão booleana o mais pró xima possi vel das intenções do usuário, formuladas atravé s de sua consulta em linguç3.gem natural, a etapa subseqüente, a interação usuário/SRI intermediada pela IIn , já pode contar com o "feed- back" da própria base' de conhecimentos especializado em buscas retrospectivas que faz parte d a IIn , como também do próprio "feedback" do usuário_ ao examinar os resultados iniciais obtidos.
- Jnt..�r.-ª_ç_ão ___ __ç.Q_ffi ___ Q _______ SR.L _____ a _____ p_ar_t_i.r ______ d_a ______ e.xp_r .. e .. s..s..ã.Q .. _____ bo.o_l_e._an.a. ________ inl.c_t_a_l
.ob.tl..da _____ nQ _________ p_a.s_s.Q ____ a.n.t..e. .. ;r.1-.or; para isso, reformular a expressão booleana corrente em função dos parâmetros estabelecidos no mode l o do usuário e d a própria avaliação dos documentos recuperados feita pelo usuário; para esta reformulação, é utilizada a base de regras contendo conhecimento especialista em buscas retrospectivas.
- finalmente, -ª_y-ª_lJª_ç_ão .. ____ .d_o ___ m:o.de.l.o. ___ J>_r_opos_t_o, sobre uma massa de teste de trinta consultas.
Notas e Referências :
1 . FLUHR , C . Informat ion Retrieva l . I n : CONSULT I VE MEETI NG o f I NI S L I A I SI ON OFFI CERS , 17 , Viena , May 1989 .
2. DAN I ELS , P . J . Cognitive Models in Information Retrieval - An Evaluative Review . J ournal of Documentat ion , v . 42 , n . 4 , p . 272-30 4 , December , 1986 .
3. Posteriormente, o potencial do formal ismo l ingüístico poder i a ser ut i l izado reformular estes par·âmetros , como , por e}:emplo , na
seguinte , situação : quero saber tudo sobre o acidente de
Chernobyl" ; o quant i ficador "tudo " parece indicar claramente . no caso desta consulta , um interesse marcadamente por revoe ação da parte do usuário .
4 . CUNHA , I . M . R . Estruturação de Vocabulário . I n : Aná l ise Docurnentá�ia : a Anál ise da Síntese . Brasí l ia , I nstituto Brasi le iro de Informação em Ciênc ia e Tecnologia - I B I CT , p . 62--85 , 1 987 .
5 . DI LLON , M . , DESPER , J . The Use of Automati.c Relevance Feedback in Boolean Retrieval Systems . Journal o f Documentat ion , v . 36 ,' n . 3 , p . 197-208 , September 1980 .
6 . VERN H�m , C . Automatic Query Ad.iustment in Document Retrieval .
Informat ion Processing & Management , v . 13 , p . 339-53 , 1977 .
7. CUNHA , C . F . da . Gramática de Base . Rio de Jane iro , Min istério da Educação e Cul tura Fundação Nac ional de Material Esco lar , 1979 .
8 . DAS-GUPTA , P . Boolean Interpretation of Conjuct ions for Document Retrieval . cJASI S , v . 38 , n . 4, p . 245-54 , 1987 .
9 LANCAi3TER , F : W . Information Retrieval Systems . ,John Wi l ey & Sons , New York , 222p , 1968 .
10 . BARKER , F . H . , VEAL , D . C . , WYATT , B . K . Towards Automatic Prof.Lle Construction . J·ournal of Documentation , v . 28 , n . 1 . March 1972 .
11 . GRZELAK , HANNA . KOWASKY , K . Automat ic Construction of Inforrnation Queries . Information Processing & Management , v . 19 , n . 6 , p . 38 1-9 , 1983 .
12 . BATfü3, M . ,J . Information Search Tatics . JAS I S , v . 4 , n . 30 , p . :205--14 , 1 979 .
5 . AVALIAÇAO E DISCUSSAO DO MODELO PROPOSTO
Do modelo proposto é apresentado a seguir uma avaliação somente do formalismo lingüí stico, devido a facilidade de simular a I I n. Como resultado espera-se que o formalismo lingüí stico obtenha, a partir das expressões de consulta formuladas em linguagem natural , uma expressão booleana inicial razoavelmente coincidente com as intenções do usuário, de modo a servir de ponto de partida para uma interação usuário/SRI . Para ava l iação do modelo proposto foram examinadas ao acaso cerca de 30 (trinta ) furmulários de consulta, dos anos 1986 ã 1989 , abrangendo diferentes bases de dados. Os resultados obtidos foram os seguintés:
- em 1 6 ( dezesseis ) cons�ltas o modelo conseguiu reconhecer a estrutura proposta e com ela guiar a interpretação da consu.l ta ,
obtendo uma expressão booleana próxima ou eventualmente mais rica gue a obtida pelo especialista humano ; nesses casos a expressão booleana obtida fornece um ponto de partida seguro para iniciar a interação com o SRI , resultado que portanto foi considerado satisfatório ;
- em 12 ( doze ) consultas o modelo não conseguiu reconhecer a estrutura proposta e analisou a expressão de consulta como se ela constasse somente da ESPECI F ICAÇAO DO ASSUNTO , utilizando- a técnica de " string-search" e busca ao tesauro da base , o que pode ser considerado lingüisticamente sofrível ;
em 2 ( duas ) corisul tas o mo de lo falhou em - reconhecer a Bstrutura proposta e ao analisar a expressão de consulta segundo a técnica de " string-search"/busca no tesauro, obteve interpretações incorretas das intenções do usuário .
A seguir , seguem-se alguns exemplos de consultas processadas pelos formalismos lingüí sticos sugeridos :
ex . 1 - " O objetivo da busca é fazer um trabalho sobre metodologias de proj eto de um sistema de controle digital enfocando as etapas do projeto que são necessárias e os documentos de proj eto que ,.devem ser gerados em cada etapa" ( RS25/89 base I N SPEC ) .
la. fase - TABELA : 0 1. 0
02. 0BJETI VO 03. DA 04. BUSCA 05. E 06 . FAZER 07 . UM · 08 . TRABALHO -> 09 . SOBRE 10 . METODOLOGIAS 11 . DE 12 . PROJETO
13 . DE