C D U 002.66
M IS T R A L : S IS T E M A D E R E C U P E R A Ç A o D O C U M E N T Á R IA
JEAN HABRAN
SRQPONMLKJIHGFEDCBA
S e to r d e P r o je to s e S e r v iç o s A B C B U L L S .A .
0 1 0 0 0 S ã o P a u lo , S P
o
S is te m a d e r e c u p e r a ç ã o d o c u m e n tá r ia , M IS T R A L , é u m s is te m a in te g r a -d o d e d o c u m e n ta ç ã o a u to m a tiz a d o , q u e in c lu i: b u s c a r e tr o s p e c tiv a , d is s e m in a -ç ã o s e le tiv a d a in fo r m a -ç ã o , e n tr a d a e m lin h a d e d o c u m e n to s , in d e x a ç ã o a u to -m á tic a , g e s tã o d e lé x ic o e te s a u r o s , in tJ r fa c e p ã ;a v id e o d is c o , m á q u in a s d e m ic r o film a g e m e d e fo to c o m p o s iç ã o . P e r m ite a o r g a n iz a ç ã o d o s m a io r e s b a n c o s d e d a d o s n a E u r o p a e n o m u n d o .1.
INTRODUçAo
O volum e de dados publicados aum enta diariam ente. E ssa
EDCBA
i n f l a ç ã o de docu-m entos, pesquisas, descobertas e norm as, em vez de sim plificar, com plica sensi-velm ente o trabalho dos bibliotecários, juristas, pesquisadores, cientistas e enge-nheiros, em função da im possibilidade de assim ilar todas as inform ações e da difi-culdade de se ter acesso aos docum entos pertinentes em tem po hábil.E xistem tam bém problem as com plexos para repertoriar, classificar e estocar as inform ações.
P ara ajudar os especialistas a recuperar rapidam ente a inform ação, sem r u í d o nem perda de tem po, foram criadas ferram entas com o o M IS T R A L , que perm i-tem realizar a busca retrospectiva e a dissem inação seletiva das inform ações.
A busca retrospectiva possibilita recuperar um a inform ação cadastrada atra-vés de perguntas feitas pelo próprio usuário, com possibilidades de am pliar ou res-tringir o cam po de pesquisa. A inform ação pode ser m aterializada pela fonte pri-m ária, ou seja, o texto original, ou através de um a referência contida num a fonte secundária para perm itir a localização do docum ento original.
A dissem inação seletiva possibilita a em issão periódica de listas de referências de docum entos recebidos ou disponíveis, concernentes a um determ inado perfil do usuário. É a m aneira de inform ar sistem aticam ente os m em bros da organização.
M istral: sistem a de recuperação docum entária
2 .
CONCEITOS
N o caso específico do M IS T R A L , existe a possibilidade de cadastrar tanto
o texto original com o urna referência secundária.
A s inform ações são estruturadas num banco de dados
EDCBA
( d a t a b a n k ) , em discosm agnéticos, ocupando pouco espaço físico e possibilitando o acesso rápido, em
segundos. N o caso de texto integral, trata- se de banco de dados textual; no caso
de resum o, fala-se de banco de dados bibliográficos.
O banco de dados M IS T R A L pode ser dividido em até 25 bases ( d a t a b a s e ) .
O s assuntos tratados em cada base podem ser classificados em até 50 dom ínios
e cobrir até 50 períodos de tem po. U m banco de dados M IS T R A L pode
reper-toriar de 4 a 32 m ilhões de docum entos, dependendo do com prim ento da
refe-rência unívoca M IS T R A L que acom panha cada docum ento e que pode chegar a
34 caracteres alfanum éricos.
O suporte básico da inform ação é o docum ento, que pode, por sua vez, ser
subidividido em até 149 cam pos, cada um deles contendo até 65.535 caracteres
alfanum éricos, o equivalente a 10.000 palavras portuguesas. S ão previstos 50
níveis de confidencial idade (acesso restrito a usuários habilitados
SRQPONMLKJIHGFEDCBA
l. a nível dedocum entos, e 50 outros a nível de cam po.
3 .
INDEXAÇÃO
DOS DOCUMENTOS
A indexação dos docum entos pode ser m anual, serni-autornática ou autom
á-tica.
N o caso de indexação m anual, as palavras-chave são escolhidas pelo próprio
docum ental ista e agrupadas num cam po específico.
A indexação sem i-autornática é geralm ente realizada no texto de um resum o.
A pós elim inação dos separadores (espaço e sinais de pontuação) e das palavras
ditas vazias (artigos, conjunções, etc ... ), os outros term os são com parados a um
vocabulário controlado, para verificar se eles podem ou não servir de indexadores
do docum ento.
A indexação autom ática perm ite a análise direta, num texto em form ato
livre, através de ferram entas lingüísticas que restabelecem o contexto das palavras,
verificam a concordância dos adjetivos, reduzem os verbos à form a infinitiva e
extraem a raiz dos term os. S ão então selecionados autom aticam ente os descritores
que servirão para indexar o docum ento.
A s palavras-chave, descritores ou indexadores são reagrupadas em léxicos
ou listas dos term os utilizáveis para a recuperação e a dissem inação dos
docu-m entos.
S e os term os precisam ser inter-relacionados, são constituídos T h e s a u r i para
estabelecer e m anter relações dos tipos hierárquico, sinoním ia, vide tam bém , com
-posto de, com ponente, m odificado por, m odificando, além das e q u iv a lê n c ia s de
term os em I ínguas estrangeiras.
68 R . B ibliotecon. B rasília, 13(1), jan./jun. 1985
JE A N H A B R A N
M IS T R A L autoriza 50 léxicos e T h e s a u r i por base de dados.
4 .
CRIAÇÃO
E MANUTENÇÃO
DE DOCUMENTOS
A introdução e a atualização de docum entos podem ser realizadas em
processa-m ento por lote ou em tem po real, através de term inais.
N o caso de introdução interativa, o usuário pode escolher as funções através
de m e n u , e telas autoexplicativas são visualizadas para ajudar a digitação.
G eralm ente a indexação é realizada autom aticam ente na introdução do
docu-m ento no term inal.
5 .
RECUPERAÇÃO
A busca retrospectiva, que pode tam bém ser efetuada nas duas m odalidades,
autoriza a interrogação de m aneira conversacional ou transacional, e oferece
re-cursos de adaptação ao nível de conhecim ento do sistem a por parte do usuário
final. P odem ser usadas até 12 I ínguas diferentes para a consulta e a m onitoração
do usuário.
A pesquisa é realizada passo a passo, por perguntas com binando operadores
booleanos, term os dos léxicos e resultados de pesquisas anteriores. É possível
truncar os term os e am pliar ou dim inuir o cam po da pesquisa usando term os
m ais genéricos ou m ais específicos dos T h e s a u r i . A pós um a pré-seleção de parte
dos docum entos de um a base, pode ser efetuada um a pesquisa direta sobre o
texto, com utilização de fatores de proxim idade, presença ou ausência de term os
na m esm a frase, m esm o parágrafo, etc. D esta m aneira, o cam po de pesquisa é
a f i n a d o e o usuário tem acesso à inform ação pertinente, sem r u i d o , O resultado da
busca pode ser im ediatam ente visualizado ou im presso. A estratégia da pesquisa
é m em orizada pelo sistem a para facilitar a autom atizar qualquer busca posterior
sobre o m esm o assunto.
6 .
DISSEMINAÇÃO
SELETIVA
A travss desse recurso, todos os novos docum entos incluídos no banco de
dados podem ser em itidos perioricam ente e enviados aos interessados. P ara tal
fim , os usuários, setores e departam entos da organização são previam ente
cadas-trados e para cada um deles é definido um perfil de interesse.
7 .
IMPRESSÃO
O S docum entos selecionados pela busca retrospectiva ou através do perfil do
usuário, em caso de dissem inação seletiva, podem ser classificados e
personali-zados a nível de l a y - o u t , títulos, cabeçalhos e endereço do destinatário no m om
en-to da im pressão.
N o caso da busca retrospectiva, os com andos de com posição de textos podem
ser fornecidos interativam ente e m em orizados para uso posterior; a im pressão
M istral: sistem a de recuperação docum entária JE A N H A B R A N
pode ser realizada em m odo
EDCBA
( m - U n e , em term inal im pressora, ou o f f - l i n c , usandoum a das im pressoras do com putador central.
tindo o acesso por ordem cronológica, por assunto, por departam ento ou por
con-sulta direta sobre o texto.
A tom ada de decisão tam bém pode ser apoiada no uso do M IS T R A L .
SRQPONMLKJIHGFEDCBA
Éefeti-vam ente possível constitu ir bancos de dados econom étricos, onde, em alguns
se-gundos, é possível recuperar e com binar parâm etros com plexos. A utilização de
núm eros com plem entados por atributos perm ite a colocação dos dados nos seus
respectivos contextos.
A utilização de M IS T R A L em bibliotecas públicas ou de em presas autoriza o
acesso à m atéria pertinente em pouco tem po. P ode ser selecionado um livro,
um artigo de um a revista ou apenas um parágrafo que cite um a portaria ou norm a.
N ão é necessário registrar a fonte prim ária, m as apenas um a referência que
perm ita localizar rapidam ente o livro na biblioteca.
E m em presas de engenharia, M IS T R A L poderá perm itir auxiliar a resposta
a editais de concorrência. É efetivam ente possível cadastrar os c u r r i c u l a v i t a e
dos engenheiros por nível de form ação acadêm ica e projetos que chefiaram ,
esto-car as referências da em presa em obras públicas e até ter um a descrição dos
proces-sos industriais utilizados e um a avaliação dos respectivos custos. E m poucos m
inu-tos será possível responder às perguntas prin2ipais baseadas na experiência das
em presas e das referências. U m a consu Ita adicional a bancos de dados externos de
norm as e patentes perm itirá assegurar-se da viabilidade atual da solução.
U m a experiência interessante foi realizada na F rança, num a rede de hospitais.
A pós a saída de um paciente é criada um a ficha hospitalar que, além dos dados
cadastrais, contém um resum o dos antecedentes m édicos, os pré-diagnósticos,
os m edicam entos em pregados e o diagnóstico final. Inúm eras estatísticas e
consta-tações podem ser geradas a partir desses elem entos: incidência e evolução de
doen-ças por faixas etárias, efeitos colaterais de m edicam entos, coincidência de
diagnós-ticos, uso secundário de m edicam entos em pré-diagnósticos incom pletos.
O utros tipos de uso de M IS T R A L podem ser encontrados nos setores m
ilita-res, policiais, nas prefeituras, para cadastrar as m ídias dos m eios de com unicação
(film es, televisão, im prensa), para proteção ao crédito, jurisprudência, etc.
M IS T R A L opera sob G C O S ( G e n e r a l C o m p r e h e n s i v e O p e r a t i n g S y s t e m ) ,
em equipam entos A B C C B U L L .
8 .
INTEGRAÇÃO
COM OUTROS SISTEMAS
M IS T R A L pode tam bém ser integrado a outros s o j t w a r e , com o por exem plo a
S Y M P H O N IE , s o j t w a r e de com posição eletrônica de texto que perm ite a
pagina-ção e a edição dos léxicos, T h e s a u r i e até parte do banco de dados bibliográfico,
em m áquina de fotocom posição.
S Y M P H O N I E pode ser usado tanto em am biente de autom atização de
escritó-rios com o tam bém em jornais, universidades, etc.
M IS T R A L prevê tam bém um a interface com m áquina de fotocópias, m
icrofil-m ageicrofil-m e videodisco.
9 .
REFERÊNCIAS
A lguns exem plos de utilização do M IS T R A L em áreas específicas são m
ateria-lizados pelos bancos de dados:
Q U E S T E L , que reagrupa os principais bancos de dados existentes na F rança
e alguns am ericanos, para perm itir a teleconsulta;
· N O R IA N E , que concerne às norm as francesas e norm as internacionais IS O
de responsabilidade do A F N O R ;
· G C M , que se refere a jurisprudência;
IN P I, que fornece inform ações sobre patentes;
P A S C A L , que reagrupa várias bases científicas m ultidisciplinares do C N R S /
I nform ascience;
C A N C E R N E T , onde são cadastrados os resultados das pesquisas e da luta
contra o câncer;
· E U R IS , que perm ite o acesso às inform ações da C E E (C om unidade E
conô-m ica E uropéia), incluindo docum entos internos, legislação e com ércio entre
os países-m em bros.
10. UTILIZAÇÃO
E xistem inúm eros casos de utilização do M IS T R A L . P elo fato de e s t e s o f t w a r e
m anipular docum entos e perm itir a criação de um banco de dados de textos,
é um a ferram enta poderosa em autom ação de escritórios. _
A s correspondências, norm as, estratégias e táticas da em presa poderão ser
registradas no banco de dados, para perm itir um a consulta im ediata através de
term inais convencionais, de term inais tipo o f f i c e a u t o m a t i o n ou de term inais de
v ideotexto.
P or interm édio da estruturação da referência M IS T R A L ou através de pseudo
palavras-chave será possível reagrupar os docum entos em p a s t a s e l e t r ô n i c a s , perm
i-A b s tr a c t
MISTRAL - S y s te m o f d o c u m e n ta r y r e tr ie v a l
T h e s y s te m o f d o c u m e n ta r y r e tr ie v a l, M IS T R A L , is a n in te g r a te d s y s te m o f a u to m a te d d o c u m e n ta tio n , w h ic h in c lu d e s : r e tr o s p e c tiv e s e a r c h in g , s e le c tiv e d is s e m in a tio n o f
in fo r m a tio n , m a n a g e m e n t o f le x ic a ls a n d te h s a u r i, in te r fa c e fo r v id e o d is k , m ic r o film a n d p h o to c o m p o s itio n m a c h in e s . A llo w s th e o r g a n iz a tio n o f th e m a in d a ta b a s e s in E u r o p e a n d in o th e r p a r ts o f th e w o r ld .