D o c u m e n t a , ã o
e
l i n g i i í s f i c a :
i n t e r - r e l a , ã o
e
c a m p o s
d e p e s q u i s a
zyxwvutsrqponmlkjihgfedcbaZYXWVUTSRQPONMLKJIHGFEDCBA
Johanna
W. Natali
ONMLKJIHGFEDCBA
*
cbaZYXWVUTSRQPONMLKJIHGFEDCBA
G a r d i n , a s L D c o m p õ e m - s e d e u m l é x i c o ( l i s t a d e d e s c r i t o r e s ) , u m a r e d e p a r a d i g m â t i c a ( c l a s s i fi c a ç ã o d o s d e s c r i t o r e s ) e u m a r e d e s i n t a g m á t i c a ( r e l a c i o n a m e n t o e n t r e o s d e s c r i t o r e s ) , p o d e n d o - s e fo r m a l i z á - I a e m t e r m o s d e u m s i n t a g m a m í n i m o , R i (x,y), o n d e R i é u m a r e l a ç ã o b i n á r i a , p a r a d i g m á t i c a o u s i n t a g m â t i c a , ex ey t e r m o s o u d e s c r i t o r e s d o l é x i c o . A a b u n d â n c i a d a s L D p o s s i b i l i t a p e s q u i s a s t a n t o q u a n t o à p a s s a g e m d e L N p a r a a L D , q u a n t o s o b r e a c o m p a t i b i l i d a d e e n t r e a s d i fe r e n t e s L D . A s p r i m e i r a s p a r t e m d o p o s t u l a d o s e g u n d o oq u a l é p o s s í v e l e x p l i c i t a r t o d a s a s r e g r a s q u e s u s t e n t a m a t r a d u ç ã o e n t r e a s d u a s l i n g u a g e n s . A c o m p a t i b i l i d a d e e n t r e a s d i fe r e n t e s L D v e m s e n d o p e s q u i s a d a a p a r t i r d o fo r m a t o d e b a s e d o s i n t a g m a m í n i m o d e G a r d i n , q u e p e r m i t e a a n á l i s e d e e q u i v a l ê n c i a e n t r e d i fe r e n t e s l é x i c o s ; e s t a s p e s q u i s a s t ê m t o m a d o d i r e ç õ e s d i fe r e n t e s , m a s p a r a l e l a s : 1 ) c o n v e r s ã o d e u m o u v á r i o s l é x i c o s e m u m l é x i c o fi x o ; 2 ) c o n s t r u ç ã o d e u m
macrothesaurus, a p a r t i r d o q u a l s e p o s s a d e r i v a r d i fe r e n t e s microthesauri
e s p e c i a l i z a d o s ; 3 )c r i a ç ã o d e u m a l i n g u a g e m d e c o n c o r d â n c i a , d e u m d i c i o n á r i o
i n t e r m e d i á r i o q u e p e r m i t a a c o n c o r d â n c i a e n t r e s i s t e m a s d i fe r e n t e s . A D o c u m e n t a ç ã o , c o n s i d e r a d a p o r m u i t o s c o m o a v a r i a n t e m a i s i n d u s t r i a l i z a d a d a a n á l i s e d e t e x t o , s e r v i r á d e feed-backp a r a a s ' p e s q u i s a s l i n g ü í s t i c a s d a s q u a i s e l a s e a l i m e n t a , e s t i m u l a n d o a m ú t u a c o l a b o r a ç ã o e n t r e a m b a s a s d i s c i p l i n a s . A r e l a ç ã o e n t r e L i n g u i s t i c a e D o c u m e n t a ç ã o s e
e v i d e n c i a n a a n á l i s e d e t e x t o , n a a n á l i s e d e c o n t e ú d o d o s d o c u m e n t o s ( a n á l i s e
d o c u m e n t á r i a ) . A s d u a s d i s c i p l i n a s a t é e n t ã o t r a b a l h a r a m i s o l a d a m e n t e , u m a v e z q u e a s p e s q u i s a s l i n g ü í s t i c a s s e d e s e n v o l v e r a m s o b r e t u d o n o c a m p o d a S i n t a x e . M e s m o a s c o n q u i s t a s s e m i o l ó g i c a s v o l t a d a s p a r a o e x t r a - fr â s i c o ( o " s e n t i d o " ) , n ã o p r o c u r a r a m d e s e n v o l v e r m é t o d o s o p e r a c i o n a i s . A p r á t i c a d a a n á l i s e d o c u m e n t â r i a t e m - s e b a s e a d o e m o p e r a ç õ e s i m p l í c i t a s , c i r c u n s c r i t a s à c u l t u r a i n d i v i d u a l d o i n d e x a d o r . A i n t e r s e c ç ã o e n t r e a s d i s c i p l i n a s s u r g i u d a s t e n t a t i v a s d e s i s t e m a t i z a r a s r e l a ç õ e s e n t r e a L i n g u a g e m N a t u r a l ( L N ) e a L i n g u a g e m D o c u m e n t a r i a ( L D ) . S e g u n d o
•
'~~l
• Bacharel em Biblioteconomia pela ECA/USP.
Mestre em Biblioteconomia pela Universidade de
Paris, Sorbonne Nouvelle.
,
,
Johanna W. Natali
Introdução
voltadas para o extra-frásnco,
o
"sen-tido"
e/ou
a organização
total
dos
Constatemos
em primeiro lugar o
enunciados,
não chegaram
ou talvez
óbvio: a possibilidade de reduzir a um
nao
tenham
procurado
desenvolver
único denominador
comum, no cam-
métodos operacionais em grande
esca-po múltiplo de disciplinas das ciências
Ia
2.humanas, a necessidade de se operar a
2) a prática dacbaZYXWVUTSRQPONMLKJIHGFEDCBA
a n á l i s e d o c u m e n-análise de textos textos naturais, ten-
t â r i abaseou-se muito tempo em
ope-do em vista
x , you z. Para que as
rações implícitas, circunscritas à
"cul-coisas fiquem mais claras, substitua-se
tura"
individual do indexador
(inde-x , y o u Z
por conteúdos dos mitos dos
xação manual). Somente com a
desen-índios das tribos do alto Xingú (ou
freada explosão de informações
cien-seja, a análise mitológica ou etnológi-
tíficas que assistimos hoje -
a uma
cal, o conteúdo semântico de questio-
taxa que alguns afirmam ser
provavel-nários:
não
diretivos
(a análise
de
mente de 12,5%
ao ano, ou na pior
conteúdo
dos sociólogos), análise de
das hipóteses uma duplicação no
pe-um romance ou de pe-um poema (análise
ríodo de uma década"
-
fez-se sentir
literária ou poética), ou a extração
e
a necessidade de uma documentação
organização
de conceitos -
ou
a n â l i -"industrial"
e autornatizada,
surgindo
s e d o c u m e n t á r i a ) .Há evidentemente
assim
o imperativo
da explicitação
uma disciplina que tem por objeto a
das operações de indexação
anterior-análise dos textos em linguagem natu-
mente implícitas. Para citar um
exem-ral, tendo em vista os próprios textos.
plo, a definição de sinônimos sempre
Trata-se
da lingüística. A vizinhança
constituiu uma operação
de primeiro
entre a lingüística
e a análise doeu-
plano em qualquer indexação. Mas se
mentária,
aqui privilegiada apesar de
antes era possível efetuá-Ia
"manual-não se poder desprezar seu paralelis-
mente"
(pela consulta de dicionários,
mo com outras práticas de análises de
t h e s a u r i ,ou com base na cultura do
textos,
constitui,
desta
forma,
algo
indexador),
a necessidade de
automa-que ultrapassa
o "jeitinho"
retórico
tizar a indexação corresponde à
previ-que torna
possível qualquer
parale-
são de uma abundância
de
mecanis-lismo.
mos, sobretudo
de ordem lingüística,
A vizinhança entre a lingüística e
que façam o computador
associar
si-a documentsi-ação,
apesar de evidente anônimos,
desassociar
homógrafos
e
partir de um certo nível de abstração,
assim por diante.
é, porém, menos explorada do que se
Assim, pode-se dizer que a
lin-poderia esperar. Os trabalhos de sín-
güística tornou-se
fundamental
para
tese, salvo
algumas
honrosas
exce-
uma documentação
auto matizada
\
ções, ainda não foram efetuados. Esta
embora
ela tenha ao mesmo tempo
contradição
aparente
se justifica por
enveredado,
l a t o s e n s u ,por direções
duas razões complementares:
de pesquisas
menos "utilizáveis"
de
1)as pesquisas
l i n g ü í s t i c a sdesen-
imediato numa perspectiva
documen-volveram-se primordialmente
até ago-
tária.ra no campo da sintaxe, cujo interesse
Vejamos, agora, mais
detalhada-é importante mas não suficiente numa
mente, qual a situação atual da
doeu-perspectiva
documentária
1;por sua
mentação e, de forma um pouco mais
vez, as pesquisas
s e r n i o l á g i c a s ,mais
sumária, a da lingüística que os doeu-DCBA
3 4 R. bras. Bibliotecon. Doe. 11(112):33-42, jan./jun. 1978
Documentação e Linguística: inter-relação e campos de pesquisa ,
11• 1
segundo as matrizes pertinentes
para, ,',
o sistema.
Dá-se
prioridade,
por-jexemplo, à forma estandardizada
co-.
ONMLKJIHGFEDCBA
I:,mo entrada
ao sistema ou então aos',
I,documentos
que, como entrada,
tor- ,\
narão
atributiva
a forma estandardi-,
~
zada.
'I 'Por último, o
u s u á r i odo sistema'
,1de informação
fechará o esquema, na
I Imedida em que, a partir das respostas
,i'
obtidas
às perguntas
formuladas,
os;' ;
processos
de
fe e d - b a c kpoderão
ser
i \idealizados
e postos em prática.
:
IA evolução dos sistemas de infor-
i,Imação, como se sabe, implicou de um
iponto de vista histórico numa gradati-
iva complexidade:
aumento do núme-
Iro de etapas e complicação
crescente
iA n á lis e U tiliz a ç ã o "
A q u is iç ã o
-
~ ~ d o c u m e n tá r ia : • ~ ~ P r o c e s s a m e n to!-4~
d a d e d a d o -I
tr a d u ç ã o L N - L D
I
I
I
In fo r m a ç ã o ; Amentalistas poderiam utilizar. Este
pa-ralelo procura
recensear informações
que permitam, no futuro, uma melhor
coleta de dados para prever uma
inter-relação
mais
estreita
entre
os dois
campos.
Situação
atual
da Documentação
Para melhor situar os diferentes
problemas
documentários
a serem
aqui expostos, e igualmente para
con-textualizar a terminologia que
empre-garemos,
vale a pena
relembrar
de
início o esquema básico, proposto por
C. Montgomery,
que representa
em
parte ou no todo os sistemas de
infor-maçâo'':
r---')
t
, 'I
Neste esquema, a
a q u i s i ç ã odos
dados significa a seleção de
documen-tos em linguagem natural (por
exem-plo, a literatura
científica), e a
intro-dução de tais dados no sistema.
A
a n á l i s etem
por
objetivo
o
isolamento dos "conteúdos"
-
julga-dos pertinentes
pelo sistema -
e a
seguir a representação
destes mesmos
"conteúdos"
numa forma
e s t a n d a r d i -z a d a(por exemplo: descritores,
pala-vras-chave
ou códigos numéricos)
e
u n í v o c a :
a tradução
da linguagem
natural (LN) em linguagem
documen-tária(LD).
Esta tradução
constitui a
"indexação" .
Na
etapa
seguinte,
opera-se
o
p r o c e s s a m e n t o
das formas
estandardi-zadas,
organizando
as informações
••
- -- ---..,
I
I
: \
:\
de cada uma delas. Assim, os sistemas
,Iprecursores
e, portanto,
os mais
sim-ples, não dispunham de nenhuma
tra-dução".
São os métodos de tabulação
geralmente
conhecidos
como índices
de concordância,
entre
os quais
o
sistema KWIC é o mais divulgado. Os
métodos
de tabulação
apresentam
dois problemas principais: a
s e l e ç ã oe
a
o r g a n i z a ç ã odas informações. A
se-leção consiste na distinção, nos textos
em linguagem natural
(LN), entre as
unidades consideradas
significativas e
as não
significativas;
estas
últimascompõem
o antidicionário.
E fácil
orga-Johanna W. Natali'
,JI!Lzação das informações, os índices No entanto, a relação de inclusão
ONMLKJIHGFEDCBA
JIrssim compostos geralmente seguem a simples, característica comum a todas
rdem alfabética, o que constitui no as classificações, já não ocupa mais áximo uma herança extremamente hoje em dia uma posição de destaque rcaica e primitiva da lingüística. Ine- nas discussões da lingüística ou da iste assim, neste estágio da análise lógica modernas.
ocumentária, uma interação
signifi-
Na segunda das etapas, surgem ativa entre a lingüística e a documen- as tentativas de sistematização da re-ação. lação entre a LN e a LD, sobretudocom as discussões sobre os
cbaZYXWVUTSRQPONMLKJIHGFEDCBA
t h e s a u r i .Neste quadro, a problemática consiste em entender melhor o valor das ope-rações básicas dos t h e s a u r i , isto é, as equivalências e remissivas':
Vieram, a seguir, os sistemas de informação com tradução, provenien-tes tanto da consciência da especifici-dade da linguagem natural (seu cará-ter ambíguo e repetitivo havia gerado índices muito carregados, longos e conseqüentemente pouco econômi-cos), quanto dos objetivos peculiares da documentação (recuperação da i n
-fo r m a ç ã o e não de palavras em LN).
A tradução da LN em LD passou, desta forma, a ter como corolário a operação de recuperação da informa-ção:
LN
LD
LN
LN
LD
=
thesaurusX
(=)
~a
y
~b
para z use a
indexação recuperação da
informação
Esta concepção do momento cen-tral de todo sistema de informação, ou seja, a tradução da LN em LD e vice-versa, foi o fruto de diferentes etapas de discussão. Na primeira delas, de-;envolveram-se' as próprias LD, con-ceituando-se as diversas classificações pelas quais são as "palavras" e não as . "coisas" que se organizam entre si.
DCBA
3 6
o
progresso alcançado na época não deixou de ser importante. Não se deve, porém, supervalorizar a base lingüística dos primeiros t h e s a u r i ; eles se fundamentam numa acepção bas-tante fluida dos campos semânticos, sem explicitar a maneira pela qual importaram tais instrumentos da lin-güística. Os t h e s a u r i permitiram, no entanto, um avanço real no caminho de uma interseção das disciplinas Lin-güística e Documentação, já que pos-sibilitaram o aprofundamento da no-ção de LD. Assim, na acepção atual das LD segundo Gardin", elas se com-põem de:um léxico (a lista de termos-desçritores, já filtrados e
purifi-. c a d o s depois de extraídos da
L N ) ;
R. bras. Bibliotecon. Doe. 1 1 ( 1 1 2 ) : 3 3 - 4 2 , jan.ljun. 1.~
Documentação e Linguística: inter-relaçâo e campos de pesquisa I
uma rede paradigmática (ou criado questões em torno das quais si ,'j
seja, uma organização dos ter- situam as atuais pesquisas docurnerr ~' mos do léxico, naquilo que se- tárias: ' 1
ria, l a t o s e n s u , uma classifica- a) a passagem da LN para a LD; ( I
ção); d' , .
li
b)
a compabilibidade entre dife' \' uma re e sinragmanca (lista rente LD. ' organizada ou não de relaçõesque podem ser determinadas
entre os termos retidos no mo- A) A p a s s a g e m d a L N p a r a a L D I !
mento da indexação, a fim de Ii'
reproduzir a informação sin- A relação que se estabelece inevi- l'I
tagmática transmitida pelos tavelmente entre as duas linguagens I.
textos analisados. A rede sin- (análoga à relação estabelecida na' \ tagmática não está presente em tradução de um idioma para outro) f. \
todas as LD, sendo uma cara c- geralmente vaga e implícita. Quando \. terística exclusiva das mais de- se decide uma eventual explicitação senvolvidas). . dos mecanismos de passagem de uma' l
Ainda segundo Gardin, de cinco a outra, acaba-se caindo num sistema: ou seis anos para cá tornou-se corren- pesado ao extremo e de dimensões I,
te a formalização das LD em termos inverossímeis. " de um sintagma mínimo - Ri (x,y) As pesquisas, a nosso ver, fasci- " onde Ri corresponde a uma relação nantes e muito promissoras neste I
binária paradigmática ou sintagrnáti- campo, partem de um postulado ini- \ ca, e x e
y
a termos de léxico. cial segundo o qual é possível explici- \ Tal sintagma possui ao menos tar as regras ( t o d a s as regras) de'Iduas vantagens. De um lado, restitui a passagem de uma LN a uma certa LD.' \ igualdade formal entre as relações A preocupação manifestada' por paradigmáticas e sintagmáticas (ne- estas pesquisas não representa uma nhuma das duas é privilegiada em novidade destinada a elites entedia-detrimento da outra), e, de outro, ao das, mas sim uma necessidade de' reduzir toda relação entre termos a sujeitar um processo de traduções e de uma relação binária, deixa-se a porta seleções que em grande parte fugia ao I
aberta para o estabelecimento de rela- controle destas mesmas elites. Não é , ções mais complexas (n termos) que mais suficiente constatar os, efeitos da : poderão ser em seguida decompostas passagem da LN à LD. E também: em relações binárias, reportando-se, preciso saber como a passagem se' assim, à operações lógicas perfeita- operou e quais são os mecanismos: mente domináveis. lógico-semânticos que a
possibilita-A definição dos constituintes das ram, a fim de permitir a escolha dos I
LD e de suas interrelações representa mecanismos mais econômicos.
ultimamente, sem dúvida alguma, o Evidentemente, é a partir desta campo mais trabalhado pela pesquisa mesma preocupação documentária documentária. Se há uma abundância que a conexão com a lingüística se de LD, o fenômeno é por um lado mostrou abertamente pela primeira positivo por nos liberar do monopólio vez há alguns anos. Se procuramos I das classificações universais, sendo ao formalizar a análise documentária (ou I
mesmo tempo problemático por ter seja, explicitar totalmente a passagem
Johanna W. Natali
N-LD), devemos saber como extrair 2)
cbaZYXWVUTSRQPONMLKJIHGFEDCBA
C o n s t r u ç ã o d e m a c r o e m i c r os "sentidos" pertinentes de um texto t h e s a u r i : concebe-se um m a c r o t h e s a u
-em LN e portanto, igualmente, como r u s que corresponde a um grande
analisá-Io. serviço de informação, e que seja
portanto relativamente geral mesmo
B) A c o m p a t i b i l i d a d e e n t r e d i fe r e n t e ! se restrito a um único assunto. A
LD
partir deste m a c r o t h e s a t t r u s ,cons-Outro campo de pesquisa, atual- troem-se diferentes m ic r o t h e s a u r i ,
es-mente frutífero, diz respeito às rela-· pecializando a informação contida no
ções entre as diferentes LD. Tais estu- m a c r o t h e s a u r u s e que sempre man-dos partem freqüentemente do forma- têm, entre si, sob a forma de "ponte"
.,to de base do sintagma mínimo defini- assegurando a passagem de um ao
do por Gardin (Ri (X,y)),o que permite outro, a estrutura geral do próprio
a análise de equivalências entre dife- m a c r o t h e s a u r i , Esta alternativa, para
rente léxicos, com o propósito de tornar compatíveis diferentes LD (os
fundamentar a compatibilidade possí- m i c r o t h e s a u r i ) , deve também
funda-vel entre eles. Esta compatibilidade mentm--se nos últimos progressos
lin-facilita o intercâmbio de informações güísticos se quisermos que o
investi-entre centros de documentação, preo- m~nto de criação de m a c r o t h e s a u r u s e cupando , por esta razão, os grandes m i c r o t b e s a u n correspondentes tenha
centros nacionais de documentação um sentido prático, especialmente no
que incorporam freqüentemente redes que se refere à definição dos campos
nacionais e/ou internacionais; Neste semânticos de cada conceito e à
orga-campo de pesquisas, três direções são nização vertical e horizontal que eles
hoje desenvolvidas de maneira parale- obedecem. Esta fórmula obteve um
Ia. Sumariamente: bom sucesso ultimamente e levou à
1 ) C o n v e r s ã o : converte-se um ou constituição, por exemplo, de um
vários léxicos em um léxico considera- m a c r o t h e s a u r u s na União Soviética
do fixo. A fusão de vocabulários as- para as informações sobre o
COME-sim operada é rentável a pesar de não CO~, de um m a c r o t h e s a u r u s em
eco-oferecer jamais soluções globais, na no mia para o Mercado Comum
Euro-medida em que trata o problema da p,eu,. um m a c r o t h e s a u r u s de ciências e
diversidade de léxicos de forma pon- tecmcas na França, a s~r publicado em
tual, em relação a um único léxico breve, e aSSIm por diante,
fixo. Para se chegar a desenvolver 3) C r i a ç ã o d e u m a l i n g u a g e m d e
algoritmos de conversão automática, c o n c o r d â n c i a : considerada como a
so-em que o computador tenha por fun- lução mais elegante para o
estabeleci-ção o reconhecimento de palavras mento de pontos de contato entre as
idênticas, de palavras variantes (orto- diferentes LD, trata-se da criação de
gráficas), de inversões entre palavras um dicionário intermediário no qual
de uma mesma expressão e equivalên- um complicado sistema de notações
cias entre sinônimos, é evidente que os faz com que o conceito de um sistema
programas não se basearão apenas documentário possa ser transformado
numa lingüística geral, mas muito em seu equivalente _ ou equivalentes
mais na escolha de uma certa escola - em outro sistema documentário. O
lingüística, nas últimas pesquisas des- dicionário intermediário, que permite
ta escola, e assim por diante. a concordância entre sistemas, possui
DCBA
3 8 · · R. bras. Bibliotecon. Doe. 11(1/2):33-42, jan.ljun. 1978
' : ' 1 2
ONMLKJIHGFEDCBA
"l
Documentação e Linguística: inter-relação e campos de pesquisa
um imenso mérito: ele é independente perfeitamente inoperacional num con- "
da estrutura dos vocabulários em texto de recuperação da informação. :
questão. Este simples dado faz com Chega-se, assim, a partir de uma sele- ;
que as linguagens de concordância ção que te~ JCor fim a operacionali~a.- .
sejam geralmente encaradas como a de, a uma visao chamada"
demogrâfi-
.1solução do futuro, por serem bem c a " do texto. O texto da documenta- .
mais maleáveis que as alternativas ção é um texto-superfície; o documen- I
precedentes e, ao mesmo tempo, por ta lista deve portanto ignorar, de
pro-constituírem a solução que implica na pósito, tudo aquilo que a superfície
maior inter-relação com a lingüística, pode esconder, tudo aquilo que a
a semântica e a lógica, especialmente ultrapassa 11.
quanto à delimitação de traços distin- Neste quadro, a lingüística por
tivos dos conceitos para o estabeleci- nós considerada operacional em
rela-mento das correspondências semânti- ção aos problemas de indexação e de
cas (operação-alicerce da notação do recuperação da informação é,
tradi-dicionário). cionalmente, a anglo-americana:
ini-cialmente o distribucionalismo de
Harris, mais tarde a semântica
genera-tiva de Chomsky, Katz e Postal, e,
finalmente, por ora, o transforma
cio-nalismo de FilImore,
Lakoff,McCaw-ley e Bach.
Não pretendemos abordar a
lin
Grosso modo, a análisedoeu-güística moderna em detalhes por não mentária acompanhou a evolução
his-se tratar de nosso campo de compe- tórica de uma certa lingüística,
dosan-tência. Convém, no entanto, levantar- do-a freqüentemente com um
comple-mos certos problemas de peso, como, mento considerado menos nobre mas
por exemplo, o fato de a expressão todavia eficiente: a análise estatística.
.geral. "lingüística" não significar uma Caricaturando, pode-se aventar UIl)
única alternativa metodológica. Em sistema de análise documentária no
verdade, elas são inúmeras. Isto nos qual se comece, por exemplo, a
análi-leva à escolha das e s c o l a s , o que é, a se (automática) de um texto em LN
nosso ver, inevitável, sendo ao mesmo pela extração, por critérios
lingüísti-tempo essencial nunca se perder de co-sintáticos, de todos os substantivos
vista que esta escolha foi operada. A do texto em questão. A seguir,
proce-primeira das escolhas é ditada pelos de-se à contagem estatística da
fre-imperativos práticos da documenta- qüência de cada substantivo e
decide-ção, que nos fixa a necessidade de se - levando esta caricatura meio
sermos o p e r a c i o n a i s . Para tanto, im- pejorativa às últimas conseqüências
põe-se uma visão simplificadora da - que os 30 substantivos mais
fre-linguagem; abstraem-se proposital- qüentes indicam os assuntos mais
im-mente certos conceitos que ela desen- portantes do texto. Caricatura?
Certa-volve, o mesmo valendo para a se- mente, apesar de o apelo à estatística,
mântica e semiologia atuais. Um úni- quando efetuado com sutileza, ser
co exemplo justifica tal abstração: o corrente nos sistemas documentários
conceito de i n t e r t e x t o , fértil em diver- altamente automatizados. E isto por
sos pontos, é, ao menos por enquanto, razões perfeitamente nobres: devido à
R. bras. Bibliotecon. Doe. 11(1/2):33-42, jan.ljun. 1978 3 9
S i t u a s ã o a t u a l d a L i n g ü í s t i c a
e m s u a s f a c e t a s p e r t i n e n t e s
à D o c u m e n t a s ã o .
tJ
~
Johanna W. Natali
massa imensa de informações a ser gressos, não pode ocultar um último
. tratada, a estatística (por cálculos de aspecto da inter-relação possível, ou
. freqüência e de Co-ocorrência, na seja, o do percurso inverso ao aqui
maior parte dos casos) corresponde a percorrido: em lugar da lingüística
ONMLKJIHGFEDCBA
àum atalho válido para a diminuição documentação, da documentação
à
do custo dos sistemas documentários. lingüística. Se, por definição, a
doeu-O
problema reside essencialmente no mentação trata grandes quantidadestipo de análise lingüística escolhida, de informações em grandes sistemas
predominantemente sintática, como voltados para a eficiência, a
lingüísti-no exemplo anterior, ou prioritaria- ca avança habitualmente por tenta
ti-mente semântica, segundo uma tradi- vas e erros, num processo em que cada
ção
mais francesa, ou na justaposição pequeno exemplo pode ser invalidadode ambas. Citemos ainda entre as por outro. Veja-se o caso protótipo da
Opções disponíveis a intrução ou não validação de uma regra
transforma-da estatística, quais os critérios esta- cionalista. Encontramo-nos diante de
tísticos retidos, a ordem seguida pelas algo semelhante à fábula do elefante
operações para definir se a estatística da formiga. Mas, ao invés de
cami-intervirá no início ou no final, etc. nhos paralelos, onde o
elefante-Delineia-se, assim, mais um cam- documentação acaba importando
da-po de pesquisas em documentação. dos desenvolvidos com Suor e
lágri-[Nele, a dosagem e a ordenação das mas pela formiga-lingüística, a
cola-análises sintática, semântica e esrarís- boração entre ambas poderia ser mais
tica constitui a preocupação principal. dinâmica. E isto na medida em que se
Apesar de nos ser praticamente im- conceba a máquina documentária
co-possível prever de que maneira esta mo um meio de validação das
opera-problemática se definirá no futuro (a ções lingüísticas, através da aplicação
supor, o que é meio duvidoso, que destas operações a um grande número
uma única solução seja retida), as de exemplos, e sobretudo pela
obses-tendências que se demarcam nitida- são documentária de eficiência. A
do-mente dizem respeito à predominân- cumentação, considerada por muitos
cia de critérios sintáticos ou semânti- como a variante mais industrializada
cos na análise documentária autorná- da análise de textos, serviria assim de
tica, numa discussão em que a análise
cbaZYXWVUTSRQPONMLKJIHGFEDCBA
fe e d - b a c k para as pesquisaslingüísti-estatística surge num plano secun- cas das quais ela novamente se
ali-dário. mentaria. Por esta razão, a
documen-talista C. Montgomery conclui em seu
artigo aqui citado que, em
documen-tação e lingüística, cada campo
che-gou ao máximo sem o auxílio do
outro, e que doravante a cooperação
mútua se torna um imperativo.
Este borbulhar de opiniões e
ten-tativas por parte dos documentalistas,
apesar de extremamente positivo e
importante para a própria
documen-tação, caucionando prováveis
pro-N O T A S
(1) Refiro-me, como veremos mais adiante, à mente, enorme importância neste quadro, lingüística de tradição anglo-americana, por mais que a prioridade dada à estrutura considerada mais próxima das preocupa- sin.a: ica (a introdução da semântica eferi-ções documentárias. O generativismo e o va-se num segundo momento) dificulte sua transformacionalismo adquirem, especial- a plicação à problemática documentária.
DCBA
4 0 R. bras. Bibliotecon. Doc. 11(112):33-42, jan./jun. 1978
BIBLIOGRAFIA CONSULTADA
ARTANDI, S. Machine indexing: linguistic and semiotic implications. [ o u r n a l o f t h e A m e r i c a n S o c i e t y fo r l n fo r m a t i o n s S c i e n c e , Washington, D.e., 27 (4): 235-239, JuIlA-go 1976.
BELY, N. et alii. P r o c é d u r e s d ' a n a l y s e s é m a n -t i q u e a p p l i q u é s s à I a d o c u m e n t a t i o n s c i e n t i -fi q u e . Paris, Gauthier- Villars, 1970. ANDERLA, G. L ' i n fo r m a t i o n e n 1985: u n e
é t u d e p r é v i s i o n n e l l e d e s b e s o i n s e t d e s r e s -s o u r c e -s . Paris, OCDE, 1973.
R. bras. Bibliotecon. Doc. 11(1/2):33-42, jan./jun. 1978 Documentação e Linguística:
Neste panorama, vale ressaltar a tentativa _ teórica ao que nos consta - de Hutchins para inverter esta situação, gerando estru-. ruras sintáticas a partir de uma base semân-tica (a estrutura semânsemân-tica é habitualmente considerada prioritária em documentação).
(2) Veja-se, por exemplo, as "inovações" es-sencialmente taxinômicas (ou seja, de clas-sificação do dito signo lingüístico) que prevaleceram nas propostas do I Congresso Internacional de Semiologia (Milão, 1974), onde os verdadeiros progressos metodoló-gicos transbordaram a área de pertinência semiológica para se originarem em campos - como a lógica e a psicanálise - que lhes são exteriores.
(3) Quanto ao aumento anual do número de artigos científicos, ver Anderla, p. 131.
(4) Vale a pena lembrar que é inútil tornar privilégio, em si, a documentação autornati-zada em relação à documentação "ma-nual". A passagem de uma à outra não corresponde a um. progresso, mas simples-mente a uma resposta justificada pelos imperativos de ordem quantitativa, aos qr.ais a documentação atual se expõe.
(5) Montgomery, p. 196.
(6) Gostaríamos de sublinhar mais uma vez que a "simplicidade" dos primeiros siste-mas de informação não comporta qualquer julgamento de valor. A palavra "simplicida-de" só tem sentido em relação a sistemas mais complexos.
(7) Deixemos de lado toda a problemática da organização hierárquica dos textos do t b e -s a u r u -s ~ o que nos levaria novamente às discussões sobre as classificações - e so-bretudo o nível hierárquico ao qual certo termo em LN é associado.
(8) Gardin, p.147-9.
AGRESTI, H. S u r l e s m é t h o d e s d e C. L é u i -S t r a u s s d a n s l e s " M y t h o l o g i q u e s " ,
Aix-en-Provence, Université de Provence (Aix-Lettres), 1972. Tese de doutoramento.
inter-relação e campos de pesquisa
(9) Basta citar o seríssimo exemplo de um
mecanismo de uma análise documentária totalmente explicitada e da aridez das expli-citações à qual conduz, inevitavelmente, esta preocupação: Bely et alii. Por outro lado, aceitando-se certas análises de textos por mecanismos implicítos como fatos con-sumados, o caminho inverso; ou seja, a tentativa de reconstituição dos mecanismos que levaram dos textos aos comentários, é bem mais trabalhoso, evidenciando a com-plexidade das operações de transformação operadas sobre os textos originais. Veja-se Agresti e Natali.
'~ 11'
'I
(10) Deixamos de abordar voluntariamente, nesta problemática, outro campo igualmen-te fundamental de pesquisas comparativas entre LD, que visam à medida dos desempe-nhos de cada sistema documentário através das medidas de ruído, pertinência e custo da recuperação da informação, e ainda a comparação dos resultados obtidos em di-ferentes sistemas documentários e a condu-são relativa à eficiência de cada um. Num segundo momento, estes estudos - quando associados a discussões sobre as bases lin-güísticas das LD - passarão a fornecer dados capitais para a confirmação ou a infirmação de hipóteses sobre as LD de melhor ou pior desempenho. Os estudos de avaliação das LD foram sobretudo desen-volvidos por Cleverdon, na Universidade de Cranfield, EUA.
\ 1 1 ) É muito difícil prever em que medida esta situação continuará inalterada, tanto pela imprevisibilidade das direções a serem se-guidas pela pesquisa semiológica (hojea p a
rentemente distante das preocupações do .. cumentárias), como igualmente pela falta de dados para saber até que ponto a própria documentação encontrará meios ou razões para expandir sua visão dos textos em L~, que é por enquanto relativamente simples.
Johanna W. Natali
COY AUD, M.
cbaZYXWVUTSRQPONMLKJIHGFEDCBA
L i n g u i s t i q u e e t d o c u m e n t a t i o n : MONTGOMERY, C.A. Linguistcs and infor-l e s a r t i c u infor-l a t i o n s l o g i q u e s d u d i s c o u r s . Paris, mation science. [ o u r n a l o f t h e A m e r i c a n Larouse, 1972. S o c i e t y fo r l n fo r m a t i o n S c i e n c e , Washing-ton, D.C., 23 (3); 195-219, May/jun 1972.NATALI, ].W. D e L ' a n a l y s e d o c u m e n t a i r e à l ' a n a l y s e p o é t i q u e : à p r o p o s d e s c r i t i q u e s d e s " C h a t s " d e B a u d e l a i r e . Paris, Ecole des Hautes Etudes en Sicences Sociales, 1976. Tese de doutoramento.
WOLFF-TERROINE, M. La classification au-tomatique. Son utilisation dans Ia science de I'information. D o c u m e n t a l i s t e , Paris, 9 (1): 21-24, mars 1972.
COYAUD, M & SIOT-DECAUVILLE, N. L ' a n a l y s e a u t o m a t i q u e d e s d o c u m e n t s . Pa-ris, Mouton, 1967.
GARDIN, j.C, Document analysis anda Iin-guistic theory. [ o u r n a l o f D o c u m e n t i o n , London, 29 (2): 137-168, Jun. 1973
HUTCHINS, W.J. T h e g e n e r a t i o n o f s y n t a c t i c s t r u c t u r e s fr o m a s e m a n t i c b a s e . Amster-dam, North-Holland, 1971.