• Nenhum resultado encontrado

Escolha e adaptação da LCSH à realidade da BUJPII

No documento Diss mestrado Adelaide (páginas 88-92)

Capítulo 2 – AS LINGUAGENS DOCUMENTAIS

3.2 Escolha e adaptação da LCSH à realidade da BUJPII

There is a singular lack of vocabulary control in the field of controlled vocabularies.

Bella Hass Weinberg

Linguagem de indexação é uma linguagem usada para classificação por assunto ou indexação de documentos. As linguagens de indexação podem dividir-se em sistemas de classificação e linguagens de indexação verbal.

Um vocabulário controlado é um exemplo dum sistema de indexação verbal. Os vocabulários controlados podem ser pré-coordenados ou pós-coordenados. Nos sistemas de indexação pré-coordenada a combinação dos termos é feita por quem indexa na altura da indexação. Nos sistemas de indexação pós-coordenada, a combinação não é feita durante a indexação do documento mas sim quando a pesquisa é feita.

Universidade Lusófona de Humanidades e Tecnologias, ECATI – Departamento de Ciências da Comunicação

87

A característica mais importante duma linguagem de indexação reside no facto de se usar um sistema de indexação pré-estabelecido (pré-coordenação) ou não. Se se usar um sistema pré-estabelecido a propriedade mais importante a ter em conta é se os conceitos ou as classes reflectem as necessidades da unidade, se traduzem adequadamente o assunto a ser indexado e se o nível de especificidade é o adequado.46

Especificidade refere-se à exactidão com que o termo da linguagem de indexação abrange um conceito. Quanto mais elevado for o grau de especificidade maior a precisão e menor a revocação. Precisão refere-se numa pesquisa ao número de unidades relevantes divididas pelo número total de unidades obtidas na pesquisa. Revocação refere-se ao número de items relevantes obtidos numa pesquisa divididos pelo número total de items relevantes existentes na colecção.

Outro conceito importante num vocabulário controlado é o que diz respeito à exaustividade, se os termos do vocabulário abrangem todos os conceitos incluídos no conteúdo a ser tratado, ou seja, o detalhe com que o documento é descrito, então a linguagem é exaustiva. A baixa exaustividade pode ser sinónimo de perda de informação acerca de um documento. Em termos gerais quanto mais elevada for a exaustividade maior o número de termos com que cada documento é indexado.47

Com excepção dos tesauros, as linguagens de indexação verbal em uso na BUJPII – teologia e economia – são em primeiro lugar traduções e mapeamentos de sistemas de classificação de que resultam listas de cabeçalhos de assunto. Perante esta realidade, decidiu-se então que sendo a CDU a linguagem documental de base e em uso na BUJPII, comum a todas as áreas e tendo já um antecedente de adaptação para a área de teologia, se seguiriam os mesmos passos, desta vez não fundamentados nos enunciados da CDU, como foi o caso para Teologia, mas sim numa linguagem de indexação verbal mais abrangente como é o caso dos cabeçalhos de assunto da Biblioteca do Congresso.

46 HJØRLAND, Birger – Indexing languages [Em linha]. 2006. [Consult. 12 Fev. 2013]. Disponível em

http://www.iva.dk/bh/lifeboat_ko/CONCEPTS/indexing_languages.htm

47

LEISE, Fred ; FAST, Karl – Controlled vocabularies : a glosso-thesaurus [Em linha]. 2003. [Consult. 12 Fev. 2013]. Disponível em http://boxesandarrows.com/controlled-vocabularies-a-glosso-thesaurus/#exhaustivity

Universidade Lusófona de Humanidades e Tecnologias, ECATI – Departamento de Ciências da Comunicação

88

São várias as razões para a sua adopção: é a linguagem de indexação mais usada a nível mundial tanto em pequenas como em grandes bibliotecas e tem servido como modelo para o desenvolvimento de vocabulário controlado em bibliotecas de vários países.

David Bade diz que o estabelecimento da relevância dum assunto se baseia numa interpretação, que nem a pesquisa por palavra-chave, nem a relevância de assunto apresentada pela pesquisa Google (motor de busca da web baseado em pesquisas com palavras- chave) pode desenvolver, porque nunca nenhuma máquina interpreta ou julga e a história da ciência é a história do vocabulário controlado. Não há técnicas que possam substituir a interpretação e julgamento humano expresso na criação dos cabeçalhos de assunto. Além de que a ambiguidade do assunto descontextualizado é eliminada em grande parte com a contextualização obtida com a sintaxe dum vocabulário controlado pré- coordenado de que a lista de cabeçalhos de assunto da Biblioteca do Congresso é um exemplo.48

De acordo com Chan49 o sistema pré-coordenado da LCSH para além das inúmeras vantagens já acima referidas, também apresenta desvantagens, é um sistema complicado. A pré-coordenação requer indexação manual feita por catalogadores que têm de estabelecer cabeçalhos de assunto com base em regras muito complexas e muito elaboradas. É longo o seu tempo de treino. É também dispendiosa a manutenção e verificação da linguagem. Como a sintaxe tem de ser respeitada, a linguagem torna-se pouco flexível. Recomenda-se entre outras medidas, a simplificação das regras de sintaxe para a construção dos cabeçalhos de assunto.

Thomas Mann50 por sua vez argumenta a favor da importância da complexidade da pré-coordenação da LCSH. Diz ele que a complexidade é muitas vezes necessária para

48 BADE, David - Structures, standards, and the people who make them meaningful [Em linha]. [Consult. 14

Fev. 2013]. Disponível em http://www.loc.gov/bibliographic-future/meetings/docs/bade-may9-2007.pdf

49 CHAN, Lois M. – Thoughts on LCSH : appendix 1. In Library of Congress Subject Headings : pre- vs. post-

coordination and related issues [Em linha]. 2007. [Consult. 14 Fev. 2013]. Disponível em http://www.loc.gov/catdir/cpso/pre_vs_post.pdf

50 MANN, Thomas - Is precoordination unnecessary in LCSH? Are web sites more important to catalog than

books? A reference librarian’s thoughts on the future of bibliographic control [Em linha]. [Consult.14 Fev. 2013]. Disponível em http://www.loc.gov/catdir/bibcontrol/mann_paper.pdf

Universidade Lusófona de Humanidades e Tecnologias, ECATI – Departamento de Ciências da Comunicação

89

levar a cabo certos trabalhos mais pesados e é com esse poder de acesso ao conteúdo das colecções que se consegue localizar e recuperar a informação. Nem todos os investigadores vão usar todo o potencial de pesquisa em resposta a todas as necessidades de informação, mas é fundamental a manutenção de todas as capacidades do sistema para responder às situações frequentes e imprevisíveis que possam acontecer. Questões aparentemente e inicialmente muito simples podem de repente transformar-se em pesquisas que requerem todas as potencialidades do sistema para serem resolvidas. Os profissionais da informação devem ser capazes de se orientar com eficiência na rede de relações, inter-relações e ligações da colecção, é necessário que se forneça o acesso ao conhecimento em vez do acesso à simples informação, caso contrário, corre-se o risco de se ser substituído por máquinas.

A capacidade automatizada de indexação e recuperação da informação em sistemas como o Google ou Amazon.com fica muito aquém quando comparado com o potencial presente na indexação com cabeçalhos de assunto num bom catálogo de biblioteca e dá o exemplo do seu próprio livro The Oxford Guide to Library Research, em que o Amazon.com, aconselha na sua crítica literária à obra em questão, que os leitores interessados neste autor poderão estar também interessados em obras semelhantes de autores como Franz Kafka, Herman Hesse, André Gide, Feodor Dostoevsky.

Universidade Lusófona de Humanidades e Tecnologias, ECATI – Departamento de Ciências da Comunicação

90

Capítulo 4 – METODOLOGIA SEGUIDA PARA O DESENVOLVIMENTO DE

No documento Diss mestrado Adelaide (páginas 88-92)