• Nenhum resultado encontrado

Ao longo deste trabalho o termo recuperação da informação foi recorrente. De fato, a Arquitetura da Informação é elaborada para facilitar a recuperação da informação. Como a recuperação da informação é o processo central do sistema de busca, preferiu-se trabalhar este tema após a descrição desse sistema. No contexto da Biblioteconomia e Ciência da Informação, o termo recuperação da informação possui várias definições: operação de selecionar documentos a partir de um determinado acervo, para atender a demanda do usuário; fornecimento, a partir de uma demanda definida pelo usuário, dos elementos de informação documentária correspondentes; operação que fornece uma resposta mais ou menos elaborada a uma demanda, e a resposta é convertida num produto cujo formato é acordado com o usuário (bibliografia, nota de síntese, etc.); alguns autores definem o termo de forma ampla subordinando a mesma ao tratamento da informação; é

definida também como uma área de conhecimento fundada por Calvin Mooers em 1951 (FERNEDA, 2003).

Neste trabalho buscou-se aplicar o termo de forma ampla, subordinando a definição de Recuperação da Informação ao tratamento da informação que envolve os processos de catalogação, indexação e classificação. Deste modo, considera-se que:

O website de uma biblioteca digital é um sistema de informação e, como tal, deve incluir um acervo de informações devidamente estruturado e organizado, de forma a nortear o usuário e facilitar a recuperação das informações necessárias a ele (NONATO et al. 2008, p. 137).

De acordo com Souza (2006, p. 163), um sistema de recuperação da informação organiza e viabiliza o acesso aos itens de informação, desempenhando as atividades de:

 representação das informações contidas nos documentos, usualmente através dos processos de indexação e descrição dos documentos;

 armazenamento e gestão física e/ou lógica desses documentos e de suas representações;

 recuperação das informações representadas e dos próprios documentos armazenados, de forma a satisfazer as necessidades de informação dos usuários. Para isso, é necessário que haja uma interface na qual os usuários possam descrever suas necessidades e questões, e através da qual possam também examinar os documentos atinentes recuperados e/ou suas representações.

Semelhante à afirmação de Souza (2006), Lima (2004) nos diz que, a “organização da informação, entendida ao nível de armazenamento, e a sua recuperação fazem parte do mesmo processo, de tal modo que uma entrada de dados ineficaz implicará em uma saída de dados também ineficaz”.

A interface construída para os usuários citada por Souza (2006) é o sistema de busca, que possibilita ao usuário descrever sua necessidade informacional ao sistema através de uma expressão de busca. Essa expressão de busca pode ser em linguagem natural ou por meio de um vocabulário controlado. Após a formulação da expressão de busca, espera-se que o sistema retorne ao usuário os resultados que satisfaçam sua necessidade de informação. Porém, a subjetividade, tanto do processo da entrada dos dados do sistema, por meio dos termos indexados que representam o documento quanto dos termos adotados pelo usuário para representar sua necessidade de informação, pode fazer com que os termos não coincidam durante a função de busca, logo os documentos que podem satisfazer uma necessidade de informação podem não ser recuperados. No caso de sistemas de recuperação da informação que utilizam o vocabulário controlado, esses instrumentos tem a função de diminuir a ambiguidade, entretanto, não eliminam a chance do documento ser indexado equivocadamente ou do usuário não conseguir exprimir ao sistema sua necessidade de informação.

Não obstante, o centro do processo de busca é a função de busca, que compara os termos representados no documento com os termos da expressão de busca do usuário e recupera os resultados que os usuários supostamente precisam para atender sua demanda informacional. No entanto, a recuperação da informação sofre interferências. Assim, a coincidência de um termo que aparece na representação de um documento e na expressão de busca do usuário não significa que o documento seja relevante para o usuário. Em primeiro lugar, geralmente a operação de busca contém mais de um termo, portanto a recuperação de um documento deve considerar a totalidade dos termos de busca. Em segundo lugar, o termo que aparece na representação do documento pode ter sido representado em contexto diferente da necessidade do usuário. Por último, um documento recuperado que atenda aos requisitos da busca do usuário, pode não ser relevante simplesmente por ser muito antigo, por já ter sido recuperado em outro momento, não cobrir totalmente as necessidades de informação do usuário, dentre outras razões (FERNEDA, 2003).

A eficiência de um sistema de recuperação da informação também está relacionada ao modelo utilizado. Os modelos de recuperação da informação se dividem em modelos clássicos e modelos estruturados como pode-se visualizar na Figura 13.

Figura 13 – Modelos de recuperação da informação

Fonte: Adaptado de Baeza-Yates e Ribeiro-Neto (1999, p. 21).

T A R E F A S D O U S U Á R I O Recuperação: Adhoc Filtragem Modelos Clássicos -Booleano -Vetorial -Probabilístico Modelos estruturados -Listas não sobrepostas -Proximidade de Nós

Teoria dos conjuntos -Nebuloso (“Fuzzy”) -Booleano estendido Algébricos -Vetorial Generalizado -Index. Semântica Latente -Redes Neurais Probabilísticos -Redes de Inferência -Redes de Crença

A Figura 13 mostra que primeiramente a recuperação da informação do ponto de vista da busca de informação, inicia-se com as tarefas do usuário que aciona o sistema através da interface traduzindo uma necessidade de busca em forma de questões ou palavras-chaves. A recuperação adhoc ocorre “quando o acervo de documentos sofre poucas alterações enquanto novas expressões de busca são submetidas ao sistema” (SOUZA, 2006, p. 165). A filtragem ocorre “quando as queries [expressões de busca] se mantêm relativamente estáticas enquanto novos documentos são adicionados” (SOUZA, 2006, p. 165). Ainda de acordo com Souza (2006), a filtragem geralmente é utilizada em processos de monitoração de fontes de informação, já a recuperação adhoc corresponde às buscas usuais em sistemas de recuperação da informação.

Os modelos de recuperação da informação podem ser de dois tipos

 Modelos clássicos: nesses modelos, na entrada do sistema, os documentos são indexados, através de palavras-chaves que representem seu conteúdo;

 Modelos estruturados: nos modelos estruturados “podem-se especificar, além das palavras-chaves, algumas informações acerca da estrutura do texto (como seções a serem pesquisadas, fontes de letras, proximidade das palavras, entre outras informações)” (SOUZA, 2006, p. 166).

O objetivo desses modelos é criar um algoritmo de busca, que consiga recuperar a informação de forma rápida e eficaz de acordo com uma necessidade informacional especifica. Além da escolha do modelo de recuperação da informação é fundamental determinar se o sistema de recuperação da informação utilizará algum instrumento de controle vocabular, pois os mesmos também vão interferir na busca e recuperação da informação. Na seção 2.7 apresentam-se as bibliotecas digitais, onde está inserido o universo de estudo desta pesquisa.