• Nenhum resultado encontrado

2 CIÊNCIA DA INFORMAÇÃO E NOVAS TECNOLOGIAS

2.2 CIÊNCIA DA INFORMAÇÃO E COMPUTADOR: TUDO A VER!

2.2.1 A Recuperação da Informação e os processos automatizados de busca

A RI consiste basicamente em uma interação usuário, profissional da informação e o universo de documentos (entendendo-se aqui documento como a informação registrada e armazenada em qualquer suporte tanto de texto, imagem ou som). A partir de uma necessidade de informação verificada e comunicada, procede-se a busca, aquisição e consulta de documentos relevantes para a solução do problema levantado. Este processo inclui uma negociação intelectual e cognitiva que pode necessitar de ajustes/revisões na comunicação com a finalidade de buscar a correspondência mais clara possível entre o problema de informação e o documento a ser pesquisado.

Lancaster (1979, apud CENDÓN, 2005, p. 63) desenvolveu um diagrama que representa as etapas e as funções de um sistema de RI, partindo de toda a massa de documentos dispersos e posteriormente selecionados, adquiridos, analisados e devidamente indexados em um banco de dados representativo e acessível ao usuário através de índices e estratégias de busca.

Este processo, na verdade, já é encontrado na Biblioteconomia clássica, anterior às novas tecnologias, aplicando-se ao uso do acervo convencional em “átomos” com a mediação do profissional bibliotecário. No entanto, o computador ampliou radicalmente a potência desta atividade dentro e fora das bibliotecas, através da possibilidade quase infinita de acesso a todo tipo de informação registrada em qualquer ambiente onde o equipamento esteja conectado a uma rede de informação eletrônica, não necessariamente necessitando de intervenção do profissional.

Lugo (2000), também ressalta a aplicação da RI nos processos de busca e navegação da informação digital disponível na internet e que esta atividade constitui “o coração das pesquisas em bibliotecas digitais”.

Cendón (op.cit., p. 65) localiza as origens da pesquisa de avaliação e desenvolvimento dos sistemas de RI a partir de 1953 com a execução de testes de um sistema de indexação chamado Unitherm, criado por Mortimer Taube. Estes testes foram realizados pela Armed Services Technical Information Agency (ASTIA) nos EUA e pelo College of Aeronautics em Cranfield, no Reino Unido, e consistiam em representar documentos utilizando termos únicos retirados do título ou do resumo, diferentemente das técnicas de indexação comumente utilizadas a partir de termos previamente escolhidos com base em sistemas de classificação, como a Classificação Decimal Universal (CDU).

Pela primeira vez foram analisados pedidos de busca dos documentos indexados medindo a efetividade e a relevância38 dos textos recuperados. Ambos os testes demonstraram uma efetividade maior de recuperação de conteúdos através de termos criados a partir dos próprios documentos.

Novas séries de experimentos semelhantes foram realizados pelo Instituto Cranfield, onde foram julgados os desempenhos de cada linguagem de indexação na recuperação de itens relevantes os quais, apesar de ainda imprecisos, apresentaram resultados que apontaram para um melhor desempenho na busca a partir de termos retirados do texto. Estes testes são considerados, segundo Cendón, “um marco na história da recuperação da informação por terem fornecido o embasamento teórico dentro do qual a disciplina de recuperação da informação se desenvolveu” (op. cit., p. 67), inaugurando uma era na qual “a representação do conhecimento deve ter base empírica e experimental, em vez de filosófica e especulativa, como era o caso anteriormente”.

O desenvolvimento das pesquisas nesta área, especialmente a partir do final da década de 1970 e começo dos anos 1980 traz avanços na área da pesquisa com base em métodos estatísticos e probabilísticos, nas abordagens cognitivas e no desenvolvimento de sistemas especialistas intermediários como auxiliares na RI, além da aplicação de conceitos e técnicas de Inteligência artificial e RI através de hipertexto (ELLIS, 1996, apud CENDON, 2005, p. 68-69).

Cendón apresenta como o primeiro sistema de indexação, classificação, elaboração de resumos e busca automática, o SMART, criado por Gerard Salton, seguido

38

Por relevância entende-se a validade de uso efetivo do documento recuperado diante da necessidade levantada pela questão do usuário.

por um dos mais conhecidos exemplos de proposta de sistema baseado em modelo cognitivo de usuários: o “Estado Anômalo de Conhecimento” (em inglês, Anomalous States of Knowledge – ASK).

De acordo com a autora, “cerca de 30% de toda a literatura publicada na Ciência da Informação se dá na área de recuperação da informação” (CENDÓN, op. cit., p. 69), demonstrando o peso que esta atividade possui.

Cendón afirma que os sistemas atuais de RI consistem em um conjunto de componentes formados pela tecnologia (hardware, software e redes de comunicação de dados), as pessoas (usuários, intermediários e pessoas envolvidas na criação do sistema) e um ou mais corpos de conhecimento ao qual o SRI (sistema de recuperação da informação) dá acesso, geralmente contido em bases de dados (ALLEN, 1996, apud CENDÓN, 2005, p. 74).

A autora apresenta uma classificação dos SRIs a partir dos tipos de bases de dados aos quais fornecem acesso, que podem ser categorizadas como bases referenciais ou de fontes:

Bases referenciais: incluem referencias bibliográficas ou informações secundárias e subdividem-se em bases bibliográficas ou diretórios (dados cadastrais sobre pessoas, instituições, etc.);

Bases de fonte: incluem informação de texto completo, dicionários, dados numéricos e séries estatísticas, imagens ou dados gráficos.

Em termos práticos, estas atividades dos cientistas da informação, além de serem intimamente relacionadas às questões da informática, também direcionam-se aos processos cognitivos que ocorrem durante a busca e a apropriação da informação que englobam as etapas da RI, esbarrando assim nas categorias de análise das Ciências Cognitivas, com as quais também possui relações interdisciplinares.

Nestes aspectos, a RI traz, portanto, à CI uma conexão relativamente estreita com a Ciência da Cognição, ou Ciências Cognitivas. Deste relacionamento podem surgir os fatores de uso do computador que realmente levam a CI a se diferenciar da Biblioteconomia, como será observado a seguir.

2.2.2 Ciência da Informação e Ciências Cognitivas: os usos diferenciados do