• Nenhum resultado encontrado

2.4 Recuperação de informação e conhecimento

2.4.1 Visão geral da RI

Vannevar Bush, nos anos 40, já sinalizava que a capacidade humana em gerar novas informações era muito maior do que a sua capacidade em armazená-la de forma a permitir futuras consultas (BUSH, 1945). Com isso ele estava alertando sobre a necessidade de

melhorar a recuperação de informação e conhecimento. Em função disso ele chegou a imaginar um mecanismo específico para esse processo, o Memex (contração das palavras memory e index). Em 1951, Calvin Mooers, pioneiro na área da Ciência da Informação, cunhou o termo information retrieval, definindo-o como uma área que abrange os aspectos intelectuais da descrição das informações e sua especificação para a pesquisa, e também quaisquer sistemas, técnicas ou máquinas que são utilizadas para realizar a operação (SARACEVIC, 1999). Nos anos 60, a nova área chegou a ser entendida como núcleo da CI por vários autores (ARAÚJO, 2014).

Saracevic (1999), atualizou a definição de Mooers, acrescentando a questão da interação com usuários e os aspectos contextuais: cognitivo, afetivo e situacional. Robins (2000) também retratou essa nova visão argumentando que variáveis anteriormente não consideradas nesse processo pelo modelo tradicional, como o ambiente e conhecimento do usuário, seus objetivos, intenções e crenças, começaram a ganhar força com o surgimento de novos modelos. Ainda sim, existem definições bem sucintas que não explicitam a preocupação com o usuário, tal como o glossário The Information Arquitecture (HAGEDORN, 2000), onde RI é o estudo de sistemas de indexação, busca, armazenamento e recuperação de conteúdo. Ou ainda, Salton e McGill (1983) que afirmam que a recuperação de informação tem foco na representação, armazenamento, organização e acesso de itens de informação.

Contudo, a área se desenvolveu e são predominantes as definições de RI com visão ampla envolvendo, simultaneamente, sistemas e usuários. Por exemplo, Baeza-Yates e Ribeiro-Neto (2011) defendem que o principal objetivo de um sistema de IR é recuperar todos os itens que são relevantes a uma dada consulta do usuário, e o menor número possível de itens menos relevantes. Os autores também destacam que, recentemente pesquisas em RI também incluem modelagem, busca na web, classificação de texto, arquitetura de sistemas, interface de usuários, visualização de dados, filtragem e linguagens.

A Figura 11 apresenta um modelo geral de um sistema de recuperação de informação. Observa-se nessa figura, que a recuperação de informação ocorre no âmbito de um sistema cíclico, onde usuários de uma comunidade (user’s community), ao perceberem uma falta de informação – passo 1 – expressam uma necessidade (expression of need) para um agente intermediário (intermediary) – passo 2 – aqui também chamado de mediador. Com a popularização de RI interativas, principalmente enquanto interfaces web, o papel do mediador tem sido reduzido, mas ele é visto com importância, por ter maior experiência na formulação de estratégias de recuperação. Uma vez definida a estratégia de recuperação (formulation os

strategy) – passo 3 – ela é materializada na forma de uma consulta (formulation of query) – passo 4. A consulta é submetida ao sistema de recuperação de informação (information retrieval system) – passo 5, que retorna uma lista de respostas ao usuário, tipicamente uma lista de documentos ranqueados em ordem decrescente de relevância. Se o mediador atua nesse processo, ele também realiza uma avaliação dos resultados da consulta, antes de entregá-los ao usuário, tendo em vista o seu melhor entendimento das necessidades de informação, quando comparado ao que é capaz de ser inferido pelo sistema de recuperação de informação. O mediador pode refazer a consulta, sem encaminhar os resultados ao usuário, a fim de obter novos resultados que sejam mais relevantes.

Figura 11 – Visão geral de um sistema de RI

Do ponto de vista técnico do processo de recuperação, parte inferior da Figura 11, destacam-se o sistema automatizado de RI propriamente dito (information retrieval system), e sua base de dados (database). O sistema automatizado de recuperação de informação é composto por:

(i) Gerenciador de consultas (query manager program), que transforma os termos da consulta em comandos adequados à forma de organização interna dos dados – passo 5a;

(ii) Gerenciador de dados (data manager program), que realiza as buscas na base de dados – passo 5b;

(iii) A interface com o mediador (communications program) – passo 5c; e

(iv) O atualizador/organizador da base de dados (file update program)– passo 5d. Os sistemas de RI são instrumentos essenciais para o tratamento da explosão informacional, principalmente após o advento da web. Atualmente os sistemas de RI podem oferecer velocidade de processamento que, devido às peculiaridades das bases de dados, principalmente quanto à escalabilidade e distribuição, é necessária para a absorção do grande volume de consultas. Contudo, ao longo da história, os sistemas de RI foram evoluindo e sendo desenvolvidos sob diferentes abordagens da RI. Saracevic (1999), Baeza-Yates e Ribeiro-Neto (2011) destacam duas abordagens para a RI, onde apesar de ambas terem igual interesse na recuperação, possuem diferentes perspectivas, diferenças conceituais e organizacionais:

RI com abordagem centrada em sistemas: desde os anos 50 e durante várias

décadas seguintes foi a única abordagem existente. Ela é baseada em algoritmos e segue um modelo que não dá relevância plena à interação com o usuário. Ou seja, ela está interessada em evoluir os componentes na parte inferior da Figura 11: o sistema de RI (information retrieval system) e os bancos de dados (database).

RI com abordagem centrada no usuário: se iniciou a partir dos anos 80. Usa

modelos interativos e cognitivos considerando e até dando ênfase no lado humano. Ou seja, ela está interessada em evoluir os componentes da parte superior da Figura 11.

Outro enfoque classificatório que pode ser dado a RI é conforme a sua relação com os três paradigmas da CI, físico, cognitivo e social, descritos por Capurro (2003), na seção 2.1.2.

RI no Paradigma Físico: o usuário não é valorizado no processo de recuperação

de informação que é mostrado como um processo mecânico onde existe, de um lado, um sistema de RI com uma base de dados, do outro, o usuário que tende a ter o seu desejo informacional não interpretado corretamente e, no centro, o profissional da informação (mediador da Figura 11) que tenta fazer a ligação entre os dois lados (ALMEIDA et al., 2007). O paradigma físico está diretamente relacionado à abordagem centrada em sistemas, de Saracevic (1999) e Baeza-Yates e Ribeiro- Neto (2011), discutida nessa subseção.

RI no Paradigma Cognitivo: Almeida et al. (2007) destacam a consideração

dos modelos mentais dos usuários em alguns enfoques da RI, utilizando abordagens cognitivas e centradas no processo interpretativo dos usuários, observando as suas características fenomenológicas e individuais, “valorizando assim tentativas de inclusão das dimensões semânticas e pragmáticas nos sistemas de RI, com o intuito de possibilitar uma melhor gestão de informações a partir da análise de como as informações são compreendidas pelos usuários” (p. 22). Nesse sentido, a atividade do mediador humano, representado na Figura 11, tenta desenvolver essa abordagem em sistemas automatizados de baixa tecnologia.

RI no Paradigma Social: Almeida et al. (2007) descrevem que em alguns

enfoques da RI o foco é na “[...] recuperação dos elementos subjetivos dos usuários para a definição do desenho dos sistemas de recuperação, considerando sua visão de mundo” (p. 22). Portanto, em enfoques da RI aderentes ao paradigma social, a CI “[...] volta-se para um enfoque interpretativo, centrado no significado e no contexto social do usuário e do próprio sistema de recuperação da informação” (p. 22). Essa abordagem é melhor representada na expansão da Figura 11, conforme ilustra a Figura 12. O produtor da base de dados é explicitamente indicado como parte do sistema de recuperação de informação, bem como as interações desses com a comunidade de usuários, e as interações de ambos com o mundo, seus eventos, pessoas e estados. Também é representado nesse modelo o projetista do sistema de recuperação de informação, que precisa considerar as condições de sua comunidade de usuários e das bases de dados que poderá utilizar juntamente com o sistema de RI. Trata-se, portanto, de um modelo que considera o elevado grau de interação entre usuários e bases de dados, para a construção de sistemas de RI.

Figura 12 – Visão ampliada do ciclo de RI

Fonte: Fonte: Meadow et al. (2007)