• Nenhum resultado encontrado

Antes de proceder à conceituação de indexação, deve-se chamar a atenção para o fato de existirem diferentes abordagens sobre o tema. Conforme Silva e Fujita (2004), podem-se observar duas grandes correntes intelectuais, relativas ao modo de conceber os processos e procedimentos de indexação. A primeira, de influência francesa, considera a indexação como um dos processos da Análise documentária, anteriormente definida. A segunda, de influência inglesa, considera a indexação com um processo composto de diferentes etapas. Nessa abordagem, a análise de assuntos é vista como a etapa inicial da indexação. Deve-se observar, ainda, que a abordagem da análise documentária pressupõe o estudo e desenvolvimento das linguagens documentárias, conforme descrito na seção 2.3.2.

Independentemente da concepção adotada, a indexação configura-se como “o problema fundamental, bem como o obstáculo mais dispendioso da recuperação da informação” (FAIRTHORNE apud LANCASTER (2004), p. 18).

Desde os primórdios do armazenamento de informações, surge a necessidade de desenvolver mecanismos que facilitem o acesso aos itens armazenados. Silva e Fujita (2004) descrevem o modo como se desenvolveram soluções para facilitar o acesso, ao longo da história – resumos, catálogos alfabéticos, cabeçalhos de capítulos, índice alfabético de assuntos, inventários de livros, comentários à margem dos livros (feito pelos copistas). As autoras afirmam que esse desenvolvimento levou ao surgimento dos primeiros índices, criados para indexar a Bíblia inglesa. Ainda, segundo as autoras, a difusão desses procedimentos levou ao surgimento, na Alemanha, da ideia de palavras-chave para representar itens de informação. No entanto, sob o ponto de vista atual, tais procedimentos e

respectivos produtos, não se encaixam na visão contemporânea do que devem ser os processos de indexação e os índices propriamente ditos.

Com relação à caracterização da indexação, devem ser diferenciados dois aspectos fundamentais: (i) o que é a indexação e (ii) qual o seu objetivo ou finalidade principal. Nos parágrafos seguintes serão apresentadas as definições de indexação propostas pelos principais autores da área.

Uma primeira caracterização consiste em considerar que o propósito principal do desenvolvimento de índices e de resumos é “construir representações de documentos publicados numa forma que se preste a sua inclusão em algum tipo de base de dados” (LANCASTER, 2004, p. 1). Este autor entende que os processos de indexação e de elaboração de resumos são fases que compõem a “entrada” de um sistema de recuperação de informações. Afirma, ainda, que essas atividades estão intimamente relacionadas, pois ambas dizem respeito ao preparo de representações do conteúdo temático dos documentos. Acrescenta, ainda, que a diferenciação entre a indexação e a elaboração de resumos está se tornando cada dia mais difusa e que, se ambas fossem consideradas como atividades complementares, a natureza intrínseca da atividade de indexação deveria sofrer algum tipo de mudança.

Para Lancaster (2004), a indexação é efetuada em duas etapas principais: (i) análise conceitual e (ii) tradução. Na primeira, deve-se decidir do que trata um documento, o seu assunto. A segunda etapa consiste na conversão da análise conceitual para um conjunto de termos de indexação, utilizando-se de “vocabulário do sistema” ou de termos “livres” (extraídos do próprio documento).

Outra maneira de conceituar a indexação consiste em focá-la como um tipo de tratamento técnico de diversos documentos, de forma a permitir a sua utilização. Nesse caso, tal tratamento pode ser divido em análise da forma e análise do conteúdo. A análise da forma também é conhecida como descrição bibliográfica ou catalogação e a análise de conteúdo envolve os processos de classificação, elaboração de resumos e indexação (LEIVA, 1999). Este autor considera necessário fazer distinção entre duas etapas: a indexação dos documentos e a indexação das perguntas efetuadas pelos usuários.

Assim, para Leiva (1999), na primeira etapa, voltada para a indexação dos documentos, deve ser realizada a leitura do documento para identificar e selecionar os conceitos presentes de maneira explícita no documento. Após a leitura, tanto os conceitos extraídos quanto os atribuídos, se necessário, devem ser armazenados por meio da linguagem natural ou normalizados e controlados com a ajuda de um vocabulário controlado.

A segunda etapa descrita por Leiva (1999), a da indexação da pergunta, refere-se à conversão da pergunta inicial formulada pelo usuário, que o autor nomeia de pergunta documental, para os termos utilizados no sistema de recuperação de informação. Essa conversão deve ser guiada pelos mesmos parâmetros da primeira etapa. Ou seja, a indexação da pergunta deve ser orientada para os termos que indexariam um documento.

Uma terceira visão da indexação, descrita por Mai (2005), considera que o objetivo da indexação é determinar o assunto dos documentos e expressá-los em termos de indexação tais como: descritores, cabeçalhos de assunto, números de chamada e códigos de classificação. Tais termos de indexação tornam possível a recuperação do assunto. Para esse autor, a partir de uma visão externa ao processo de indexação, com frequência assume-se, implicitamente, que uma simples análise permite estabelecer o assunto de um documento. Considera, ainda, que uma abordagem emergente para a indexação clama para que os indexadores analisem os documentos tendo as necessidades de informação dos usuários em mente. Sustenta, tal autor, que o assunto dos documentos é dependente do contexto e não algo facilmente identificável.

A figura a seguir resume a importância da indexação. As setas tracejadas mostram algumas teorias, modelos e campos de estudos que influenciam o desenvolvimento de técnicas de indexação. As setas contínuas mostram a influencia da indexação, por meio de processos específicos (Análise da informação e Medidas de similaridade), nos estudos sobre visualização. As setas cheias indicam sua interação com campos de conhecimentos associados tanto à Ciência da Informação quanto à Ciência da Computação.

Figura 3 – Importância da indexação: influências e interações Fonte: autor deste trabalho