• Nenhum resultado encontrado

2 QUADRO TEÓRICO E CONCEITUAL

2.4 A atividade de Indexação: contextos e definições

2.4.1 Instrumentos e Produtos de Representação da Informação

Nos estudos sobre representação documentária é perceptível que as linguagens de representação da informação, bem como os seus instrumentos e produtos são essenciais para a comunicação dos documentos informacionais em qualquer sistema de informação. Nesse sentido, compreende-se que a comunicação científica só é possível pela existência dos canais de comunicação que, em conjunto com os instrumentos e produtos de representação da informação, possibilitam a busca, recuperação e acesso aos recursos informacionais.

Além disso, é necessário acentuar que os instrumentos e os produtos de representação da possibilitam a visualização de domínios do conhecimento. A partir dessa visualização é possível detectar os temas mais discutidos nesses domínios e, assim, compreender a evolução dos campos científicos.

Chaumier (1988) considera que existem dois importantes instrumentos de representação da informação: os sistemas de classificação, que são linguagens de estruturas hierárquicas e os tesauros, que são linguagens de estruturas combinatórias ou alfabéticas.

Na concepção do autor supracitado (1988), os sistemas de classificação são considerados o primeiro tipo de instrumento de indexação voltado à representação documentária. Baseia-se na pré-coordenação para extrair os conceitos e no encaixe das classes de conceitos, partindo sempre do geral para o mais específico, seguindo uma estrutura hierárquica.

Já o tesauro é definido como “[...] uma linguagem controlada, constituída de descritores (palavras ou expressões) passíveis de combinação entre si, no momento da indexação, para exprimir noções complexas” (CHAUMIER, 1988, p. 70-71).

Vogel (2007, p. 91) argumenta que o tesauro é “[...] um objeto cultural que registra e representa o conhecimento segundo parâmetros estáveis, previamente determinados e manifestos sob a forma de redes de relações entre descritores [...]”. Ou seja, os tesauros são linguagens documentárias padronizadas que seguem determinadas diretrizes e normas para sua elaboração, de modo que as relações estabelecidas entre os termos utilizados, consigam cobrir determinados domínios do conhecimento.

Enquanto produto documentário, o tesauro tem suas origens no século XIX, quando em 1852, quando Peter Mark Rogel publicou seu The Roget’s Thesaurus, uma coleção de palavras organizada não em ordem alfabética, como nos dicionários, mas de acordo com as ideias que expressam (VICKERY, 1960).

Segundo Vickery (1960) o Thesaurus de Roget tem duas características básicas: seu

propósito e sua forma. Seu propósito é ajudar o usuário a passar de uma ideia para a palavra

que ele pode usar para expressar essa ideia em um texto escrito. Quanto a sua forma esse tesauro é dividido em duas partes. A primeira, é uma estrutura classificatória de ideias com diferentes categorias subdividas em tópicos e, a segunda parte, é composta por um índice alfabético, que faz associação entre os cabeçalhos (sob os quais ocorrem as palavras e frases) e os números, que representam as ideias na parte sistemática (VICKERY, 1960; CAMPOS, 2001).

Contudo, para Chaumier (1988) o tesauro, enquanto instrumento de representação documentária, vai além de uma simples lista alfabética de descritores. Pois, para o autor, o tesauro permite relações semânticas entre os termos de forma que guiem o indexador no momento da indexação. Tais relações são classificadas em três tipos: de equivalência, hierárquica e de associação. A relação de equivalência permite remeter os termos sinônimos e quase sinônimos ao termo descritor; a relação hierárquica permite relacionar um termo ao outro de modo hierarquizado, ou seja, sempre do geral para o particular; a relação associativa permite unir dois termos que possuem conotações entre si (geralmente, foi usada por muitos anos no sentido de indicar a expressão “ver também”).

Os tesauros também utilizam alguns operadores de sentido para indicar as relações entre suas unidades, isto é:

 TG – Termo genérico (de maior abrangência);  TE – Termo específico (de maior especificidade);

 TR – Termo relacionado (relações associativas, não hierarquizadas);  UP – Usado para (indica os termos sinônimos e quase sinônimos);  USE – Indica preferência do termo (o termo mais adequado);

 NE ou NA – Nota Explicativa ou Nota de Aplicação (definições ou aplicações para o uso do termo) (CHAUMIER, 1988; DODEBEI, 2002; NARUKAWA, 2011; VOGEL, 2007).

A figura a seguir mostrar um exemplo de tesauro contendo os três tipos de relações: de equivalência, hierárquica e de associação:

Figura 9– Relacionamentos entre termos estabelecidos nos tesauros

Fonte: Narukawa (2011, p. 33) adaptado do THESAGRO (Thesaurus Agrícola Nacional)

Além dos sistemas de classificação bibliográfica e dos tesauros, existem outros instrumentos de representação da informação e do conhecimento, tais como as taxonomias e ontologias.

As taxonomias são um instrumento de representação da informação que utiliza procedimento classificatório para agrupar e categorizar assuntos. Isto é, através de um assunto, é possível criar categorias que se subdividem em classes e subclasses, de modo a construir uma lista de assuntos estruturada hierarquicamente (TRISTÃO; FACHIN, ALARCON, 2004).

Segundo Aquino, Carlan e Brascher (2009) o termo taxonomia é de origem grega táxis (ordem) e onoma (nombre) e foi derivado do ramo da Biologia que estuda a classificação lógica e científica dos seres vivos. Ou seja, trata-se da Biologia Sistemática, fruto do trabalho do médico e botânico Carolus Linnaeus. Contudo, devido o desenvolvimento das tecnologias de informação, e a necessidade de organizar e recuperar informação de forma mais eficiente, as taxonomias foram inseridas e implementadas nos ambientes digitais, tornando-se alvo de estudo da Ciência da Informação (AQUINO; CARLAN; BRASCHER, 2009).

Além disso, as taxonomias têm sido empregadas em portais corporativos de empresas, bibliotecas digitais e sítios de instituições governamentais com o objetivo de organizar e recuperar informações (AQUINO; CARLAN; BRASCHER, 2009). Ou seja, a taxonomia é

um vocabulário controlado que organiza logicamente os conteúdos informacionais para fins de recuperação da informação.

As ontologias, por seu turno, que também são uma espécie de vocabulário controlado, que busca representar, de forma estrutural e relacional, os conceitos de um domínio.

Brascher e Carlan (2010, p. 160) comentam que as ontologias “definem conceitos e relações de alguma área do conhecimento, de forma compartilhada e consensual e promovem e facilitam a interoperabilidade entre sistemas de informação, em um processo ‘inteligente’ dos agentes (computadores)”.

Segundo Almeida e Bax (2003, p. 7) “uma ontologia é criada por especialistas e define as regras que regulam a combinação entre termos e relações em um domínio do conhecimento. Os usuários formulam consultas usando conceitos definidos pela ontologia”. Nesse sentido, a ontologia tem por objetivo promover melhorias no processo de recuperação da informação.

Tanto os tesauros quanto as taxonomias e as ontologias são vocabulários controlados com características comuns e construídos seguindo uma classificação lógica, hierárquica e relacional. Tratam da representação e estruturação de conceitos e seus relacionamentos em um determinado domínio e contribuem para a construção dos produtos de representação e recuperação da informação.

Os principais produtos de representação da informação são os índices, os resumos e os catálogos de assunto. Geralmente o índice consiste em uma listagem alfabética ou sistemática de tópicos que indicam a localização de cada um deles num documento ou em uma coleção de documentos. Mas também pode ser um conjunto ordenado de códigos de representação de assuntos que podem servir de critério de busca para localizar documentos (DIAS; NAVES, 2007; VIEIRA, 2014.)

O resumo, enquanto produto do tratamento temático, diz respeito a representação sucinta, mas exata do conteúdo de um documento, tendo como finalidade a posterior recuperação desse documento e também a complementar os pontos de acesso gerados pelos termos de indexação (LANCASTER, 2004).

Já o catálogo de assunto é um produto da representação temática que é organizado “mediante determinação de cabeçalhos de assunto que funcionam como enunciados de assuntos formados a partir da composição ordenada de palavras” (SILVA; FUJITA, 2004). O principal objetivo do catálogo de assunto é possibilitar ao usuário a encontrar um item desejado ou a identificar o que existe sobre determinada temática em uma unidade de informação.

Tanto os instrumentos quanto os produtos do tratamento temático são essenciais para a recuperação da informação. Como mencionado no início dessa pesquisa, as palavras-chave também são produtos de representação e recuperação da informação. Nesse sentido, tendo as palavras-chave e as keywords plus, dos documentos da área de Nutrição da WoS, como objeto de investigação dessa pesquisa, a seguinte seção abordará alguns conceitos e definições acerca desse produto do tratamento temático, buscando mostrar sua utilização e aplicação em sistemas de recuperação da informação e como a mesma pode contribuir para a construção de representações visuais.