• Nenhum resultado encontrado

O QUE SÃO CLASSIFICAÇÕES, TESAUROS, TAXONOMIAS E ONTOLOGIAS? 1 Classificações

Sistemas de organização do conhecimento: Antigas e novas linguagens Marisa Bräscher1 e Eliana Carlan2

SUMÁRIO DO CAPÍTULO 8

4. O QUE SÃO CLASSIFICAÇÕES, TESAUROS, TAXONOMIAS E ONTOLOGIAS? 1 Classificações

4. O QUE SÃO CLASSIFICAÇÕES, TESAUROS, TAXONOMIAS E ONTOLOGIAS? 4.1 Classificações

A classificação é, provavelmente, o método mais simples de ordenar a confusa multiplicidade da natureza. É um processo de seleção de ideias ou objetos em grupos, conforme suas qualidades semelhantes e diferenças específicas. Esse processo, chamado de abstração, é essencialmente mental, nós agrupamos ou separamos coisas de acordo com o conceito ou ideia que temos dos objetos no mundo, fortalecendo a memória e o poder de raciocínio. Sem isso, nada pode ser identificado, portanto, na prática, pode-se dizer que os pensamentos e raciocínios consistem de classificação. Citado por Phillips (1955, p. 10), Mill afirma que a proposta da classificação é primeiramente facilitar as operações da mente concebendo e retendo claramente na memória as características dos objetos em questão.

Enquanto fenômeno social, as pessoas classificam, intuitivamente, as coisas o tempo todo. Como explica Langridge (2006, p. 11) o fato de que a maioria das pessoas não percebe o quanto classifica é meramente um indício da natureza fundamental do processo de classificação.

O processo de classificação é uma formação metodológica e sistemática onde se estabelecem critérios para a divisão, isto é, a formulação de um esquema de categorias, classes e subclasses, baseado nas características e relações dos objetos considerados. É, também, um sistema logicamente estruturado onde os conceitos pré-determinados correspondem a um código identificador.

Os sistemas de classificação podem ser vistos sob três aspectos, de acordo com Phillips (1955): quanto à finalidade, quanto à característica e quanto à área do conhecimento. Segundo a finalidade, temos a classificação filosófica, das ciências ou do conhecimento voltadas para a definição e a hierarquização do conhecimento humano e a bibliográfica, destinada à organização dos documentos (livros, periódicos, etc.) para facilitar a localização. Quanto à característica a classificação pode ser natural, quando o fator de distinção é fundamental para a natureza do objeto e artificial, quando a base da divisão depende de uma qualidade acidental. Em relação à área do conhecimento, a classificação pode ser geral no caso da enciclopédica e especializada que podem ser científicas ou bibliográficas.

As classificações bibliográficas tiveram grande parte do seu desenvolvimento no final do século XIX e início do século XX e se originaram dos modelos de classificação filosófica, porém, com o objetivo de organizar e localizar os documentos. São sistemas predeterminados de conceitos logicamente estruturados e acompanhados de um código identificador. Este código é atribuído a conceitos ou a documentos em função da correspondência de assuntos.

Segundo Bliss (1952), uma classificação de material bibliográfico é uma classificação de assuntos, que, na verdade, constitui-se numa organização estrutural do conhecimento e do pensamento e que atende a objetivos funcionais de organização do conhecimento. Dos sistemas de classificação bibliográficos, os mais conhecidos são: Classificação Decimal de Dewey (CDD); Classificação Decimal Universal (CDU); Classificação da Biblioteca do Congresso dos Estados Unidos (LCC – Library of Congress Classification).

Neste capítulo, adotaremos a denominação classificação para nos referir aos sistemas de classificação utilizados para organização e recuperação da informação, que englobam os supracitados, assim como outros desenvolvidos para atender necessidades específicas.

Há interesse renovado no estudo das classificações e seu uso foi ampliado com a necessidade de organizar conteúdos na web. As classificações são utilizadas para a organização conceitual que auxilia a busca por palavras. Destacamos, ainda, a importância da aplicação de princípios classificatórios

158

desenvolvidos pela Biblioteconomia na construção de sistemas de organização do conhecimento. .

4.2 Tesauros

O termo tesauro é originário do latim – thesaurus e do grego – thesaurós, que quer dizer tesouro, armazenamento, repositório. Cavalcanti (1978, p. 27) define tesauro como uma ―lista estruturada de termos associados empregada por indexadores para descrever um documento com a desejada especificidade e para permitir aos usuários a recuperação da informação que procuram‖.

O tesauro é geralmente temático e atende uma área específica do conhecimento, mas existem tesauros multidisciplinares que atendem a sistemas de informação dessa natureza. Segundo Gomes (1990), os tesauros são classificados quanto à tipologia, de acordo com a(s) língua(s) que englobam, em monolíngues e multilíngues. Quanto ao tipo de conceitos, são macrotesauros (representam conceitos mais amplos) e microtesauros (representam conceitos específicos) e, de acordo com a abrangência temática, são multidisciplinares e de disciplina específica.

No contexto da organização e recuperação da informação, tesauros são instrumentos de controle terminológico, utilizados em sistemas de informação para traduzir a linguagem dos documentos, dos indexadores e dos pesquisadores numa linguagem controlada, usada na indexação e na recuperação de informações.

Guinchat e Menou (1994, p.146) apontam que as vantagens do tesauro são sua especificidade, maleabilidade e capacidade de descrever as informações de forma completa. Os tesauros auxiliam o indexador a localizar o conceito num campo semântico e o usuário a identificar assuntos relacionados que podem ser de interesse na busca. O emprego das novas tecnologias da informação possibilita diferentes formas de apresentação, mais amigáveis e compreensíveis para orientar os usuários na navegação, ampliando ou restringindo sua busca.

De acordo com o IBICT (1984, p. 1-2), as principais finalidades de um tesauro são: a) controlar os termos usados na indexação mediante um instrumento que traduza a linguagem natural dos autores, usuários e indexadores, para uma linguagem mais controlada; b) uniformizar, mediante esta linguagem documentária, os procedimentos de indexação de profissionais em uma instituição ou numa rede cooperativa; c) limitar o número de termos necessários à explicitação dos conceitos expostos pelos autores de uma área; d) auxiliar a tarefa de recuperação da informação, fornecendo termos adequados para a estratégia de busca.

Os tesauros são sistemas de uso consolidado em sistemas de informação e são, inclusive, padronizados por meio de normas, como a ISO 2788 (1986) e ISO 5964 (1985), no caso de tesauro multilíngue e ANSI / NISO Z39.19-2003, que define diretrizes de construção e formatação de tesauros. Há, ainda, diretrizes e manuais de elaboração de tesauros5, disponíveis também em língua portuguesa.

4.3 Taxonomias

Etimologicamente, o termo taxonomia deriva do grego, com o significado de: taxis – ordenação, grupo e nomos - lei, norma, regra. A palavra taxonomia foi introduzida por A. de Candolle, em 1813, para designar as normas e leis utilizadas em sistemática (CURRÁS, 2005 p. 53-54).

...Reitz (2004), no Online Dictionary for Library and Information Science6 define taxonomia como a ciência de classificar que abrange os princípios gerais pelos quais objetos e fenômenos são divididos em classes, as quais estão subdivididas em subclasses, e essas em sub-subclasses e assim

5 Alguns manuais de elaboração de tesauros: AITCHISON, J.; GILCHRIST, A. Manual para construção de tesauros. Rio de Janeiro RJ: BNG/Brasilart,1979, 142 p.; AUSTIN, D.

Diretrizes para o estabelecimento de tesauros monolíngües. Brasília DF: IBICT/SENAI, 1993; GOMES, H.E. Manual de elaboração de tesauros monolíngües . Brasília DF: PNBU,1990, 78 p.; IBICT. Diretrizes paraelaboração de tesauros monolíngües . Brasília DF: IBICT, 1984, 70 p.

159

sucessivamente. As taxonomias permitem que se estabeleçam padrões de classificação e ordenação de informações por meio de herança, ou seja, pelo relacionamento hierárquico (gênero/espécie) entre os objetos, em que as características das classes gerais são repassadas por herança às subclasses....

.No contexto da Ciência da Informação, uma taxonomia é um método de classificar coisas reais, estabelecendo categorias de similaridades e diferenças (KENT; LANCOUR, 1968, p.187). No domínio das representações do conhecimento, as taxonomias são instrumentos que organizam logicamente os conteúdos informacionais. O conceito de organização remete para um procedimento classificatório e permite agrupamento categorizado, isto é, a partir de um assunto formam-se categorias que se dividem em classes e subclasses hierarquicamente, formando uma lista de categorias de assunto estruturada.

Graef (apud EDOLS, 2006) apresenta as taxonomias como esquemas que classificam coisas – organismos vivos, produtos, livros – em uma série de grupos hierárquicos para serem mais fáceis de identificar, estudar e localizar. E são compostas de duas partes – estruturas e aplicações. As estruturas consistem em categorias e os relacionamentos e as aplicações são as ferramentas de navegação disponíveis para ajudar os usuários a encontrarem as informações que desejam.

Na organização e recuperação de informação, as taxonomias são usadas para a criação de metadados ou termos para descrever um objeto e na categorização para definir classes e subclasses, como suporte à navegação no ambiente web. Diante do contexto dinâmico da informação, Conway e Sligar (2002) destacam que as taxonomias não são documentos estáticos que ficam guardados em um lugar seguro. Ao contrário, elas adaptam-se e se transformam conforme as alterações de conteúdo e de conhecimento de quem as utilizam.

As taxonomias ganharam importância na organização de informações no contexto empresarial. Alan Gilchrist e Peter Kibby citados por Edols (2001) destacam que as taxonomias:

 estabelecem correlação de diferentes linguagens funcionais usada pelas empresas;  apoiam a navegação e permitem melhor acesso ao conteúdo intelectual da empresa;

 são ferramentas que permitem a etiquetagem de documentos e outros objetos informacionais úteis para as ferramentas de busca e construção de mapas de conhecimento.

Segundo Campos e Gomes (2007) as taxonomias caracterizam-se por:  conter uma lista estruturada de conceitos/ termos de um domínio;  incluir termos sem definição, somente com relações hierárquicas;

 possibilitar a organização e recuperação de informação através de navegação;

 permitir agregação de dados, diferentemente das taxonomias seminais, além de evidenciar um modelo conceitual do domínio;

 ser um instrumento de organização intelectual, atuando como um mapa conceitual dos tópicos explorados em um sistema de recuperação de informação;

 ser um novo mecanismo de consulta em portais institucionais, através de navegação.

Conway e Sligar (2002) classificam as taxonomias em três tipos. A taxonomia descritiva, cujo objetivo é dar suporte à recuperação de informações por meio de busca. Está diretamente ligada ao conteúdo dos documentos da instituição, a partir da qual é desenvolvida. A taxonomia nave- gacional, como o nome expressa, tem por objetivo a descoberta do conhecimento por meio da navegação e é construída com base no comportamento

160

do usuário e não no conteúdo dos documentos. Por último, a taxonomia para gerenciamento de dados, que contém pequeno conjunto de termos controlados rigidamente, é uma lista de termos autorizados, sem qualquer estrutura hierárquica, utilizada para apoiar as transações comerciais.

Observa-se que as taxonomias adquirem importância no contexto das organizações, como instrumentos auxiliares à gestão do conhecimento e à organização e recuperação da informação. Elas asseguram que todas as aplicações da instituição utilizem a mesma linguagem para organizar, armazenar e apresentar a informação.

4.4 Ontologias

Assim como os termos tesauro e taxonomia, ontologia deriva das línguas antigas, vem do grego - ontos e logoi, que significa conhecimento do ser. A área de informação toma o termo ‗emprestado‘ da Filosofia, em cujo âmbito refere-se à teoria sobre a natureza da existência.

As ontologias são objetos de estudo de diferentes áreas do conhecimento (Filosofia, Ciências Cognitivas, Ciência da Computação, Linguística, Ciência da Informação, Medicina, Empresarial), é natural que haja multiplicidade de acepções e de definições variadas que refletem a visão de cada domínio.

Para a organização e recuperação da informação, o conceito empregado é proveniente da proposta de Berners Lee (2001) e está associado ao contexto da Web Semântica7. Para o autor, ontologia é ―documento ou arquivo que define formalmente as relações entre termos.‖ Outra definição comumente encontrada na literatura é a apresentada por Gruber (1996 p.1) - ―ontologia é uma especificação formal e explícita de uma conceitualização, o que existe é aquilo que pode ser representado‖ [...]

As ontologias definem conceitos e relações de alguma área do conhecimento, de forma compartilhada e consensual e promovem e facilitam a interoperabilidade entre sistemas de informação, em um processo ―inteligente‖ dos agentes (computadores). A conceitualização proposta por uma ontologia deve ser representada de maneira formal, legível e utilizável por computadores, de maneira a permitir o compartilhamento e o reuso do conhecimento entre os sistemas. Uma ontologia define os termos usados para descrever e representar uma área do conhecimento. Podem ser usados por pessoas, bancos de dados e aplicações que necessitam compartilhar informações em um domínio.

Durante os últimos anos, as atenções têm se voltado para a metodologia de construção de ontologias, as quais podem ser construídas a partir do reuso de ontologias disponíveis. Diferentes processos de construção de ontologias tendem a estar associados com diferentes tipos de ontologias. No entanto, como destacam Noy e McGuinness (2001), o desenvolvimento de uma ontologia inclui definição de classes, estruturação de classes numa hierarquia taxonômica, definição de atributos8 e descrição dos valores permitidos para esses atributos.

Para cada domínio as abordagens para construção de ontologias, geralmente, são específicas e limitadas e dependem dos interesses para os quais são construídas. Mas, independente do domínio, a elaboração de uma ontologia requer um trabalho complexo e dispendioso.

Na Web Semântica, as ontologias especificam descrições para conceitos, com semântica expressiva, explícita e bem-definida, possivelmente interpretável por máquina, que processam automaticamente as informações encontradas na web. Para tanto, usam linguagens compatíveis (OWL, XML e

7 Nas palavras de Tim Berners-Lee (2001) ―web semântica não é uma web separada, mas uma extensão da atual‖. É a criação e implantação de padrões tecnológicos permitindo que dados sejam compartilhados e reusados, é um esforço colaborativo liderado pela W3C com participação de pesquisadores e empresas. Está baseado na RDF (Resource Description Framework), que integra uma variedade de aplicações usando XML (eXtensible Markup Language) para sintaxe e URI (Uniform Resource Identifier) para identificação. O objetivo da web semântica é transformar o conteúdo atual da web num formato no qual não só humanos, mas também computadores entendam o significado das informações, de forma a permitir que agentes inteligentes recuperem e manipulem informações pertinentes.

161

XML Scheme, RDF e RDF Scheme) com o ambiente digital.

Classificações, tesauros, taxonomias e ontologias estruturam, classificam, modelam e representam conceitos e seus relacionamentos pertinentes num domínio do conhecimento. São formados, basicamente, por vocabulários controlados acompanhados de relacionamentos semânticos entre os termos. Desempenham a função de organizar e recuperar informações. No entanto, como veremos a seguir, os quatro sistemas mantêm pontos em comum, mas diferenciam em alguns aspectos.