• Nenhum resultado encontrado

Seminário FESPSP São Paulo: a cidade e seus desafios 05 a 09 de outubro de 2015 GT 6 - Informação e ambientes digitais: organização e acesso

N/A
N/A
Protected

Academic year: 2021

Share "Seminário FESPSP São Paulo: a cidade e seus desafios 05 a 09 de outubro de 2015 GT 6 - Informação e ambientes digitais: organização e acesso"

Copied!
15
0
0

Texto

(1)

Seminário FESPSP “São Paulo: a cidade e seus desafios” 05 a 09 de outubro de 2015

GT 6 - Informação e ambientes digitais: organização e acesso

A informação digital e os sistemas de organização do conhecimento

Santos, Cibele Araújo Camargo Marques dos1, Universidade de São Paulo. Escola de Comunicações e Artes; Jesus, Eduardo de Abreu de2, Universidade de São Paulo. Escola de Comunicações e Artes; Luca, João Ricardo de3, Universidade de São Paulo. Escola de Comunicações e Artes.

Resumo: Apresenta os sistemas de organização do conhecimento (SOC) e seus

formatos, padrões, normas e tendências com o objetivo de relacionar estes sistemas com a organização da informação digital. Foi realizada pesquisa bibliográfica em bases de dados internacionais da área de Ciência da Informação (LISA e ISTA), em bases multidisciplinares (Web of Science e SCOPUS), e em bases nacionais (BRAPCI e SCIELO). A partir da literatura encontrada traz a definição de sistema de organização do conhecimento, diferencia os tipos de linguagem como vocabulário controlado, linguagem de indexação, sistemas de classificação e de categorias, taxonomia e evidencia a contribuição destes sistemas para a navegação na web. Mostra também a folksonomia, prática na internet de classificar um conceito atribuindo-lhe uma tag, que pode ser criada por qualquer usuário disposto a etiquetar informação. A informalidade na atribuição desses termos é a característica mais notável. O contexto web direciona novos olhares ao conceito de vocabulário controlado, com formatos de mídia e conteúdos importantes para essa mudança. Entre as ferramentas disponíveis, encontra-se o SKOS (Simple Knowledge Organization System) que permite representar qualquer tipo de sistema de organização do conhecimento mediante RDF, com âmbito de aplicação que se estende praticamente a totalidade dos vocabulários controlados. Neste formato, os elementos de um vocabulário são representados por conceitos entre os quais são

1

Doutora em Ciência da Informação, professora do Departamento de Informação e Cultura (CBD/ECA/USP). E-mail: cibeleac@usp.br.

2 Mestrando em Ciência da Informação. E-mail: eduardo.jesus@usp.br. 3

(2)

estabelecidas relações semânticas, hierárquicas e associativas. Aos conceitos são associadas etiquetas em diferentes idiomas. Verificou-se que na literatura da área existe diversidade conceitual e terminológica, e a recorrência de textos que visam à definição de conceitos básicos (ontologia, taxonomia, tesauros, etc.). A organização da informação digital, com formatos e conteúdos diferenciados, novas ferramentas como as tags, surgem com características de compartilhamento de informação e recursos, assim como o SKOS, uma forma de ontologia leve. O estudo indicou mudanças na forma de buscar e organizar a informação digital e tendências para o ensino na área de Organização da Informação e do Conhecimento.

Palavras-chave: Informação digital, Sistemas de Organização do Conhecimento,

Folksonomia, Navegação na web.

Abstract: It shows the knowledge organization systems (KOS) and their formats, standards, norms and trends in order to relate these systems with the organization of digital information. Bibliographical survey was conducted in international databases in the area of Information Science (LISA and ISTA), on multidisciplinary bases (Web of Science and Scopus), and on national databases (BRAPCI and SCIELO). From the literature found brings the definition of knowledge organization system, differentiates the types of language as controlled vocabulary, indexing language, classification systems and categories, taxonomy and discusses the contribution of these systems to web browsing. It also shows the folksonomy, practice on the Internet to classify a concept by assigning a tag, which can be created by any user willing to tag information. Informality in the allocation of these terms is the most notable feature. The web context directs new looks to the concept of controlled vocabulary, with media formats and important content for this change. Among the tools available, the SKOS (Simple Knowledge Organization System) allows to represent any kind of knowledge organization system by RDF, with scope is extended to almost all the controlled vocabularies. In this format, the elements of a vocabulary are represented by concepts including semantic, hierarchical and associative relationships are established. The concepts labels are attached in different languages. It was found that in the area of literature exists concept and terminology diversity and recurrence of texts aimed at defining basic concepts (ontology, taxonomy, thesaurus, etc.). The organization of digital information, with

(3)

different formats and content, new tools such as tags, come with information sharing features and resources as well as the SKOS, a form of lightweight ontology. The study indicated changes in the way of seeking and organizing digital information and trends for teaching in the Organization area of Information and Knowledge.

Keywords: Digital information, Knowledge Organizing Systems, Folksonomy, Web

browsing.

Introdução

A informação digital, em grande variedade de formatos e em diversas tipologias, desde documentos de texto e imagem para públicos como o infanto-juvenil, documentos para a área científico-acadêmica e para grupos especializados, até fotos, filmes, jogos, e outros recursos audiovisuais, incluindo documentos institucionais, probatórios e arquivísticos entre outros, deve ser organizada e disponibilizada para acesso e uso.

Os repositórios, bases e bibliotecas digitais desenvolvidas para recuperação da informação, que utilizam algum tipo de sistema de organização do conhecimento aumentam a eficiência da pesquisa por assunto. Estes sistemas incluem todos os tipos de esquemas para organização da informação como os sistemas de classificação e categorização, listas de cabeçalhos de assunto, controle de autoridades, vocabulários estruturados, tesauros, taxonomias e esquemas emprestados de outras áreas como as redes semânticas e as ontologias (HODGE, 2000).

Os sistemas de organização do conhecimento (SOC em português ou KOS, knowledge organization systems) são utilizados nas bibliotecas tradicionais ou virtuais, podem ser classificações ou vocabulários controlados utilizados pelos arquivos e museus, sejam analógicos ou digitais, e podem também atender nas áreas institucionais, empresariais e comerciais com as taxonomias usadas na organização de sites de empresas. A construção de SOCs e a elaboração de linguagens documentárias exigem conhecimentos específicos que incluem padrões, normas, formatos, contribuições da Linguística, da Lógica e da Computação, considerando também que devem ser aplicados a registros de metadados.

(4)

O projeto de pesquisa do Programa Ensinar com Pesquisa da Universidade de São Paulo em 2014 intitulado “Elaboração de vocabulário controlado: ensino, normas e tendências na área de Organização da Informação e do Conhecimento”, desenvolvido no Departamento de Biblioteconomia e Documentação, atual Departamento de Informação e Cultura da Escola de Comunicações e Artes da Universidade de São Paulo, buscou identificar e estudar formatos, padrões, normas e tendências para sistemas de organização do conhecimento visando aprimorar o ensino de linguagens documentárias e da elaboração de vocabulários controlados. Este trabalho tem por objetivo apresentar questões, identificadas na literatura da área, relacionadas com os sistemas de organização do conhecimento que incluem as linguagens documentárias e os vocabulários controlados na organização da informação digital.

Metodologia

Foi realizada pesquisa bibliográfica em bases de dados internacionais da área de Ciência da Informação (LISA e ISTA), em bases multidisciplinares (Web of Science e SCOPUS), e em bases nacionais (BRAPCI e SCIELO) com estratégias de busca relacionadas aos sistemas de organização do conhecimento, buscando palavras como “linguagens documentárias”, “vocabulários controlados” “sistemas de classificação” em seus aspectos de definição, ensino e tendências. A base de dados LISA foi a que trouxe mais resultados, provavelmente por ser indexada com um tesauro e a busca permitiu estratégia detalhada. Foram identificados artigos e trabalhos de eventos sobre vocabulário controlado, as normas específicas, tesauros, SKOS, interoperabilidade, construção e uso de linguagens, ensino destes sistemas e o uso da folksonomia como alternativa ou complemento para a informação digital. A partir do levantamento bibliográfico realizou-se a seleção, leitura e discussão do material encontrado.

Sistemas de organização do conhecimento

Verificou-se na literatura variações quanto à terminologia relacionada aos sistemas de organização do conhecimento no que se refere a vocabulário controlado, linguagens documentárias e linguagens de indexação, além de que

(5)

existe dificuldade na definição de termos como conceito, taxonomia, folksonomia e outros.

Para Leise (2008), um vocabulário controlado se diferencia de uma lista de indexação por diversos fatores: tempo para a elaboração, finalidade, forma de elaboração, etc. Ademais, as características essenciais de um vocabulário controlado são as relações entre seus termos, como o controle de sinonímia, a estrutura hierárquica e a relação associativa.

Neste sentido, percebe-se que o autor segue a terminologia adotada pela norma norte-americana ANSI/NISO Z39.19 para sistemas de organização do conhecimento que considera como tipos de vocabulário controlado: os sistemas de classificação, as linguagens de indexação, o anel de sinônimos, o controle de autoridade, a taxonomia e os tesauros. Leise (2008), explica os tipos de vocabulário controlado: anel de sinônimo (consiste em termos que são sinônimos); lista de autoridade (quando um dos termos do anel de sinônimo é designado como ‘termo preferido’); taxonomia (trata-se da hierarquização de termos genéricos e termos específicos); e tesauros (contém todas as características de uma hierarquia, mais as relações associativas entre termos).

A norma ANSI/NISO Z39.19 define linguagem de indexação como sendo um vocabulário controlado ou sistema de classificação e suas regras para aplicação, linguagem usada para a representação dos conceitos tratados nos documentos, que são denominados objetos de conteúdo ou entidades que contêm dados/informação, para a recuperação destes objetos em um sistema de armazenamento e recuperação da informação. Para Hedden (2008), vocabulário controlado é uma lista de termos para a elaboração da indexação e da categorização. É controlado porque define o termo a ser utilizado na indexação. Sua importância é visível, mais facilmente, quando tratamos da recuperação de informações.

Já os sistemas de classificação são definidos como um método de organização caracterizado por um conjunto de princípios pré-estabelecidos com sistema de notação e estrutura hierárquica de relacionamento entre as entidades (NATIONAL INFORMATION STANDARDS ORGANIZATION, 2010).

A norma ANSI/NISO Z39.19 define vocabulário controlado como uma lista de termos explicitados e controlados, sendo que seus termos não podem ter ambiguidade e devem ter definições que não sejam redundantes. A norma informa ainda que este objetivo nem sempre é atingido na prática, mas existem duas regras

(6)

que precisam ser minimamente seguidas: no caso de um termo ser usado para conceitos diferentes, utiliza-se um qualificador para explicitar o conceito e resolver a ambiguidade; quando vários termos são utilizados com o mesmo significado, um deles deve ser identificado como termo preferido no vocabulário e os outros termos são listados com sinônimos. Por sua vez, a definição de anéis de sinônimos refere-se a um grupo de termos que são considerados equivalentes para proposições de recuperação, e neste entendemos que a norma está considerando um recurso de recuperação para informação digital. Os tesauros são vocabulários controlados estruturados cuja hierarquia e relações entre os termos são mostradas de forma clara e identificados por indicadores padronizados, que devem ser empregados reciprocamente (NATIONAL INFORMATION STANDARDS ORGANIZATION, 2010).

Também, de acordo com Hedden (2008), o tesauro que é uma ferramenta que contempla, além do conceito de vocabulário controlado, uma estrutura hierárquica que fornece informações sobre cada termo e seus relacionamentos, possui no conceito de faceta, uma importante categorização e estruturação (LEISE, 2008).

A norma ISO 25964-1 (2011) denominada Tesauros e interoperabilidade com outros vocabulários, em sua parte 1 sobre Tesauro para recuperação da informação define vocabulário controlado também como uma lista prescrita de termos, títulos ou códigos, cada um representando um conceito. Esta norma recente mostra-se bastante completa e em sua estrutura contém um glossário com termos e definições utilizados, tabelas de símbolos e abreviações em inglês e outros idiomas, conceitos e objetivos do tesauro, regras para capitalização, pontuação e caracteres especiais, critérios para escolha de termos, uso de nomes e abreviaturas, definições quanto a conceitos simples, complexos, sinônimos e ambíguos, relações de equivalência no contexto monolíngue e equivalência entre linguagens, relações hierárquicas e associativas. Incluí informações sobre apresentação, layout, gestão para construção e atualização de tesauro, diretrizes para gestão de software, modelos de dados, formatos e protocolos.

Traz como definição de tesauro controlado e vocabulário estruturado, listas nas quais os conceitos são representados por termos, organizados de forma que as relações entre conceitos são explícitas e os termos preferidos são acompanhados por entradas de termos não preferidos para sinônimos e quase sinônimos. A norma também informa que a proposta do tesauro é guiar tanto o indexador como o

(7)

pesquisador para selecionarem o mesmo termo preferido ou uma combinação de termos preferidos para representar o assunto do documento, e complementa que por este motivo o tesauro é otimizado pela navegação do pesquisador e pela cobertura terminológica do domínio tratado (INTERNATIONAL STANDARD ORGANIZATION, 2011).

Clarke e Zeng (2012), em artigo sobre a evolução do tesauro, lembram que a recuperação da informação com o uso do tesauro surge em um trabalho pioneiro nos anos 60 com o TEST (Thesaurus of Engineering and Scientific Terms) nos Estados Unidos, que incluía regras e convenções para seu desenvolvimento. Nos anos 70, os princípios e práticas para a construção de tesauros tiveram a contribuição das normas internacionais ISO 2788 e 5964 e de normas nacionais como a ANSI/NISO Z39.19 e as normas inglesas BS 5723 e BS 6723. Ocorreram atualizações sucessivas nas normas, e no caso das normas ISO, foram substituídas pelas normas ISO 25964 parte 1 e 2, considerando a oportunidade de estender a recuperação da informação para os recursos interconectados no ambiente digital.

Os princípios dos vocabulários controlados e dos tesauros foram revistos nas normas publicadas a partir de 2010 para atender de forma clara e lógica as aplicações nos computadores que temos hoje, segundo as mesmas autoras que salientam a necessidade de explicitar a diferença entre os conceitos para a pesquisa da informação e os termos expressos na estratégia de busca. Para a performance na Web Semântica, os softwares precisam de um modelo de dados explícito que permita distinguir entre termos e conceitos.

Na linha dos estudos da Documentação, de origem francesa, proposta por Gardin na década de 60, uma linguagem de indexação é chamada de linguagem documentária, e trata-se de “um conjunto de termos, providos ou não de regras sintáticas, utilizadas para representar conteúdos de documentos técnico-científicos com fins de classificação ou busca retrospectiva de informações (GARDIN et al., 1968, apud CINTRA et al, 2002).

Considerando a recorrência de textos trazendo as definições terminológicas das ferramentas de organização da informação e do conhecimento, que indicam a necessidade de sistematização conceitual, elaboramos um quadro síntese dos termos utilizados na área e suas definições (Quadro 1).

(8)

Quadro 1 - Definições para Sistemas de Organização do Conhecimento e esquemas

Termos Definição Fonte

Sistemas de Organização do Conhecimento

Sistemas que incluem todos os tipos de esquemas para organização da

informação como os sistemas de classificação e categorização, listas de cabeçalhos de assunto, controle de autoridades, vocabulários estruturados, tesauros, taxonomias e esquemas emprestados de outras áreas como as redes semânticas e as ontologias.

(HODGE, 2000)

Anéis de sinônimos Grupo de termos que são considerados

equivalentes para proposições de recuperação.

ANSI/NISO Z39.19-2005 (R2010)

Vocabulário controlado Lista de termos explicitados e controlados, sendo que seus termos não podem ter ambiguidade e devem ter definições que não sejam redundantes.

ANSI/NISO Z39.19-2005 (R2010)

Linguagem de indexação Vocabulário controlado ou sistema de

classificação e suas regras para aplicação, linguagem usada para a representação dos conceitos tratados nos documentos.

ANSI/NISO Z39.19-2005 (R2010)

Linguagem documentária Conjunto de termos, providos ou não de

regras sintáticas, utilizadas para representar conteúdos de documentos técnico-científicos com fins de

classificação ou busca retrospectiva de informações.

(GARDIN et al., 1968, apud CINTRA et al, 2002).

Sistemas de classificação Método de organização caracterizado por um conjunto de princípios pré-estabelecidos com sistema de notação e estrutura hierárquica de

relacionamento entre as entidades.

ANSI/NISO Z39.19-2005 (R2010)

Tesauro 1. Listas nas quais os conceitos são

representados por termos, organizados de forma que as relações entre

conceitos são explícitas e os termos preferidos são acompanhados por entradas de termos não preferidos para sinônimos e quase sinônimos.

ISO 25964-1 (2011)

2. Vocabulários controlados

estruturados cuja hierarquia e relações entre os termos são mostradas de forma clara e identificados por indicadores padronizados, que devem ser empregados reciprocamente.

ANSI/NISO Z39.19-2005 (R2010)

Fonte: elaborado pelos autores.

A linha de pesquisa sobre Documentação está presente em estudos realizados no Brasil a partir de 1980 que deu continuidade ao investimento em linguística realizado por Gardin, mas, segundo Smit (2015), com “ênfase na

(9)

terminologia, visando questões relacionadas ao controle de vocabulário e o poder comunicacional dos produtos da análise documentária”. Ainda de acordo com a autora, havia desde a década de 60 e continua existindo a “necessidade de teorização das linguagens documentárias, ou seja, as metalinguagens específicas dos ambientes de tratamento da informação”. Esta necessidade fez com que Gardin apresentasse a estrutura e composição de uma linguagem documentária contendo um léxico, relações paradigmáticas e relações sintagmáticas. Para Smit (2015), “aquilo que até aquele momento muitos faziam baseados no bom-senso, passou a contar com uma teoria, fortemente ancorada na linguística”.

A influência da Documentação, como linha de pesquisa e de ensino de linguagens documentárias ocorre também na Espanha, onde pudemos encontrar trabalhos sobre questões de léxico e documentação em Caro-Castro (2006), ensino de linguagem documentária hierárquica em Casabón (1995), bases teóricas em linguística e terminologia para ensino destas linguagens no trabalho de Espelt e no trabalho de Gonzalez, todos apresentados em evento da Espanha sobre o tema.

Reforçando a importância desse aporte teórico-metodológico para o desenvolvimento de linguagens documentárias, Mai (2008) relata que enquanto o design e a construção de vocabulários controlados têm sido apresentados em nível técnico detalhadamente ao longo das últimas décadas, o nível metodológico tem sido negligenciado.

Os autores pesquisados e as normas, como indicado na norma ISO 25964-1, e como também incluído na norma ANSI/NISO Z39.19-2005 (R2010), que traz um capítulo sobre Construção, Teste, Manutenção e Gestão de Sistemas para Vocabulários Controlados, concordam que a manutenção destas ferramentas deve ser constante, incluindo a adição/supressão de termos, atualização, controle de sinônimos, homônimos etc., e ainda como Leise (2008) salienta, existem novos conceitos e ideias para aprender sobre o tema, especialmente na área empresarial.

Taxonomia, navegação na web e marcadores

As mudanças na Organização e Representação do Conhecimento decorrentes das tecnologias da informação e comunicação e das informações digitais, incluídas nas normas e nos formatos de estrutura XML, no compartilhamento informacional e na arquitetura dos sites, permitiram o surgimento

(10)

de dois novos recursos para organização da informação: as taxonomias e os marcadores sociais.

Segundo Hedden (2008), embora o termo taxonomia esteja sendo utilizado indiscriminadamente há um bom tempo, podemos defini-la como um vocabulário controlado com estrutura hierárquica, mas isenta da relação “termos relacionados” e outros requisitos do tesauro tradicional. Na norma ASI/NISO, a taxonomia é uma coleção de termos de vocabulário controlado organizados em uma estrutura hierárquica onde cada termo está localizado em uma ou mais relação do tipo pai/filho ou geral/específica em relação a outros termos (NATIONAL INFORMATION STANDARDS ORGANIZATION, 2010).

No universo da web, convivem os vocabulários controlados em repositórios de informação digital, as taxonomias nos sites empresariais, institucionais e comerciais, bem como os marcadores sociais utilizados pelos próprios usuários em redes sociais, blogs, catalógos de biblioteca, jornais e outros sistemas de informação que oferecem este recurso conhecido com folksonomia, indexação social ou indexação colaborativa.

A folksonomia, palavra composta dos termos folks e taxonomy, é prática muito comum da internet, e refere-se a classificar um conceito atribuindo-lhe um termo, denominado tag. A informalidade na atribuição desses termos é a sua característica mais notável e Noruzi (2006) reforça que abre a porta para toda uma nova maneira de reunir e organizar informações etiquetando e categorizando os recursos da web, pois pode ser criação de qualquer usuário da internet disposto a classificar ou atribuir uma etiqueta para alguma informação.

Entendemos que a vantagem do uso da folksonomia é que pode trazer a linguagem do usuário, portanto da comunidade discursiva, e a terminologia da área e neste sentido pode contribuir com a recuperação da informação e com a identificação de termos para uma linguagem documentária.

Noruzi (2006), como outros que tratam do tema, apresenta quatro desvantagens da folksonomia: polissemia, sinônimos, plural e especificidade da etiqueta. Pela polissemia, um mesmo termo contém diversos significados, o que gera ambiguidade no tagueamento; pelos sinônimos, termos diferentes representam o mesmo conceito, atribuindo inconsistência a essa prática; quanto ao plural, a revocação pode ser mínima, pois só uma determinada combinação traz resultados; já na especificidade da etiqueta, diversos termos são utilizados na representação,

(11)

cada um a sua forma e assim, desde termos gerais até alguns bem específicos, podem se referir ao mesmo conceito.

O contexto web também direciona novos olhares ao conceito de vocabulário controlado com novos formatos de mídia e novos conteúdos apresentando-se como importantes para essa mudança sendo o desenvolvimento da internet, as bibliotecas interligadas pela rede e as novas ferramentas como os três fatores a contribuir para o aperfeiçoamento do vocabulário controlado na era digital (AZIZ, 2011).

Nos sistemas de informação, os pesquisadores fazem suas buscas tanto com termos de indexação como com combinações de palavras não pertencentes a um tesauro, e isto ocorre, segundo Fidel (1992) por que os termos são preferência em detrimento de combinações de palavras nos seguintes casos: a) se quer especificidade; b) o termo é muito bem definido; c) o termo aparece com frequência em artigos e trabalhos do gênero que se pesquisa; d) só com o uso de termos se obtém resultados. Para a autora, quando pesquisadores utilizam descritores, eles têm motivos para fazê-lo: já fizeram pesquisa semelhante; é óbvio o uso de um descritor para a pesquisa, ou seja, não há por que utilizar combinações; a dinâmica da base de dados exige isso.

Como já mencionamos a utilização da terminologia das linguagens de especialidade, o que acontece quando o usuário busca um termo conhecido e bem definido em sua área de atuação, para a busca nas bases de dados e para elaboração de linguagens documentárias, vocabulários controlados e taxonomias mostram-se como uma ferramenta poderosa para a recuperação da informação na web.

As ocorrências dos dois tipos de pesquisa mostra que não há razão para se optar por um tipo de pesquisa ou outro, visto que todos os pesquisadores utilizam as duas formas possíveis. Além disso, a área de cada pesquisador influencia notavelmente o tipo de busca: enquanto na área médica se utilizou descritores de vocabulário controlado, na área de ciências a preferência foi pela associação de palavras, segundo o estudo de Fidel (1992). A relação quantidade de bases a se consultar está diretamente relacionada ao uso ou não de descritores: em ciência, mais bases devem ser consultadas; portanto, torna-se mais complicada a consulta ao tesauro de cada uma delas. A qualidade da base de dados e do tesauro mostrou-se fundamental para a escolha entre um método ou outro. O estudo de Fidel não é recente, mas a situação quanto ao uso e disponibilidade de tesauro em plataformas

(12)

multibases de pesquisa científica não sofreu grandes modificações. Como recurso novo nestes sistemas, podemos destacar a auto complementação de termos e/ou lista de sugestão de termos para pesquisa.

Leise (2008) lembra que uma lista de termos e relacionamentos é projetada para: coletar informação similar; auxílio aos autores na etiquetagem de conteúdo; capacitar usuários para localizar a informação que eles precisam através da “tradução” da linguagem dos usuários para a linguagem armazenada da informação (ou seja, a linguagem do sistema). A qualquer momento quando escolhemos usar uma palavra ao invés de outra, estamos controlando vocabulário. Por exemplo, um website pode listar ‘roupas para homens’, e o cliente escolhe o termo ‘roupas masculinas’ ou ‘ vestimentas para homens’. Neste caso, o uso de anéis de sinônimos são recursos que podem facilitar o acesso à informação. Quando uma série de escolhas é feita e o vocabulário resultante mostra certas características, então um vocabulário controlado foi criado. O autor explica os relacionamentos entre termos como sendo: a sinonímia (o mais básico relacionamento entre termos); a relação hierárquica entre termos (termos genéricos e termos específicos) e a relação associativa (relação entre termos).

Os vocabulários controlados são frequentemente usados para organizar websites ou outros conteúdos, tornando-se taxonomia de navegação. Neste caso, os termos tornam-se etiquetas para as categorias de navegação e os diferentes níveis na hierarquia da navegação são espelhados pelos níveis de hierarquização que em geral devem ser criadas para refletir um contexto em particular.

A web semântica trouxe a possibilidade da interoperabilidade entre os vocabulários controlados e o recurso utilizado é um modelo conceitual de entidade-relacionamento-atributo desenvolvido pelo Consórcio W3C para os vocabulários. O SKOS (Simple Knowledge Organization System) pode ser considerado uma ontologia leve que tem alcançado êxito e diversas aplicações no âmbito deste contexto (PASTOR-SÁNCHEZ, MARTÍNEZ-MÉNDEZ, RODRÍGUEZ-MUÑOZ, 2012).

Em comparação com outras soluções fornecidas, tais como esquemas XML ad-hoc, ontologias que podem ser mais complexas que o Topic Maps, o SKOS, segundo os autores, oferece uma alternativa cuja aplicação é simples e rápida (desde que as relações entre os termos já estejam definidas).

Assim, para estes autores, o SKOS se define formalmente como uma ontologia OWL-full que permite representar qualquer tipo de sistema de organização

(13)

do conhecimento mediante RDF. Seu âmbito de aplicação se estende praticamente a totalidade dos vocabulários controlados: classificações, tesauros, cabeçalhos de assunto, taxonomias, tesauros, glossários, etc.

No SKOS, os elementos de um vocabulário se representam mediante conceitos entre os quais se estabelecem relações semânticas, hierárquicas e associativas. Aos conceitos se associam etiquetas em diferentes idiomas incluindo: etiquetas preferidas que sejam equivalentes aos descritores em um tesauro, onde um mesmo conceito só pode ter uma etiqueta preferida em cada idioma; as etiquetas alternativas que são similares aos não-descritores e permitem enriquecer semanticamente um vocabulário definindo vários pontos de acesso a um conceito; as etiquetas ocultas que não são visíveis diretamente aos usuários e são utilizadas para processamento de aplicações em informática.

Para Vatant (2010), os vocabulários controlados e tesauros desenvolvidos pelos bibliotecários para suporte à busca de informação e à indexação podem, segundo os especialistas da organização do conhecimento, ser aproveitados para a busca inteligente, o que os sistemas automáticos com algoritmos estatísticos não conseguem atingir. Este autor lembra que o SKOS foi desenvolvido desde 2005 através do diálogo entre as bibliotecas e as comunidades da Web Semântica visando permitir a migração dos vocabulários tradicionais, embora não tenha sido desenhado apenas para estes vocabulários, mas para atender uma grande variedade de sistemas de organização do conhecimento. Informa ainda que desde 2009, o SKOS foi utilizado para a migração de diversas linguagens documentárias como o RAMEAU da Biblioteca Nacional da França, a LCSH da Biblioteca do Congresso Norte-Americano, o AGROVOC da FAO e o EUROVOC da União Européia sendo que a integração dos vocabulários pode agregar valor às aplicações da Web Semântica.

Considerações finais

Verificou-se que na literatura ainda não existe consenso quanto à terminologia relacionada a vocabulário controlado e linguagens documentárias, incluindo a definição de termos como conceito, taxonomia e outros, bem como a recorrência de textos que visam a definição de conceitos básicos.

Na organização da informação digital, com formatos e conteúdos diferenciados, novas ferramentas como as tags, surgem com características de compartilhamento

(14)

de informação e recursos da folksonomia, assim como o SKOS, uma forma de ontologia leve que estabelece relações semânticas, hierárquicas e associativas em diferentes idiomas permitindo a interoperabilidade entre linguagens documentárias e demais tipos de sistemas de organização do conhecimento e agrega valor aplicações da Web Semântica.

As mudanças ocasionadas pelas tecnologias de informação e comunicação e a disponibilização de informação em ambiente digital suscitam a discussão, o aprofundamento de questões que norteiam o ensino de linguagens documentárias no contexto web, e deve ser levado em consideração, pois se percebe na prática, o entendimento vago destes temas quando a aplicação de conceitos, recursos e tecnologias dos sistemas de organização do conhecimento, principalmente na realidade brasileira.

Referências

AZIZ, Muhamad Faizal Abd. Controlled vocabulary in a digital age. Kekal Abadi, v.29, n.1, 2011.

CARO-CASTRO, Carmen. Léxico y documentación: del lenguaje natural al lenguaje documental. In: ROMAN, Maria Teresa Fuentes; REY, Jesus Torres del. Nuestras palabras: entre el léxico y la traducción. Frankfurt: Veuver, p. 127-145, 2006. CASABÓN, A. I. S. La enseñanza de los lenguajes documentales de estructura jerárquica: el ejemplo de la CDU. Proceedings of the first ISKO-Spain conference, Madrid 4-5 Nov 1993. Saragossa,1995. p.191-198, 1995.

CINTRA, A. M et al. Para entender as linguagens documentárias. 2. ed. São Paulo, Polis, 2002.

CLARKE, Stella G. Dextre; ZENG, Marcia Lei. From ISO 2788 to ISO 25964: the evolution of thesaurus standarts towards interoperability and data modeling. ISQ n. 1, v. 24, p. 20-26, 2012.

ESPELT, C. Bases teoricas en la ensenanza de lenguajes documentales/

Theoretical backgrounds of documentary languages instruction. Proceedings of the first ISKO-Spain conference, Madrid 4-5 Nov 1993. Saragossa,1995. p.125-34, 1995. FIDEL, Raya. Who needs controlled vocabulary? Special Libraries, winter 1992. GONZALEZ, J. A. M. La ensenanza de los lenguajes documentales en las

(15)

Teaching documentary languages in library and information sciences studies: problems and trends. Proceedings of the first ISKO-Spain conference, Madrid 4-5 Nov 1993. Saragossa,1995. p.113-123, 1995.

HEDDEN, H. Controlled vocabularies, thesauri and taxonomies. The Indexer, v. 26, n. 1, p. 33-34, 2008.

INTERNATIONAL STANDARD ORGANIZATION. Information and documentation: thesauri and interoperability with other vocabularies; part 1, thesauri for information retrieval. Geneva: ISO, 2011. 152 p. (ISO 25964-1:2011).

LEISE, F. Controlled vocabularies: an introduction. The Indexer, v. 26, n. 3, p. 121-126, 2008.

MAI, Jens-Erik. Actors, domains, and constraints in the design and construction of controlled vocabularies. Knowledge organization. v. 35, n. 1, p. 16-29, 2008. NATIONAL INFORMATION STANDARDS ORGANIZATION. Guidelines for the

construction, format, and management of monolingual controlled vocabularies.

Baltimore: NISO, 2010. 172 p.(ANSI/NISO Z39.19-2005 R2010).

NORUZI, A. Folksonomies: (Un)Controlled Vocabulary? Knowledge Organization, 33(4): 199-203, 2006.

PASTOR-SÁNCHEZ, J.; MARTÍNEZ-MÉNDEZ, F.;RODRÍGUEZ-MUÑOZ, J. Aplicación de SKOS para la interoperabilidad de vocabulários controlados en el entorno de linked open data. . El profesional de la información, v. 21, n. 3, p. 245-253, mayo-junio 2012.

SMIT, J. W. N. A busca pela eficiência na representação da informação e do conhecimento: desdobramentos posteriores no pensamento de Gardin In: GUIMARÃES, J. A. C e Dodebei, V.; (orgs). Organização do conhecimento e

diversidade cultural. Marília: ISKO-Brasil: FUNDEPE, 2015. 835 p. (Série: Estudos

Avançados em Organização e Representação do Conhecimento, v. 3).

VATANT, B. Conversión de los vocabulários bibliotecários a la Web Semântica, y vice-versa: um viaje em el que todos ganan. Anales. World Library and information Congress: 76ª. Conferencia General y Asamblea de IFLA, 10-15 ago. 2010,

Referências

Documentos relacionados

O trabalho apresentado neste artigo propõe um método para projeto de hiperdocumentos educacionais, denominado EHDM, que contempla os autores com um modelo conceitual que possui

No sentido de reverter tal situação, a realização deste trabalho elaborado na disciplina de Prática enquanto Componente Curricular V (PeCC V), buscou proporcionar as

O objetivo deste trabalho foi avaliar épocas de colheita na produção de biomassa e no rendimento de óleo essencial de Piper aduncum L.. em Manaus

Capítulo 7 – Novas contribuições para o conhecimento da composição química e atividade biológica de infusões, extratos e quassinóides obtidos de Picrolemma sprucei

maior número de artigos na PubMed para a área de medicina geral e fami- liar (New England Journal of Medicine, JAMA, Lancet, Annals of Internal Medicine, PLoS Medicine, British

• A falta de registro do imóvel no CAR gera multa, impossibilidade de contar Áreas de Preservação Permanente (APP) na Reserva Legal (RL), restrição ao crédito agrícola em 2018

• Não garantir condições dignas e saudáveis para os trabalhadores pode gerar graves consequências para o empregador, inclusive ser enquadrado como condições análogas ao

• A falta de registro do imóvel no CAR gera multa, impossibilidade de contar Áreas de Preservação Permanente (APP) na Reserva Legal (RL), restrição ao crédito agrícola em 2018