Estruturas de Descrição e
Intercâmbio da Informação
• Catalogação
• Metadados
– Definição e aplicação
– Padrões de Metadados
• Dublin Core • MARC• Padrão de formatação de registros bibliográficos
para intercâmbio
– MARC
– Dublin Core\XML
• Protocolos de interoperabilidade
– OAI-PMH
– Z39.50
Roteiro
Catalogação
• Atividade de descrição e representação da
informação para fins de recuperação.
Metadados: Definição
• O que são metadados?
– Metadados ou Metainformação, são dados sobre outros
dados. Um item de um metadado descreve a natureza
de um dado.
– Conjunto de características e atributos (dados) que
representam ou descrevem um objeto.
• Exemplos: Autor, Título, Descritor, Data, etc.
– As bibliotecas digitais geram novos desafios para
descrição de documentos
• Formatos digitais heterogêneos
• Formatos complexos como hipertextos e arquivos multimídia
– Padrões internacionais de metadados:
• Dublin Core • MARC.
Metadados: Aplicação
• Para que servem os metadados?
– Os metadados geralmente têm a finalidade de se
localizar, avaliar, descobrir, analisar ou citar o objeto a
que se referem, não se limitando a essas funções.
– Imprescindível para a recuperação da informação.
• No contexto das bibliotecas digitais e sistemas de
gerenciamento de documentos os metadados servem
para:
– Ajudar o usuário a identificar os recursos digitais;
– Ajudar o usuário a reconhecer os padrões de acesso ao conteúdo; – Ajudar o usuário a se utilizar desses recursos;
•
Metatags – utilizado no cabeçalho do documento
HTML encapsulado;
• Exemplo:
http://www.w3schools.com/tags/tag_meta.asp
•
Arquivo separado de meta-informação (fichas
catalográficas);
• Exemplo:
http://www.dlib.org/dlib/september16/silva/09silva.html
• http://www.dlib.org/dlib/september16/silva/09silva.meta.xml
•
Embutidos nos objetos digitais utilizando XML
• Exemplo: pdf, jpeg, documentos do MS Office.
Como é utilizado?
Metadados
• Categorização:
– Metadados Descritivos;
• Indexação, identificação e recuperação de recursos
– Metadados Estruturais;
• Visualizaçao e folheio de recursos digitais (divisão em capítulos, relação entre objetos)
– Metadados administrativos;
• Informações para gestão do objeto digital, gestão de direitos de propriedade intelectual, recursos para usuários remotos
Metadados
Padrões de Metadados
• Quem projeta padrões de metadados:
– Biblioteca do Congresso Americano (Library of
Congress)
– OCLC (Online Computer Library Center)
– TEI: Text Encoding Initiative (http://www.tei-c.org/)
– Nordic Web Index
– IMS Project (Instructional Management System
Project)
– LOM (Learning Object Metadata do IEEE LTSC)
– PREMIS (PREservation Metadata Implementation
Principais Padrões de Metadados
• Existem padrões de metadados aceitos internacionalmente:
– MARC (Machine Readable Cataloging), http://www.loc.gov/marc/
– Dublin Core Metadata Initiative, http://purl.org/dc,
http://dublincore.org/documents/dces/ , http://purl.pt/201/1/ (Dublin Core em português)
• Outros padrões:
– ETD-ms (an Interoperability Metadata Standard for Electronic Theses and Dissertations)
– ONIX – Online Information Exchange, padrão internacional para a representação de informações sobre livros, periódicos e vídeos em formato eletrônico, http://www.editeur.org/onix.html
– RSLP – Research Support Libraries Programme Colletion
Description - descrição de coleções de documentos – bibliográficas, arquivísticas, museológicas, textuais ou iconográficas -,
Padrão Dublin Core
• OCLC (Online Computer Library Center) e a NCSA (National Center for Supercomputing Aplications)
se reúnem em 1995 na cidade de
Dublin (Ohio, EUA) para mapear, estudar e definir campos de
dados. Ao fim do estudo, chegou-se a um conjunto mínimo de
campos ficou conhecido como Dublin Core (DC).
•
Dublin Core é um padrão para descrição de recursos de
informação multidomínios. Ele provê um conjunto de
convenções simples e padronizado para descrever recursos online
de modo a facilitar a sua localização.
•
Dublin Core é largamente utilizado para descrever materiais
digitais tais como vídeo, som, imagem, texto e médias compostas
como páginas web.
•
Implementações do Dublin Core tipicamente fazem uso de XML
e são baseados no Framework de Descrição de Recursos (RDF).
•
O padrão Dublin Core foi definido pelo Padrão NISO
Dublin Core
• Padrão MARC que contem mais de 800 elementos
de metadados (alguns bastante específicos)
• A proposta do padrão DC é definir um conjunto
de metadados simples e intuitivo capaz de
descrever diferentes documentos digitais
• O DC oferece 15 elementos de metadados
definidos em cooperação internacional
Dublin Core
• Conjunto mínimo de elementos de
metadados compreendidos por qualquer
comunidade
• Extensões do padrão DC são encorajadas
para atender a necessidades específicas
– Ex.:
• MTD-BR
• Conjunto mínimo de elementos devem ser
mantido nas extensões
Dublin Core - Elementos
Conteúdo
Propried. Intelectual Instanciação
Title
Subject
Description
Language
Source
Relation
Coverage
Creator
Contributor
Publisher
Rights
Date
Format
Identifier
Type
Dublin Core - Elementos
1. Title (Título)2. Creator (Criador - autor, responsável pelo recurso) 3. Subject (Assunto)
4. Publisher (Publicador - quem torna o documento disponível na Internet) 5. Contributor (Contribuidor - outros colaboradores - por ex. editores,
tradutores,etc)
6. Description (Descrição - descrição, resumo, sumário) 7. Date (Data - data de publicação)
8. Type (Tipo do recurso - homepage, romance, poesia, software, dicionário) 9. Format (Formato formato do arquivo que contém o documento eletrônico
-texto, PDF, LaTex, HTML, WORD ou outro)
10. Indetifier (Identificador - geralmente o URL de um documento eletrônico) 11. Relation (Relação - relacionamentos com outros documentos, por ex. versões) 12. Source (Origem - fonte ou recurso de onde o recurso que esta sendo descrito
deriva)
13. Language (Idioma do recurso)
14. Coverage (Abrangência ou cobertura - espacial ou temporal, sobre que lugar, ou sobre que época o recurso se refere)
15. Rights (Direitos - texto livre especificando qualquer restrição referente a direitos autorais)
Dublin Core
•
Recomendações da Dublin Core Metadata Initiative (DCMI):
DCMES – Dublin Core Metadata Element Set
Um conjunto de 15 elementos de metadados cujo objetivo é permitir e facilitar a recuperação ou descoberta de recursos eletrônicos. (Woodley, 2001)
Norma ISO, ANSI/NISO,
ISO Standard 15836-2003 (February 2003):http://www.niso.org/international/SC4/n515.pdf
NISO Standard Z39.85-2007 (May 2007): http://www.niso.org/standards/resources/Z39-85-2007.pdf
DCQ – Dublin Core Qualifiers
Refinamento de elemento - especifica com mais detalhe o significado de um elemento
Esquema de codificação – Um esquema que ajuda na interpretação do valor de um elemento. Incluem vocabulários controlados e notações formais ou regras de
Dublin Core – Qualificadores de
refinamento de elemento
• Servem para especificar e tornar mais claro o
significado de um elemento do conjunto Dublin
Core.
• Outros termos associados ao elemento que
especificam com mais precisão o seu significado.
• Um elemento refinado partilha o significado do
elemento não qualificado, mas com um âmbito
mais restrito.
• Por exemplo, o elemento Date tem como
qualificadores de refinamento de elemento os
termos Issued, Created, Available, Modified e
Valid
Dublin Core – Qualificadores de
refinamento de elemento
• Existem três tipos de qualificadores:
– TYPE - de refinamento do elemento - tornam mais específico o significado do elemento
• Ex: qualificador de Contributor: Orientador
• DC.Contributor.Orientador: “Barreto, Aldo de Albuquerque” – SCHEME - de especificação do padrão dos valores (“schema” em
inglês) – especificam qual é o padrão ou tabela de valores de onde é retirado o conteúdo do elemento. Exemplos seriam: as siglas dos estados brasileiros, classificações como CDD e CDU, entradas de um vocabulário controlado, etc)
• Ex: padrão de valores de Subject: tabela de áreas doconhecimento do CNPq
• DC.Subject schema=“Area-CNPq”: “ciência da informação” – LANGUAGE - de idioma - especifica o idioma do conteúdo de um
campo
22
MARC21
• Criado em 1965 pela Library of Congress (LC)
• O formato Machine Reading Catalogue (MARC) é
um conjunto de códigos e designações de
conteúdos definido para codificar registros para a
compreensão deles na maquina.
• Tem como finalidade intercâmbio de dados, ou
seja, importar e exportar dados de diferentes bases
de dados através de softwares desenvolvidos
especificamente para isto.
Formato MARC
• Repare na seguinte ficha catalográfica
Robredo, Jaime
Documentação de hoje e amanhã: uma abordagem informatizada da Biblioteconomia e dos sistemas de informação / Jaime Robredo, Murilo B. da Cunha. --São Paulo : Global, 1994
400 p. Il.
ISBN 85-200-047-0
Edição fac-similar da 2a. edição publicada pelo autor
1. Biblioteconomia 2. Documentação. 3. Informação -Sistemas de armazenamento e recuperação 4. Redes de informação I. Cunha, Murilo B. da II. Título. III. Título Documentação de hoje e amanhã: uma abordagem
informatizada da Biblioteconomia e dos sistemas de informação.
Formato MARC
• As informações da ficha anterior são representadas num registro de um arquivo computacional como nas duas últimas colunas da
tabela seguinte, segundo as convenções do formato MARC
(Machine Readable Cataloging)
• Repare que cada informação que compõe a ficha, ao invés de ser identificada por um título é identificada por um número ou etiqueta numérica
INFORMAÇÕES ETIQUETA CONTEÚDO
Classificação (CDD) 082 00 $a 0025.04
Primeiro Autor 100 1b $a Robredo, Jaime
245 10 $a Documentação de hoje e amanhã
$b uma abordagem informatizada da Biblioteconomia e dos sistemas de informação Jaime Robredo, Murilo B. da Cunha
$c 260 bb $a São Paulo $b Global $c 1994 300 bb $a 400 p. $b Il
Notas 500 bb $a Edição fac-similar da 2a. edição publicada pelo autor 650 b1 $a Biblioteconomia
650 b1 $a Documentação
650 b1 $a Informação - sistemas de armazenamento e recuperação Redes de informação
650 b1 $a
Segundo Autor 700 1b $a Cunha, Murilo B. da Título, subtítulo e indicação de responsabilidade Imprenta Descrição física Assunto
26
Formato MARC
• A descrição de um documento é feita através de
CAMPOS, como autor, título, imprenta,etc.
• Um Campo no MARC é um conjunto de
informações identificado por uma etiqueta
numérica de três dígitos
• A lista completa dos campos MARC pode ser
vista em
MARC 21 Concise Bibliographic
Format
– http://www.loc.gov/marc/concise/
• Os campos do MARC se organizam em grandes
Áreas de Descrição
Formato MARC
• Áreas de Descrição
– 0XX – Área de Informações de controle, informações codificadas
– 1XX – Área de Entrada principal
– 2XX – Área de Títulos, menção de responsabilidade, edição, imprenta
– 3XX – Área de Descrição física – 4XX – Área de Série
– 5XX – Área de Notas – 6XX – Área de Assuntos
– 7XX – Área de Entradas secundárias (menos por Série) – 8XX – Área de Entradas secundárias por Série
Formato MARC
• Hierarquia das informações que compõe um registro MARC - As diversas informações que compõe cada campo são identificadas pela ETIQUETA, os INDICADORES e os CÓDIGOS DOS
SUBCAMPOS. Estes elementos em conjunto são chamados de designadores de conteúdo
– Todo campo é precedido de dois indicadores, ind1 e ind2. Os indicadores tem significado diferentes para cada campo
Área 0XX Área 1XX Área 2XX Área 3XX Etiq. 100 Ind11 Ind21 Indicadores Subcampos $aCamões, Luiz de$d1524?-1580 Etiq. 245 Etiq. 260 Os conteúdos dos dados estão nos subcampos Indicam como as informações do campo devem ser processadas Identifica o campo
Formato MARC
ex: 24510$aDocumentação de hoje e de amanhã$buma abordagem informatizada da biblioteconomia e dos sistemas de
informação$cJaime Robredo e Murilo Cunha
etiqueta (245-Título principal) indicadores
ind1-1 Gera entrada adicional pelo Título
ind2-0 Número de caracteres a desprezar na alfabetação subcampo a-título
subcampo b-subtítulo
subcampo c-indicação de responsabilidade
Formato Bibliográfico de
Intercâmbio
• O MARC além de padrão de metadados é também um formato bibliográfico de intercâmbio.
• Formato Bibliográfico de Intercâmbio é um conjunto de padrões para representação de informações bibliográficas em meio legível por computador com a finalidade de intercâmbio de dados entre bibliotecas • A ESTRUTURA de um FORMATO pode ser melhor entendida se
vista como composta de diferentes NÍVEIS:
– Nível Físico: estrutura dos registros bibliográficos em meio magnético;
• Formato Comum de Comunicação (ISO2709)
– Nível do Elenco de campos, (subcampos e indicadores) e seus identificadores;
• Campos do MARC
– Nível das Regras de transcrição de informações nos campos (como registrar as informações bibliográficas nos diferentes campos);
Formato MARC
• FORMATOS DE REPRESENTAÇÃO DE DADOS
©Marcondes
Formato de
intercâmbio
Formato de
entrada
Formato interno
de armazenamento
Formato de
exibição
Programa cliente de catalogação Programa Servidor do Catálogo Programa de geração do formato de intercâmbioLiteratura a
ser registrada
Programa Cliente de Consulta[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO
Registro bibliográfico no momento da criação/edição
pelo programa cliente de catalogação
Os diferentes programas de um SAB
envolvidos no processamento de registros bibliográficos reformatam os dados,
[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO
Registro bibliográfico como é armazenado no formato
interno pelo servidor de catálogo do SAB
Os diferentes programas de um SAB
envolvidos no processamento de registros bibliográficos reformatam os dados,
[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO
Registro bibliográfico no formato de exibição, na
consulta a um catálogo automatizado
Os diferentes programas de um SAB
envolvidos no processamento de registros bibliográficos reformatam os dados,
[FORMATO MARC – ESTRUTURA DE UM FORMATO BIBLIOGRÁFICO
Registro bibliográfico no formato de intercâmbio –
estrutura do registro segundo a Norma ISO2709
Os diferentes programas de um SAB
envolvidos no processamento de registros bibliográficos reformatam os dados,
Formatos Bibliográficos de
Intercâmbio
• Além do MARC, os padrões de metadados
baseados em Dublin Core geralmente utilizam
XML para formar formatos bibliográficos de
intercâmbio.
• Exemplo:
– Metadados Dublin Core => Registro Dublin Core\XML
• Neste caso o formato físico de intercâmbio são
arquivos XML que são legíveis por máquinas e
humanos.
• Geralmente, não há especificação de padrões de
regras de transcrição, o que deve ser especificado
pelo gestor da informação na política de
Aspectos Considerados MARC Dublin Core Comunidade Utilizadora do Padrão - Bibliotecários, Arquivistas Museus, etc. - Bibliotecários
-Autores de documentos da WEB em geral
Facilidade de utilização do Padrão
- Exige treinamento prévio e conhecimento especializado
- Não exige treinamento prévio, nem conhecimento especializado
Cobertura doPadrão -Documentos, vídeos, gravações sonoras, mapas, periódicos, etc.
- Objetos do tipo documentos (DLOs)
Sintaxe / formato
para transporte dos Metadados
- ISO 2709 - Não tem sintaxe definida, usa arquivos XML.
Estrutura dos Elementos - Resgistros (formato interno binário)
- Pares (nome-atributo, valor-atributo)
Utilização de regras de conteúdo para os Elementos de dados
- AACR2, ISBD, Dewey,etc. (uso obrigatório)
- Podem ser usadas (não são obrigatórias)
Protocolos Associados Z39.50 Z39.50, OAI-PMH
METADADOS
Protocolos de intercâmbio de
registros bibliográficos
• Protocolos de intercâmbio de dados - visando a
troca de dados entre programas via rede de
computadores, definem o formato, a ordem de
envio e recebimento de mensagens entre
programas e ações realizadas.
• Um programa é chamado interoperável se
permitem a troca de dados com outros programas
via esta categoria de protocolos.
• Dois protocolos se destacam quanto ao
intercâmbio de registros bibliográficos:
– OAI-PMH
– Z39.50
Considerações Finais
• Utilizar padrões de metadados para descrever um acervo
permitirá uma descrição mais precisa dos itens, melhor
acesso aos itens na recuperação da informação, bem como
uma melhor conversão retrospectiva do catálogo.
• Disponibilizar informações sobre um acervo através de um
servidor que suporte Z39.50 ou OAI-PMH garantirá com
isso muito mais visibilidade para o acervo, o acervo poderá
ser consultado por programas clientes Z39.50 ou portais
agregadores que façam uso do OAI-PMH (de qualquer
parte do mundo).
• Através de programas clientes de consulta compatíveis
com o protocolo Z39.50, os usuários podem consultar
catálogos de bibliotecas gerenciados por servidores Z39.50
por todo o mundo.
Referências
• Feitosa, A. Organização da informação na Web. Thesaurus, 2006. (Capítulo 3)
• Tammaro, A.M.; Salarelli, A. Catalogação e metadados. In.:
__________. A biblioteca digital. Brasília: Briquet de Lemos, 2006. • RODRIGUEUZ, Eva Méndez. Metadatos y recuperación de
información: estândares, problemas y aplicabilidad em bibliotecas
digitales. Astúrias. Ediciones Treal, S.L. 429p. 2002 (páginas 123 a 176)
• SOUZA, M.I.F.; VENDRUSCULO, L.G.;e MELO, G.C. Metadados para a descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, vol.29, no.1, p.93-102. 2000.
• Marcondes, Carlos H. DIRETRIZES PARA AVALIAÇÃO E SELEÇÃO DE SISTEMAS DE AUTOMAÇÃO DE BIBLIOTECAS (Slides). Universidade Federal Fluminense/Departamento de Ciência da Informação. Agosto de 2008.