• Nenhum resultado encontrado

Aula05_Estruturas de descrição e intercambio

N/A
N/A
Protected

Academic year: 2021

Share "Aula05_Estruturas de descrição e intercambio"

Copied!
42
0
0

Texto

(1)

Estruturas de Descrição e

Intercâmbio da Informação

(2)

• Catalogação

• Metadados

– Definição e aplicação

– Padrões de Metadados

• Dublin Core • MARC

• Padrão de formatação de registros bibliográficos

para intercâmbio

– MARC

– Dublin Core\XML

• Protocolos de interoperabilidade

– OAI-PMH

– Z39.50

Roteiro

(3)

Catalogação

• Atividade de descrição e representação da

informação para fins de recuperação.

(4)

Metadados: Definição

• O que são metadados?

– Metadados ou Metainformação, são dados sobre outros

dados. Um item de um metadado descreve a natureza

de um dado.

– Conjunto de características e atributos (dados) que

representam ou descrevem um objeto.

• Exemplos: Autor, Título, Descritor, Data, etc.

– As bibliotecas digitais geram novos desafios para

descrição de documentos

• Formatos digitais heterogêneos

• Formatos complexos como hipertextos e arquivos multimídia

– Padrões internacionais de metadados:

• Dublin Core • MARC.

(5)

Metadados: Aplicação

• Para que servem os metadados?

– Os metadados geralmente têm a finalidade de se

localizar, avaliar, descobrir, analisar ou citar o objeto a

que se referem, não se limitando a essas funções.

– Imprescindível para a recuperação da informação.

• No contexto das bibliotecas digitais e sistemas de

gerenciamento de documentos os metadados servem

para:

– Ajudar o usuário a identificar os recursos digitais;

– Ajudar o usuário a reconhecer os padrões de acesso ao conteúdo; – Ajudar o usuário a se utilizar desses recursos;

(6)

Metatags – utilizado no cabeçalho do documento

HTML encapsulado;

• Exemplo:

http://www.w3schools.com/tags/tag_meta.asp

Arquivo separado de meta-informação (fichas

catalográficas);

• Exemplo:

http://www.dlib.org/dlib/september16/silva/09silva.html

• http://www.dlib.org/dlib/september16/silva/09silva.meta.xml

Embutidos nos objetos digitais utilizando XML

• Exemplo: pdf, jpeg, documentos do MS Office.

Como é utilizado?

(7)

Metadados

• Categorização:

– Metadados Descritivos;

• Indexação, identificação e recuperação de recursos

– Metadados Estruturais;

• Visualizaçao e folheio de recursos digitais (divisão em capítulos, relação entre objetos)

– Metadados administrativos;

• Informações para gestão do objeto digital, gestão de direitos de propriedade intelectual, recursos para usuários remotos

(8)

Metadados

(9)

Padrões de Metadados

• Quem projeta padrões de metadados:

– Biblioteca do Congresso Americano (Library of

Congress)

– OCLC (Online Computer Library Center)

– TEI: Text Encoding Initiative (http://www.tei-c.org/)

– Nordic Web Index

– IMS Project (Instructional Management System

Project)

– LOM (Learning Object Metadata do IEEE LTSC)

– PREMIS (PREservation Metadata Implementation

(10)

Principais Padrões de Metadados

• Existem padrões de metadados aceitos internacionalmente:

– MARC (Machine Readable Cataloging), http://www.loc.gov/marc/

– Dublin Core Metadata Initiative, http://purl.org/dc,

http://dublincore.org/documents/dces/ , http://purl.pt/201/1/ (Dublin Core em português)

• Outros padrões:

– ETD-ms (an Interoperability Metadata Standard for Electronic Theses and Dissertations)

– ONIX – Online Information Exchange, padrão internacional para a representação de informações sobre livros, periódicos e vídeos em formato eletrônico, http://www.editeur.org/onix.html

– RSLP – Research Support Libraries Programme Colletion

Description - descrição de coleções de documentos – bibliográficas, arquivísticas, museológicas, textuais ou iconográficas -,

(11)

Padrão Dublin Core

• OCLC (Online Computer Library Center) e a NCSA (National Center for Supercomputing Aplications)

se reúnem em 1995 na cidade de

Dublin (Ohio, EUA) para mapear, estudar e definir campos de

dados. Ao fim do estudo, chegou-se a um conjunto mínimo de

campos ficou conhecido como Dublin Core (DC).

Dublin Core é um padrão para descrição de recursos de

informação multidomínios. Ele provê um conjunto de

convenções simples e padronizado para descrever recursos online

de modo a facilitar a sua localização.

Dublin Core é largamente utilizado para descrever materiais

digitais tais como vídeo, som, imagem, texto e médias compostas

como páginas web.

Implementações do Dublin Core tipicamente fazem uso de XML

e são baseados no Framework de Descrição de Recursos (RDF).

O padrão Dublin Core foi definido pelo Padrão NISO

(12)

Dublin Core

• Padrão MARC que contem mais de 800 elementos

de metadados (alguns bastante específicos)

• A proposta do padrão DC é definir um conjunto

de metadados simples e intuitivo capaz de

descrever diferentes documentos digitais

• O DC oferece 15 elementos de metadados

definidos em cooperação internacional

(13)

Dublin Core

• Conjunto mínimo de elementos de

metadados compreendidos por qualquer

comunidade

• Extensões do padrão DC são encorajadas

para atender a necessidades específicas

– Ex.:

• MTD-BR

• Conjunto mínimo de elementos devem ser

mantido nas extensões

(14)

Dublin Core - Elementos

Conteúdo

Propried. Intelectual Instanciação

Title

Subject

Description

Language

Source

Relation

Coverage

Creator

Contributor

Publisher

Rights

Date

Format

Identifier

Type

(15)

Dublin Core - Elementos

1. Title (Título)

2. Creator (Criador - autor, responsável pelo recurso) 3. Subject (Assunto)

4. Publisher (Publicador - quem torna o documento disponível na Internet) 5. Contributor (Contribuidor - outros colaboradores - por ex. editores,

tradutores,etc)

6. Description (Descrição - descrição, resumo, sumário) 7. Date (Data - data de publicação)

8. Type (Tipo do recurso - homepage, romance, poesia, software, dicionário) 9. Format (Formato formato do arquivo que contém o documento eletrônico

-texto, PDF, LaTex, HTML, WORD ou outro)

10. Indetifier (Identificador - geralmente o URL de um documento eletrônico) 11. Relation (Relação - relacionamentos com outros documentos, por ex. versões) 12. Source (Origem - fonte ou recurso de onde o recurso que esta sendo descrito

deriva)

13. Language (Idioma do recurso)

14. Coverage (Abrangência ou cobertura - espacial ou temporal, sobre que lugar, ou sobre que época o recurso se refere)

15. Rights (Direitos - texto livre especificando qualquer restrição referente a direitos autorais)

(16)

Dublin Core

Recomendações da Dublin Core Metadata Initiative (DCMI):

DCMES – Dublin Core Metadata Element Set

Um conjunto de 15 elementos de metadados cujo objetivo é permitir e facilitar a recuperação ou descoberta de recursos eletrônicos. (Woodley, 2001)

Norma ISO, ANSI/NISO,

ISO Standard 15836-2003 (February 2003):http://www.niso.org/international/SC4/n515.pdf

NISO Standard Z39.85-2007 (May 2007): http://www.niso.org/standards/resources/Z39-85-2007.pdf

DCQ – Dublin Core Qualifiers

Refinamento de elemento - especifica com mais detalhe o significado de um elemento

Esquema de codificação – Um esquema que ajuda na interpretação do valor de um elemento. Incluem vocabulários controlados e notações formais ou regras de

(17)

Dublin Core – Qualificadores de

refinamento de elemento

• Servem para especificar e tornar mais claro o

significado de um elemento do conjunto Dublin

Core.

• Outros termos associados ao elemento que

especificam com mais precisão o seu significado.

• Um elemento refinado partilha o significado do

elemento não qualificado, mas com um âmbito

mais restrito.

• Por exemplo, o elemento Date tem como

qualificadores de refinamento de elemento os

termos Issued, Created, Available, Modified e

Valid

(18)

Dublin Core – Qualificadores de

refinamento de elemento

• Existem três tipos de qualificadores:

– TYPE - de refinamento do elemento - tornam mais específico o significado do elemento

• Ex: qualificador de Contributor: Orientador

• DC.Contributor.Orientador: “Barreto, Aldo de Albuquerque” – SCHEME - de especificação do padrão dos valores (“schema” em

inglês) – especificam qual é o padrão ou tabela de valores de onde é retirado o conteúdo do elemento. Exemplos seriam: as siglas dos estados brasileiros, classificações como CDD e CDU, entradas de um vocabulário controlado, etc)

• Ex: padrão de valores de Subject: tabela de áreas doconhecimento do CNPq

• DC.Subject schema=“Area-CNPq”: “ciência da informação” – LANGUAGE - de idioma - especifica o idioma do conteúdo de um

campo

(19)
(20)
(21)
(22)

22

(23)

MARC21

• Criado em 1965 pela Library of Congress (LC)

• O formato Machine Reading Catalogue (MARC) é

um conjunto de códigos e designações de

conteúdos definido para codificar registros para a

compreensão deles na maquina.

• Tem como finalidade intercâmbio de dados, ou

seja, importar e exportar dados de diferentes bases

de dados através de softwares desenvolvidos

especificamente para isto.

(24)

Formato MARC

• Repare na seguinte ficha catalográfica

Robredo, Jaime

Documentação de hoje e amanhã: uma abordagem informatizada da Biblioteconomia e dos sistemas de informação / Jaime Robredo, Murilo B. da Cunha. --São Paulo : Global, 1994

400 p. Il.

ISBN 85-200-047-0

Edição fac-similar da 2a. edição publicada pelo autor

1. Biblioteconomia 2. Documentação. 3. Informação -Sistemas de armazenamento e recuperação 4. Redes de informação I. Cunha, Murilo B. da II. Título. III. Título Documentação de hoje e amanhã: uma abordagem

informatizada da Biblioteconomia e dos sistemas de informação.

(25)

Formato MARC

• As informações da ficha anterior são representadas num registro de um arquivo computacional como nas duas últimas colunas da

tabela seguinte, segundo as convenções do formato MARC

(Machine Readable Cataloging)

• Repare que cada informação que compõe a ficha, ao invés de ser identificada por um título é identificada por um número ou etiqueta numérica

INFORMAÇÕES ETIQUETA CONTEÚDO

Classificação (CDD) 082 00 $a 0025.04

Primeiro Autor 100 1b $a Robredo, Jaime

245 10 $a Documentação de hoje e amanhã

$b uma abordagem informatizada da Biblioteconomia e dos sistemas de informação Jaime Robredo, Murilo B. da Cunha

$c 260 bb $a São Paulo $b Global $c 1994 300 bb $a 400 p. $b Il

Notas 500 bb $a Edição fac-similar da 2a. edição publicada pelo autor 650 b1 $a Biblioteconomia

650 b1 $a Documentação

650 b1 $a Informação - sistemas de armazenamento e recuperação Redes de informação

650 b1 $a

Segundo Autor 700 1b $a Cunha, Murilo B. da Título, subtítulo e indicação de responsabilidade Imprenta Descrição física Assunto

(26)

26

(27)

Formato MARC

• A descrição de um documento é feita através de

CAMPOS, como autor, título, imprenta,etc.

• Um Campo no MARC é um conjunto de

informações identificado por uma etiqueta

numérica de três dígitos

• A lista completa dos campos MARC pode ser

vista em

MARC 21 Concise Bibliographic

Format

– http://www.loc.gov/marc/concise/

• Os campos do MARC se organizam em grandes

Áreas de Descrição

(28)

Formato MARC

• Áreas de Descrição

– 0XX – Área de Informações de controle, informações codificadas

– 1XX – Área de Entrada principal

– 2XX – Área de Títulos, menção de responsabilidade, edição, imprenta

– 3XX – Área de Descrição física – 4XX – Área de Série

– 5XX – Área de Notas – 6XX – Área de Assuntos

– 7XX – Área de Entradas secundárias (menos por Série) – 8XX – Área de Entradas secundárias por Série

(29)

Formato MARC

• Hierarquia das informações que compõe um registro MARC - As diversas informações que compõe cada campo são identificadas pela ETIQUETA, os INDICADORES e os CÓDIGOS DOS

SUBCAMPOS. Estes elementos em conjunto são chamados de designadores de conteúdo

– Todo campo é precedido de dois indicadores, ind1 e ind2. Os indicadores tem significado diferentes para cada campo

Área 0XX Área 1XX Área 2XX Área 3XX Etiq. 100 Ind11 Ind21 Indicadores Subcampos $aCamões, Luiz de$d1524?-1580 Etiq. 245 Etiq. 260 Os conteúdos dos dados estão nos subcampos Indicam como as informações do campo devem ser processadas Identifica o campo

(30)

Formato MARC

ex: 24510$aDocumentação de hoje e de amanhã$buma abordagem informatizada da biblioteconomia e dos sistemas de

informação$cJaime Robredo e Murilo Cunha

etiqueta (245-Título principal) indicadores

ind1-1 Gera entrada adicional pelo Título

ind2-0 Número de caracteres a desprezar na alfabetação subcampo a-título

subcampo b-subtítulo

subcampo c-indicação de responsabilidade

(31)

Formato Bibliográfico de

Intercâmbio

• O MARC além de padrão de metadados é também um formato bibliográfico de intercâmbio.

• Formato Bibliográfico de Intercâmbio é um conjunto de padrões para representação de informações bibliográficas em meio legível por computador com a finalidade de intercâmbio de dados entre bibliotecas • A ESTRUTURA de um FORMATO pode ser melhor entendida se

vista como composta de diferentes NÍVEIS:

– Nível Físico: estrutura dos registros bibliográficos em meio magnético;

• Formato Comum de Comunicação (ISO2709)

– Nível do Elenco de campos, (subcampos e indicadores) e seus identificadores;

• Campos do MARC

– Nível das Regras de transcrição de informações nos campos (como registrar as informações bibliográficas nos diferentes campos);

(32)

Formato MARC

• FORMATOS DE REPRESENTAÇÃO DE DADOS

©Marcondes

Formato de

intercâmbio

Formato de

entrada

Formato interno

de armazenamento

Formato de

exibição

Programa cliente de catalogação Programa Servidor do Catálogo Programa de geração do formato de intercâmbio

Literatura a

ser registrada

Programa Cliente de Consulta

(33)

[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO

Registro bibliográfico no momento da criação/edição

pelo programa cliente de catalogação

Os diferentes programas de um SAB

envolvidos no processamento de registros bibliográficos reformatam os dados,

(34)

[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO

Registro bibliográfico como é armazenado no formato

interno pelo servidor de catálogo do SAB

Os diferentes programas de um SAB

envolvidos no processamento de registros bibliográficos reformatam os dados,

(35)

[FORMATO MARC – ESTRUTURA DE UM FORMASTO BIBLIOGRÁFICO

Registro bibliográfico no formato de exibição, na

consulta a um catálogo automatizado

Os diferentes programas de um SAB

envolvidos no processamento de registros bibliográficos reformatam os dados,

(36)

[FORMATO MARC – ESTRUTURA DE UM FORMATO BIBLIOGRÁFICO

Registro bibliográfico no formato de intercâmbio –

estrutura do registro segundo a Norma ISO2709

Os diferentes programas de um SAB

envolvidos no processamento de registros bibliográficos reformatam os dados,

(37)

Formatos Bibliográficos de

Intercâmbio

• Além do MARC, os padrões de metadados

baseados em Dublin Core geralmente utilizam

XML para formar formatos bibliográficos de

intercâmbio.

• Exemplo:

– Metadados Dublin Core => Registro Dublin Core\XML

• Neste caso o formato físico de intercâmbio são

arquivos XML que são legíveis por máquinas e

humanos.

• Geralmente, não há especificação de padrões de

regras de transcrição, o que deve ser especificado

pelo gestor da informação na política de

(38)

Aspectos Considerados MARC Dublin Core Comunidade Utilizadora do Padrão - Bibliotecários, Arquivistas Museus, etc. - Bibliotecários

-Autores de documentos da WEB em geral

Facilidade de utilização do Padrão

- Exige treinamento prévio e conhecimento especializado

- Não exige treinamento prévio, nem conhecimento especializado

Cobertura doPadrão -Documentos, vídeos, gravações sonoras, mapas, periódicos, etc.

- Objetos do tipo documentos (DLOs)

Sintaxe / formato

para transporte dos Metadados

- ISO 2709 - Não tem sintaxe definida, usa arquivos XML.

Estrutura dos Elementos - Resgistros (formato interno binário)

- Pares (nome-atributo, valor-atributo)

Utilização de regras de conteúdo para os Elementos de dados

- AACR2, ISBD, Dewey,etc. (uso obrigatório)

- Podem ser usadas (não são obrigatórias)

Protocolos Associados Z39.50 Z39.50, OAI-PMH

METADADOS

(39)

Protocolos de intercâmbio de

registros bibliográficos

• Protocolos de intercâmbio de dados - visando a

troca de dados entre programas via rede de

computadores, definem o formato, a ordem de

envio e recebimento de mensagens entre

programas e ações realizadas.

• Um programa é chamado interoperável se

permitem a troca de dados com outros programas

via esta categoria de protocolos.

• Dois protocolos se destacam quanto ao

intercâmbio de registros bibliográficos:

– OAI-PMH

– Z39.50

(40)

Considerações Finais

• Utilizar padrões de metadados para descrever um acervo

permitirá uma descrição mais precisa dos itens, melhor

acesso aos itens na recuperação da informação, bem como

uma melhor conversão retrospectiva do catálogo.

• Disponibilizar informações sobre um acervo através de um

servidor que suporte Z39.50 ou OAI-PMH garantirá com

isso muito mais visibilidade para o acervo, o acervo poderá

ser consultado por programas clientes Z39.50 ou portais

agregadores que façam uso do OAI-PMH (de qualquer

parte do mundo).

• Através de programas clientes de consulta compatíveis

com o protocolo Z39.50, os usuários podem consultar

catálogos de bibliotecas gerenciados por servidores Z39.50

por todo o mundo.

(41)

Referências

• Feitosa, A. Organização da informação na Web. Thesaurus, 2006. (Capítulo 3)

• Tammaro, A.M.; Salarelli, A. Catalogação e metadados. In.:

__________. A biblioteca digital. Brasília: Briquet de Lemos, 2006. • RODRIGUEUZ, Eva Méndez. Metadatos y recuperación de

información: estândares, problemas y aplicabilidad em bibliotecas

digitales. Astúrias. Ediciones Treal, S.L. 429p. 2002 (páginas 123 a 176)

• SOUZA, M.I.F.; VENDRUSCULO, L.G.;e MELO, G.C. Metadados para a descrição de recursos de informação eletrônica: utilização do padrão Dublin Core. Ciência da Informação, Brasília, vol.29, no.1, p.93-102. 2000.

• Marcondes, Carlos H. DIRETRIZES PARA AVALIAÇÃO E SELEÇÃO DE SISTEMAS DE AUTOMAÇÃO DE BIBLIOTECAS (Slides). Universidade Federal Fluminense/Departamento de Ciência da Informação. Agosto de 2008.

(42)

Sites interessantes

• Dublin Core Metadata Iniciative

http://dublincore.org/

• MARC

http://www.loc.gov/marc/

• Open Archives Initiative

http://www.openarchives.org/

• Networked Digital Library of Theses e

Dissertation

http://www.ndltd.org/

• D-Lib Magazine

http://www.dlib.org/

Referências

Documentos relacionados

As key results, we found that: the triceps brachii muscle acts in the elbow extension and in moving the humerus head forward; the biceps brachii, pectoralis major and deltoid

The strict partition problem is relaxed into a bi-objective set covering problem with k-cliques which allows over-covered and uncovered nodes.. The information extracted

Even for the usual Becker-D¨ oring equations with input of monomers, the long time behaviour of solutions is not completely understood, [12], and so it seemed advisable to start with

Atualmente os currículos em ensino de ciências sinalizam que os conteúdos difundidos em sala de aula devem proporcionar ao educando o desenvolvimento de competências e habilidades

 Random storage - refere-se à alocação de um espaço de stock de forma aleatória, segundo o espaço disponível no momento de chegada dos produtos (Petersen e Aase,

Em estudos mais aprofundados, tem-se a análise dinâmica não linear geométrica de estruturas laminadas modeladas com elementos tridimensionais de barra considerando o efeito

Assim sendo, no momento de recepção de encomendas é necessário ter em atenção vários aspetos, tais como: verificar se a encomenda é para a farmácia; caso estejam presentes

Os doentes paliativos idosos que permanecem nas instituições privadas são encaminhados pelos hospitais em que estavam ou internados pelos próprios familiares