Modelagem de
Modelagem de
Bibliotecas Digitais
Bibliotecas Digitais
Cristiano Roberto Cervi
Orientadora: Profª. Dr. Renata Galante
Co-orientador: Prof. Dr. José Palazzo M. de Oliveira
Universidade Federal do Rio Grande do Sul
Instituto de Informática – PPGC
Exame de Qualificação em Abrangência
Roteiro
Roteiro
Introdução
Fundamentos de Bibliotecas Digitais
Modelos para a Construção de Bibliotecas
Digitais
Comparação Entre os Modelos
Visão Geral da Tese
Introdu
Introdu
ç
ç
ão
ão
Ciência da Informa
Ciência da Informa
ç
ç
ão
ão
Ciência da Computa
Ciência da Computa
ç
ç
ão
ão
BIBLIOTECAS
BIBLIOTECAS
DIGITAIS
Introdu
Introdu
ç
ç
ão
ão
Objetos Digitais
Objetos Digitais
Servi
Servi
ç
ç
os
os
Usu
Usu
á
á
rios
rios
“
Uma biblioteca digital pode ser
Uma biblioteca digital pode ser
definida como uma cole
definida como uma cole
ç
ç
ão
ão
organizada de
organizada de
objetos digitais
objetos digitais
associada a um conjunto de
associada a um conjunto de
servi
servi
ç
ç
os
os
dispon
dispon
í
í
veis, visando
veis, visando
atender necessidades de
atender necessidades de
comunidades de
comunidades de
usu
usu
á
á
rios.
rios
.”
Introdu
Introdu
ç
ç
ão
ão
Conteúdo
Funcionalidades
Comunidades
Arquitetura
Políticas
Qualidade
Base de Dados
Base de Dados
Interface
Interface
Servi
Serviç
ços
os
Padrões
Metadados
Introdu
Introdu
ç
ç
ão
ão
Vantagens
Vantagens
Custo reduzido
Economia de espaço físico
Não há degradação física de objetos
Rápido acesso a novas informações
Compartilhamento do mesmo objeto
Facilidade de acesso
Serviços diferenciados
Preservação
Princ
Princ
í
í
pios para o Desenvolvimento de
pios para o Desenvolvimento de
Bibliotecas Digitais
Bibliotecas Digitais
Propostos por McCray and Gallagher (2001)
Baseados em experiência na construção de
bibliotecas digitais
Considera aspectos que são a base
Projeto
Execução
Manutenção
Os princípios aplicam-se a
Projetos de conversão de objetos digitais
Projetos em que os objetos foram criados digitalmente
Projetos de ambos os tipos
Alexa McCray
(Harvard)
Princ
Princ
í
í
pios para o Desenvolvimento de
pios para o Desenvolvimento de
Bibliotecas Digitais
Bibliotecas Digitais
Estar ciente sobre o direito dos dados
Estar ciente sobre o direito dos dados
Automatizar sempre que poss
Automatizar sempre que possí
ível
vel
Se preocupar com a persistência
Se preocupar com a persistência
Envolver as pessoas certas
Envolver as pessoas certas
Assegurar o acesso aberto
Assegurar o acesso aberto
Conhecer seu conte
Conhecer seu conteú
údo
do
Projetar sistemas
Projetar sistemas ú
úteis
teis
Esperar mudan
Esperar mudan
ças
ç
as
Garantir qualidade
Garantir qualidade
Adotar padrões
Adotar padrões
Metadados
Metadados
Um dado que possibilita a descrição ou definição
de outro
Padrões para Bibliotecas Digitais
Dublin Core
Dublin Core
(DC)
(DC)
Machine-Readable Cataloging (MARC)
Metadata Encoding and Transmission Specification
Dublin Core
Dublin Core
Conjunto de metadados para descrever objetos digitais (1995)
15 elementos
Open
Open
Archives
Archives
Initiative
Initiative
Significa "aberto" do ponto de vista da arquitetura
A base da iniciativa é o protocolo PMH
Protocol for Metadata Harvesting
Utiliza o padrão Dublin Core
Provedores de Dados (Data Providers)
Mantêm repositórios de metadados de documentos digitais
Forma de expor os metadados de seus documentos
Provedores de Serviços (Service Providers)
Oferecem buscas a metadados ou outros serviços
Provedor de Dados
Provedor de Dados
Provedor
Provedorde de ServiServiççosos
Requisições (HTTP) Metadados (XML) Harvester Metadados Repositório
Servi
Servi
ç
ç
o
o
Metadados (documentos)Open
Open
Archives
Archives
Initiative
Initiative
Coleta baseada em data
Apenas metadados após data especificada
Coleta baseadas em conjunto
OAI
OAI
-
-
PMH
PMH
Consiste de 6 requests (codificação em XML)
Identify
Recupera as informações sobre o provedor de dados
ListMetadataFormats
Recupera os formatos dos metadados
GetRecord
Recupera um registro do repositório
ListRecords
Coleta os metadados do repositório
ListIdentifiers
Retorna apenas os cabeçalhos dos registros
ListSets
Lista a estrutura do conjunto de um provedor de dados (árvore,
Modelos Para Bibliotecas Digitais
Modelos Para Bibliotecas Digitais
Open Digital Library (Suleman and Fox, 2001)
Abordagem 5S (Gonçalves et al., 2004)
Open Digital
Open Digital
Library
Library
(ODL)
(ODL)
Define um arcabouço
Serviços
Busca
Navegação
Recomendação
Consulta local
Consulta em outras bases
Hussein Suleman
(Virginia Tech)
ODL
ODL
ODL
ODL -
-
Union
Union
ODL
ODL -
-
Filter
Filter
ODL
ODL -
-
Search
Search
ODL
ODL -
-
Browse
Browse
ODL
ODL -
-
Recent
Recent
Combina metadados de m
Combina metadados de m
ú
ú
ltiplas fontes
ltiplas fontes
Formata os metadados fora do padrão
Formata os metadados fora do padrão
Oferece funcionalidade de busca
Oferece funcionalidade de busca
Fornece navega
Fornece navega
ç
ç
ão dirigida a categorias
ão dirigida a categorias
Apresenta
Apresenta
ú
ú
ltimos itens adicionados
ltimos itens adicionados
Componentes do arcabou
ODL
ODL
Visão geral da arquitetura
Visão geral da arquitetura
União de metadados de diferentes fontes
União de metadados de diferentes fontes
Componente de busca
ODL
ODL
Considerações
Utilização
CITIDEL
NDLTD
CSTC
Vantagem
Simplicidade
Define um mínimo de serviços
Desvantagem
Abordagem 5S
Abordagem 5S
Define um arcabouço para modelagem de
bibliotecas digitais através de 5 dimensões
Streams
Structures
Spaces
Scenarios
Societies
Marcos Gonçalves
(UFMG)
Edward Fox
(Virginia Tech)
Abordagem 5S
Abordagem 5S
Visão geral da abordagem 5S
Visão geral da abordagem 5S
services
searching browsing
indexing
Processo de Modelagem com 5S
Processo de Modelagem com 5S
Processo de modelagem de uma
Processo de modelagem de uma
biblioteca digital utilizando a abordagem 5S
Linguagem 5SL
Linguagem 5SL
Necessidade de formalizar a abordagem 5S
São geradas definições para cada uma das dimensões definidas
As dimensões são descritas como elementos XML
Transformar os modelos 5S em elementos 5SL
Para utilizar a linguagem 5SL não é necessário
Especialista em Engenharia de Software
Especialista em Ciência da Informação
Deve-se ter uma idéia conceitual clara das necessidades da
biblioteca digital
Vantagens
Redução do trabalho do projetista
Agilidade na fase de projeto
Ferramenta 5SGraph
Ferramenta 5SGraph
Ferramenta visual
Permite modelagem utilizando a abordagem 5S e a
linguagem 5SL
Possibilita a criação de instâncias de um modelo para a
biblioteca digital que esta sendo projetada
Generalização/Especialização
As saídas geradas pela ferramenta devem ser analisadas
por especialistas
Podem ser complementadas
Ferramenta 5SLGen
Ferramenta 5SLGen
Ferramenta para transformar os modelos de scenarios e
societies em código
O código pode ser utilizado para implementar a aplicação
correspondente
Utiliza uma biblioteca de componentes que implementa
operações básicas
Busca
Navegação
5S
5S
Considerações
Utilização
BDBComp
ETANA
Vantagens
Define um processo sequencial
Ferramentas auxiliares
Prevê requisitos de qualidade
Reusabilidade
Flexibilidade (exporta para UML)
Desvantagem
DELOS
DELOS
Rede de excelência em bibliotecas digitais
Grupo formado por pesquisadores de alguns países
Itália, Grécia, Reino Unido, Estados Unidos, Suíça
Criaram o Modelo DELOS de referência de bibliotecas
digitais
Divulgado em dezembro de 2007
Buscou normatizar fundamentos comuns para melhorar
a compreensão e estimular a evolução da área
Utiliza diagramas UML para modelagem
Padrão OAI-PMH, Dublin Core
DELOS
DELOS
Visão geral do modelo de referência DELOS
Visão geral do modelo de referência DELOS
DELOS
DELOS
Content
Refere-se aos dados que a biblioteca disponibiliza aos
usuários
É um conceito genérico para agregar todas as formas de
objetos de informação
DELOS
DELOS
User
Envolve todos os atores que interagem com a biblioteca
digital
User é um conceito genérico que inclui a representação e
DELOS
DELOS
Functionality
Encapsula todos os serviços que a biblioteca digital
oferece aos usuários
Prevê que uma biblioteca digital deve fornecer um
mínimo de funcionalidades
Registro de novos objetos
Busca
Navegação
Visam gerenciar as funções da biblioteca digital para
assegurar que elas reflitam as necessidades dos
usuários
DELOS
DELOS
Quality
Refere-se aos parâmetros que podem ser usados para
caracterizar e avaliar o conteúdo e o comportamento da
biblioteca digital
A qualidade deve ser medida pela satisfação dos
usuários pelos serviços oferecidos
Facilidade de navegação
Resposta satisfatória em buscas
Agilidade no arquivamento
Garantia de cumprimento das políticas
Acerto na recomendação
DELOS
DELOS
Policy
Representa o conjunto de condições, regras, termos e
regulamentações entre a biblioteca digital e usuários
Privacidade e confidencialidade de conteúdo
Direitos autorais
Leis governamentais
DELOS
DELOS
Architecture
Refere-se ao “sistema de biblioteca digital”
Conjunto de partes que formam o sistema
Funcionalidades
Usuários
Base de dados
DELOS
DELOS
Considerações
Utilização
Não encontrado
Vantagens
Desenvolvido por autoridades na área
Prevê requisitos de qualidade
Prevê um conjunto mínimo de serviços
Desvantagens
Imaturidade
Compara
Compara
ç
ç
ão Entre Modelos
ão Entre Modelos
X
Define um processo
X
X
Continuidade do modelo
X
X
Maturidade do modelo
X
Componentes auxiliares
X
X
X
Padrão OAI, XML e Dublin Core
X
X
X
Ambiente web
DELOS
DELOS
5S
5S
ODL
ODL
Visão Geral da Tese
Referências
Referências
(Livros e tutoriais)
(Livros e tutoriais)
Arms, W. Y. Digital Libraries.
http://www.cs.cornell.edu/wya/DigLib/index.html
Candela, L. et al. The DELOS Digital Library Reference Model.
http://www.delos.info/files/pdf/ReferenceModel/DELOS_DLReferenceModel_0.98.pdf
Digital Library na Wikipedia.
http://en.wikipedia.org/wiki/Digital_Library
Dublin Core.
http://dublincore.org
Fox, E.; Sornil, O. Digital Libraries. In: Ricardo Baeza-Yates and Berthier Ribeiro-Neto.
Modern Information Retrieval (415-432). Addison Wesley, 1999.
Heuser, C. A. Projeto de Banco de Dados. 6ª edição. Editora Bookman, 2008.
Lesk, M. Practical Digital Libraries. Morgan Kaufmann Publishers, 1997.
Lesk, M. Understanding Digital Libraries, Second Edition (The Morgan Kaufmann Series
in Multimedia and Information Systems). Morgan Kaufmann Publishers Inc., 2004.
Li, X.; Furht, B. Design and Implementation of Digital Libraries. In: Handbook of Internet
Computing, B. Furht, Ed. CRC Press, 2000.
Noy, N. F.; McGuinness, D. L. “Ontology Development 101: A Guide to Creating Your
First Ontology” (2001).
http://protege.stanford.edu/publications/ontology_development/ontology101.html
OAI. Open Archives Initiative.
http://www.dlib.vt.edu/projects/OpenArchives
Procópio, E. Construindo Uma Biblioteca Digital. Edições Inteligentes, 2005.
Sowa, J. F. Guided Tour of Ontology.
http://www.jfsowa.com/ontology/guided.htm
Witten, I. H.; Bainbridge, D. How to Build a Digital Library. The Morgan Kaufmann
Referências
Referências
(Artigos cient
(Artigos cient
í
í
ficos)
ficos)
Buchanan, G.; Bainbridge, D.; Don, K. J.; Witten, I. H. A New Framework for Building
Digital Library Collections. In Proceedings of the 5th ACM/IEEE Joint Conference on
Digital Libraries, Denver, CO, USA, 2005.
Fox, E. A.; Akscyn, R. M.; Furuta, R. K.; Leggett, J. J. Digital Libraries. Communications
of the ACM, 38(4):22-28, 1995.
Gonçalves, M. A.; Fox, E. A. 5SL - A Language for Declarative Specification and
Generation of Digital Libraries. In Proceedings of the Second ACM/IEEE Join
Conference on Digital Libraries, Portland, Oregon, 263-272, 2002.
Gonçalves, M. A.; Fox, E. A.; Watson, L. T.; Kipp, N. A. Streams, Structures, Spaces,
Scenarios, Societies (5S): A Formal Model for Digital Libraries. ACM Transactions on
Information Systems, 22(2): 270-312, 2004.
Laender, A. H. F.; Gonçalves, M. A.; Roberto, P. A. BDBComp: Building a Digital
Library for the Brazilian Computer Science Community. Proceedings of the 4th
ACM/IEEE-CS Joint Conference on Digital Libraries, Tuscon, AZ, USA, 2004.
McCray, A.; Gallagher, M. Principles for Digital Library Development. Communications
of the ACM, 44(5): 49-54, 2001.
Waters, D. J. What Are Digital Libraries? Digital Library Information Resources in
Modelagem de
Modelagem de
Bibliotecas Digitais
Bibliotecas Digitais
Cristiano Roberto Cervi
Orientadora: Profª. Dr. Renata Galante
Co-orientador: Prof. Dr. José Palazzo M. de Oliveira
Universidade Federal do Rio Grande do Sul
Instituto de Informática – PPGC
Exame de Qualificação em Abrangência
Slides Complementares
Introdu
Introdu
ç
ç
ão
ão
“
“
Bibliotecas digitais são compostas por cole
Bibliotecas digitais são compostas por cole
ç
ç
ões de objetos digitais,
ões de objetos digitais,
como, por exemplo, documentos, imagens, v
como, por exemplo, documentos, imagens, v
í
í
deos, mapas, etc.,
deos, mapas, etc.,
que oferecem servi
que oferecem servi
ç
ç
os aos seus usu
os aos seus usu
á
á
rios como pesquisa e
rios como pesquisa e
publica
publica
ç
ç
ão desses objetos.
ão desses objetos.
”
”
(Fox et al., 1995)
“
“
As bibliotecas digitais são as organiza
As bibliotecas digitais são as organiza
ç
ç
ões que fornecem os
ões que fornecem os
recursos, incluindo a equipe especializada, para selecionar,
recursos, incluindo a equipe especializada, para selecionar,
estruturar, oferecer o acesso intelectual, interpretar, distribu
estruturar, oferecer o acesso intelectual, interpretar, distribu
ir,
ir,
preservar a integridade e assegurar a persistência integral das
preservar a integridade e assegurar a persistência integral das
cole
cole
ç
ç
ões de trabalhos digitais, de modo que estejam prontamente e
ões de trabalhos digitais, de modo que estejam prontamente e
economicamente dispon
economicamente dispon
í
í
veis para o uso por uma comunidade
veis para o uso por uma comunidade
definida ou conjunto de comunidades.
definida ou conjunto de comunidades.
”
”
(Waters, 1998)
“
Uma biblioteca digital pode ser definida como uma cole
Uma biblioteca digital pode ser definida como uma cole
ç
ç
ão
ão
organizada de objetos digitais associada a um conjunto de servi
organizada de objetos digitais associada a um conjunto de servi
ç
ç
os
os
dispon
dispon
í
í
veis, visando atender necessidades de comunidades de
veis, visando atender necessidades de comunidades de
usu
Premissas Para Modelagem
Premissas Para Modelagem
A modelagem de uma biblioteca digital envolve
diversos aspectos relevantes
Tipos de dados
Texto
Imagem
Áudio
Vídeo
Banco de dados
Relacional
Multimídia
Geográfico
Premissas Para Modelagem
Premissas Para Modelagem
A modelagem de uma biblioteca digital envolve
diversos aspectos relevantes
Forma de acesso
Livre
Restrita
Interface
Padrão
Personalizada
Serviços disponíveis
Busca
Navegação
Auto-arquivamento
Personalização
Recomendação
Premissas Para Modelagem
Premissas Para Modelagem
A modelagem de uma biblioteca digital envolve
diversos aspectos relevantes
Disposição física
Standalone
Rede local
Web
Intranet
Tipos de ambientes
Administrativo
Usuário
Direitos autorais
Modelo ER
Modelo ER
Padrão para a modelagem conceitual de banco de
dados
É composto por três conceitos
Entidade
Atributo
Relacionamento
Utilização
Indicação de dados e seus relacionamentos da forma
como percebidos no mundo real
Independência de detalhes de representação de SGBDs
Tradução para qualquer modelo de SGBD
UML
UML
Unified Modeling Language
Linguagem de modelagem
Versão 2.0
13 diagramas
Modelagem estática
Casos de Uso, Classes, Objetos, Pacotes e Estrutura
Composta
Modelagem dinâmica
Atividades, Seqüência, Comunicação, Estados, Visão
Geral de Interação e Temporização
Modelagem Arquitetural
Ontologia
Ontologia
“
“
Ontologia
Ontologia
é
é
a descri
a descri
ç
ç
ão de conceitos e relacionamentos que
ão de conceitos e relacionamentos que
existem, para uma pessoa e para uma comunidade de
existem, para uma pessoa e para uma comunidade de
pessoas.
pessoas.
”
”
(Gruber, 1993)
“
“
Ontologia
Ontologia
é
é
o estudo de categorias de coisas que existem
o estudo de categorias de coisas que existem
ou podem existir em algum dom
ou podem existir em algum dom
í
í
nio.
nio.
”
”
(Sowa, 2005)
Uma ontologia pode ser entendida como uma definição
formal e explícita de conceitos com seus atributos, relações
e restrições
Utilização em bibliotecas digitais
Possibilita reuso de conhecimento do domínio
Separa o conhecimento do domínio do conhecimento
operacional
Proporciona análise do conhecimento do domínio
RDF
RDF
Resource Description Framework (Padrão W3C, de 1999)
Linguagem para representar informação na Internet
Modelo de dados com semântica formal
Utiliza o vocabulário URI e XML
Tem três componentes básicos
Recurso
Qualquer coisa que pode conter um URI, incluindo as
páginas da web, assim como elementos de um
documento XML
Propriedade
Um recurso que tenha um determinado nome e possa ser
utilizado como uma propriedade
Indicação
Combinação de um recurso, de uma propriedade e de um
Metadados
Metadados
Melhor identificação sobre os dados
“
Dados sobre os dados
”
Um dado que possibilita a descrição ou definição
de outro
Permite a recuperação de informações de forma
mais eficiente
Padrões para Bibliotecas Digitais
Dublin Core
Dublin Core
(DC)
(DC)
Machine-Readable Cataloging (MARC)
Metadata Encoding and Transmission Specification
Metadados
Metadados
Para distintas comunidades de usuários, o
conceito de metadados é diferente
Bibliotecários
Registros em um catálogo
Cientistas da computação
Parte do projeto do banco de dados
Esquemas relacionais
Proporcionam interoperabilidade entre bibliotecas
digitais
Conjunto mínimo de metadados
Tipo de arquiteturas compatíveis
Dublin Core
Dublin Core
–
–
representa
representa
ç
ç
ão em XML
ão em XML
<metadata>
<dc:title>BDTC - Uma Biblioteca Digital para Trabalhos de Conclusão de Curso</dc:title>
<dc:creator>Manica, Edimar</dc:creator>
<dc:creator>Cervi, Cristiano Roberto</dc:creator>
<dc:creator>Dorneles, Carina Friedrich</dc:creator>
<dc:subject>Biblioteca Digital</dc:subject>
<dc:subject>Metadados</dc:subject>
<dc:publisher>VII Simpósio de Informática do Planalto Médio</dc:publisher>
<dc:date>2007-09-002</dc:date>
<dc:format>Arquivo PDF</dc:format>
<dc:language>Português</dc:language>
</metadata>
OAI
Exemplos de Bibliotecas Digitais
Exemplos de Bibliotecas Digitais
Alexandria Digital Library
http://www.alexandria.ucsb.edu
Biblioteca Digital Brasileira de Computação
www.lbd.dcc.ufmg.br/bdbcomp
Biblioteca Digital de Trabalhos de Conclusão
www.inf.upf.br/bibdig
CiteSeer
http://citeseer.ist.psu.edu
Etana
http://digbase.etana.org:8080/etana/servlet/Start
The DBLP Computer Science Bibliography
http://www.informatik.uni-trier.de/~ley/db
National Library of Canada Electronic Collection
http://www.nlc-bnc.ca/index-e.html
The Collection of Computer Science Bibliographies
http://liinwww.ira.uka.de/bibliography/index.html
Abordagem 5S
Abordagem 5S
Streams
Tipos de dados multimídia suportados
Structures
Como a informação é estruturada e organizada
Metadados
Bancos de dados
Spaces
Modelam representações lógicas e operações sobre vários
componentes de uma biblioteca digital
Descrevem a aparência das interfaces de usuário
Scenarios
Fornece serviços aos usuários
Societies
Diferentes comunidades envolvidas
Requirements
Analysis
Design
Implementation
Test
5S
5SL
OO Classes
Workflow
Components
DL
Evaluation
5SGraph
5SLGen
Formal
Theory/
Metamodel
DL XML
Log
Código que define um stream, onde cada elemento
define o tipo de conteúdo armazenado
Código que define um stream, onde cada elemento
define o tipo de conteúdo armazenado
Neste caso, o tipo é texto e o subtipo é XML
Representação de um registro OAI
Processo de Modelagem com 5S
Processo de Modelagem com 5S
Dividido em cinco etapas
1)
Levantamento de requisitos
2)
Transformação das instâncias dos modelos 5S
Através da ferramenta 5SGraph
Obtenção de um modelo especificado pela linguagem 5SL
3)
Análise do modelo especificado em 5SL
Por um especialista
Alterando de acordo com os requisitos
dos usuários