Protocolo OAI-PMH
Renato Fernandes Corrêa
DCI-UFPE
Contextualizando…
•
Dificuldades encontradas na tradicional Comunicação
Científica na década de 1990.
– Alta exorbitante nos preços das assinaturas das revistas científicas e queda no orçamento das bibliotecas;
– Morosidade no processo de comunicação científica;
– Entrega dos direitos de copyright aos editors sem contrapartida;
•
Concentração do conhecimento científico gerado em países
localizados no hemisfério norte;
•
As novas tecnologias da informação e da comunicação
fornecem alternativas para transformar a comunicação
científica;
•
Início do Movimento do Acesso Livre a Informação
Open Archives Iniciative
•
Devido ao contexto da chamada Crise dos Periódicos
Científicos na década de 1990 e impulsionado pelo contínuo
avanço das tecnologias da informação surgiu a Open
Archives Initiative (OAI) -
http://www.openarchives.org/
– Movimento para proporcionar a democratização da disseminação da informação não circulada pelos periódicos comerciais e, por
conseqüência, do acesso.
– Iniciativa pioneira que teve papel fundamental para o estabelecimento de novos ideais e padrões tecnológicos
•
Arquivo Aberto: Servidor Web que oferece facilidades para:
– Submissão/publicação/descrição de documentos digitais em CT&I pelo próprio autor
– Armazenamento/Preservação digital
– Recuperação
Open Archives Iniciative
•
A OAI desenvolve e promove padrões de interoperabilidade
entre sistemas de informação, se constituindo no
mecanismo de operacionalização da Filosofia de Acesso
Livre à Informação Científica.
•
Essa iniciativa proporcionou a construção, implantação e
manutenção de diversos repositórios de acesso livre
•
Proporcionou também o surgimento de diversas ferramentas
de software para a construção e manutenção de repositórios
OAI - Precedentes
•
O Laboratório Nacional de Los Alamos lança o repositório
ArXiv
– ArXiv - início anos 90, repositório global de papers não revisados por pares (áreas da física)
•
1999 – Santa Fe – Criação da OAI – Open Archives
Initiative;
•
A Convenção de Santa Fé (1999) definiu princípios
organizacionais e especificações técnicas para facilitar um
mínimo nível funcional de interoperabilidade entre arquivos
“
e-print
” acadêmicos.
– Estabelecimento de padrões para integração de repositórios e bibliotecas digitais
Formatos e Padrões (Prof. Jayme Leiro) -set.2006
6
OAI - Glossário
• Pre-print é um documento disponível em formato eletrônico não
revisado por pares.
• Post-print é um documento cujo metadado coletável está disponível
depois do processo de revisão dos pares.
• E-print é o termo coletivo para “qualquer-print”. Representa um
Ideais e princípios dos OA
•
Auto publicação
– Os pesquisadores são os editores;
– Publicação é de responsabilidade do autor/pesquisador de forma automatizada (FTP, e-mail, formulário Web etc);
•
Sistema de armazenamento a longo prazo
•
Política de gestão observando normas de preservação de
objetos digital
•
Acesso livre, inclusive para coleta e replicação dos
metadados
•
Uso de padrões e protocolos com vista a solução de
interoperabilidade entre as bibliotecas digitais
•
Uso de software open source
https://arxiv.org/Formatos e Padrões (Prof. Jayme Leiro) -set.2006
8
OAI - Glossário
• Coleta (harvesting) – trata-se de um procedimento de extração de
metadados de um conjunto de repositórios distribuídos remotamente e de seu armazenamento consolidado em um banco de dados.
• Metadados – esse termo designa um tipo de dado que descreve um
Vantagens no uso do modelo OA
•
Maior rapidez na disseminação da literatura científica
publicada nesses repositórios
•
Maior visibilidade dos trabalhos publicados
•
Maior impacto
– Acesso livre => Maior Visibilidade => Maior possibilidade de ser citado
•
Maior interoperabilidade com outros repositórios
– OAI-PMH (Open Archives Initiative Protocol of Metadata Harvesting)
•
Dá suporte ao movimento do acesso livre à informação
científica
Open Archives Iniciative
•
Proporciona alto nível de interoperabilidade, por meio de
dois grandes pilares:
– O padrão de metadados Dublin Core e o
Relembrando o DC
•
O formato de metadados mais amplamente utilizado pela
OAI é o Dublin Core, que na sua formação simples consiste
de quinze elementos de metadados:
• Title: Título • Creator: Criador • Subject: Assunto • Description: Descrição • Publisher: Publicador • Contributor: Contribuidor • Date: Data • Type: Tipo • Format: Formato • Identifier: Identificador • Source: Origem • Language: Idioma • Relation: Relação • Coverage: Abrangência • Rights: Direitos
O Protocolo OAI-PMH
•
OAI Protocol for Metadata Harvesting (PMH)
•
Protocolo para coleta de metadados
– Trata-se de um protocolo de comunicação para permitir a coleta de metadados entre dois serviços, portanto o compartilhamento de metadados entre dois serviços de informação
•
Opera com envio de solicitações de metadados,
automaticamente, de um provedor de serviços a um
provedor de dados, que respondem obedecendo a um
padrão
•
Lembrando: Protocolo é um conjunto de regras de
comunicação entre dois sistemas. Exemplos: FTP, HTTP,
Z39.50 etc.
•
O Protocolo OAI-PMH
•
Permite a coleta registros de metadados de um sistema
para outro (de
provedores de dados
para
provedores de
serviço
);
•
Interface que um servidor de rede pode empregar para que
os metadados de objetos residentes no servidor estejam
disponíveis para aplicações externas que desejem coletar
esses dados.
Provedores de Dados
•
Hospedam o repositório digital
•
São os gestores de arquivos e-prints, os quais devem ser
dotados, no mínimo, das seguintes funcionalidades:
– mecanismos de submissão para o auto-arquivo dos trabalhos ou papers;
– sistema de armazenamento a longo prazo;
– mecanismos de exposição de metadados do arquivo para facilitar a sua coleta por terceiros, ou por provedores de serviços (usando o OAI-PMH – Open Archives Initiative Protocol for Metadata
Provedores de Dados
•
Provedores que utilizam o protocolo OAI-PHM como um
meio de expor metadados para facilitar sua coleta por
terceiros
•
Esses provedores também podem (mas não
necessariamente) oferecer acesso aberto a textos
completos e a outros recursos.
•
Eles são os veículos que armazenam registros dentro de
suas bases – revistas, bibliotecas digitais, comunidades ou
coleções.
Harvesters (Coletores)
•
Programas que utilizam a interface oferecida pelo protocolo
OAI-PMH para coletar metadados
•
Importam os metadados dos provedores de dados e
oferecem assim, a viabilidade de se construir novos serviços
sobre esses dados coletados.
Harvesters (Coletores)
•
Segundo Marcondes (2002, p. 52)
•
“a possibilidade de coleta automática de metadados
viabilizada pelo OAI PMH é a chave para uma nova prática
de cooperação entre bibliotecas, desonerando os
cooperantes do pesado ônus administrativo de gerenciar o
envio de lotes, correções, atualizações, operações estas
que permitem, num esquema de cooperação tão conhecido
dos sistemas de informação brasileiros, manter um catálogo
coletivo”.
Provedores de Serviços
• Utilizam os metadados coletados pelos harvesters via protocolo OAI-PHM como base para construção de novos serviços.
• Disponibilizam os registros – sites de busca, bases de dados e portais de acesso – por meio do OAI-PMH, que executa a coleta e alimentação dos metadados automaticamente
• São as instituições ou serviços de terceiros, que implementam os serviços com valor agregado, a partir dos dados recolhidos junto aos arquivos e-prints, ou repositórios digitais
• Na prática, isto quer dizer que os utilizadores podem encontrar um trabalho num repositório deste género, sem conhecer que os
repositórios existem, onde estão localizados, ou o que contêm
• Alguns exemplos são:
– OAISTER - http://www.oaister.org
Agregadores
• Os agregadores são sistemas de recuperação de
informação que cumprem a função de provedores de
serviços por meio do OAI-PMH, e provedor de dados do
catálogo unificado de diversos provedores de dados.
IBICT Protocolo OAI-PMH Metadados: MTD-BR Protocolo OAI-PMH Metadados: ETD-MS Instituições NDLTD
OAI-PMH - Resumo do Protocolo
•
Protocolo baseado em HTTP
•
Respostas codificadas em XML
– XML é a sintaxe de representação e transporte de metadados;
•
Suporta qualquer formato de metadatos (mas requer,
obrigatoriamente, o Dublin Core – ele é o básico)
•
Usa Conceito de Provedores de Dados e de Serviço
•
Metadados devem ser expostos aos serviços de usuários
•
Metadados devem ser coletados para facilitar a descoberta
de conteúdos de “e-prints” distribuídos.
“Verbos” do OAI
• O provedor de dados pode utilizar até seis “verbos” previstos no OAI para coletar metadados de um documento do provedor de dados, são eles:
– Identify – recupera dados administrativos do provedor de dados;
– ListSets – lista as classificações ou coleções utilizadas para organizar o documento no provedor de dados;
– ListMetadataFormats – lista os formatos de metadados utilizados para apresentar os documentos armazenados no provedor de dados;
– ListIdentifiers – lista de identificadores de registros armazenados no provedor de dados;
– ListRecords – Lista os metadados dos registros armazenados no provedor de dados segundo um formato de metadados especificado: todos que
pertencem a um set ou todos a partir de uma data; e
– GetRecords – obtém os metadados dos registros armazenados segundo um formato de metadados, dando um identificador de registro
Identify
•
Quem és ?
•
Qual a versão do protocol suportada?
•
Que tipo de material conténs ?
•
Qual é o copyright dos teus dados e metadados ?
•
Exemplo:
ListMetadataFormats
•
Que formatos de metadados disponibilizas ?
– Todos os repositórios devem suportar Dublin Core, mas podem suportar outros formatos (ex: MARC, MTD-BR, etc.).
•
Exemplo:
ListSets
•
Que coleções ou subconjuntos existem ?
– Alguns provedores definem os subconjuntos por assunto, por tipo de documento, etc
•
Exemplo:
ListIdentifiers
•
Listar os identificadores de todos os registros!
– Deve especificar o padrão de metadados
– Pode ser limitado por data de atualização
– Pode ser limitado a um subconjunto (set) do arquivo
•
Exemplos:
– http://www.repositorio.ufpe.br/oai/request?verb=ListIdentifiers&metad ataPrefix=oai_dc
– http://www.repositorio.ufpe.br/oai/request?verb=ListIdentifiers&metad ataPrefix=oai_dc&set=com_123456789_50
ListRecords
•
Listar os metadados de todos os registros !
– Pode ser limitado pela data de atualização dos registros
– Pode ser limitado a um subconjunto
•
Exemplos:
– http://www.repositorio.ufpe.br/oai/request?verb=ListRecords&metada taPrefix=oai_dc
– http://www.repositorio.ufpe.br/oai/request?verb=ListRecords&metada taPrefix=oai_dc&set=com_123456789_50
GetRecord
•
Mostrar os metadados
de determinado registro!
– Deve especificar o padrão de metadados do registro – Deve especificar o identificador do registro
•
Exemplo:
– http://www.repositorio.ufp e.br/oai/request?verb=Get Record&metadataPrefix=o ai_dc&identifier=oai:reposi torio.ufpe.br:123456789/3 87GetRecord
•
Mostrar os metadados
de determinado registro!
GetRecord
•
Mostrar os metadados
de determinado registro!
<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2016-03-29T11:06:49Z</responseDate>
<request verb="ListRecords" metadataPrefix="oai_dc"
set="com_123456789_50">http://www.repositorio.ufpe.br/oai/request</request> <ListRecords> <record> <header> <identifier>oai:repositorio.ufpe.br:123456789/387</identifier> <datestamp>2015-05-26T22:34:21Z</datestamp> <setSpec>com_123456789_155</setSpec> <setSpec>com_123456789_52</setSpec> <setSpec>com_123456789_51</setSpec> <setSpec>com_123456789_50</setSpec> <setSpec>col_123456789_231</setSpec> </header>
<metadata><oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/"
xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
<dc:title>Correlação da infecção por papillomavirus humano (hpv) com polimorfismos de dois genes de citocinas: fator de necrose tumoral (tnf) alfa e interleucina (il) 18 em pacientes com e sem lesão intraepitelial cervical</dc:title>
<dc:creator>Costa Mansur Fernandes, Mayara</dc:creator> <dc:contributor>Crovella, Sérgio </dc:contributor> <dc:subject>Papillomavirus Humano</dc:subject> <dc:subject>Neoplasia Intraepitelial Cervical</dc:subject> <dc:subject>Polimorfismos de única base</dc:subject> <dc:subject>Fator de Necrose tumoral alfa</dc:subject> <dc:subject>Interleucina 18</dc:subject>
<dc:description>O Papillomavirus humano (HPV) é responsável por afetar anualmente 500 mil mulheres com câncer cervical invasivo. Fatores de risco podem facilitar a persistência do vírus da cérvice uterina. Polimorfismos genéticos em regiões regulatórias e codificadoras de genes de citocinas estão associadas a patogênese de um vasto número de doenças humanas. Este trabalho objetivou determinar se existe relação entre os polimorfismos existentes na região -G308A do gene TNFalfa; e nas regiões -G137C e -C607A do gene IL18 na susceptibilidade a infecção pelo HPV e na progressão das lesões intraepitelial cervical. O estudo foi realizado com 122 mulheres HPV+ e 132 mulheres HPV-(controle). Os polimorfismos dos genes TNFalfa; e IL18 foram analisados pela técnica Specific Sequence Polymosphism (PCR-SSP) e analisadas em gel de agarose a 1,5%. As análises estatísticas para verificar a significância do estudo dos genótipos foram realizadas utilizando o programa BioEstat 5.0. Os resultados mostraram uma prevalência de 49,18% da infecção pelo HPV-16 e 70,49% delas apresentaram lesão cervical de alto grau. Em relação aos polimorfismos houve associação do alelo mutante na região -308A do gene TNFalfa; e -607A do gene IL18 com a susceptibilidade a infecção pelo HPV (p=0,0008; p<0,0001, respectivamente), mas não foi verificada relação destes genes com a susceptibilidade ao desenvolvimento das lesões (p>0,05). Porém não foi encontrada associação significativa em relação a região na região -137 do gene IL-18. Estes resultados sugerem dois possíveis marcadores genéticos de susceptibilidade a infecção pelo HPV na população em estudo e que estes não podem ser usados como marcadores de progressão da lesão cervical.</dc:description>
<dc:date>Fri May 30 18:11:59 GMT-03:00 2014</dc:date> <dc:date>2014-06-12T15:02:28Z</dc:date>
<dc:date>Fri May 30 18:11:59 GMT-03:00 2014</dc:date> <dc:date>2014-06-12T15:02:28Z</dc:date>
<dc:date>2012</dc:date> <dc:type>Dissertacao</dc:type>
<dc:identifier>Costa Mansur Fernandes, Mayara; Crovella, Sérgio. Correlação da infecção por papillomavirus humano (hpv) com polimorfismos de dois genes de citocinas: fator de necrose tumoral (tnf) alfa e interleucina (il) 18 em pacientes com e sem lesão intraepitelial cervical. 2012. Dissertação (Mestrado). Programa de Programa de Pós-Graduação em Biologia Aplicada à Saúde, Universidade Federal de Pernambuco, Recife, 2012.</dc:identifier>
<dc:identifier>http://repositorio.ufpe.br/handle/123456789/387</dc:identifier> <dc:language>pt_BR</dc:language>
<dc:publisher>Universidade Federal de Pernambuco</dc:publisher> </oai_dc:dc>
</metadata> </record>
OAI-PMH
•
Ao contrário do Protocolo Z39.50, o OAI PMH não executa
busca imediata e simultânea por vários servidores que
hospedam catálogos de bibliotecas
•
Ele busca uma solução mais simples e menos onerosa
•
Ele define a troca de informações entre provedores de
dados (data providers) e provedores de serviços (service
providers).
– Um programa robô coletor (harvester) do provedor de serviços coleta automaticamente metadados de diversos provedores de dados e os armazena em uma base de dados centralizada, onde são feitas as buscas.
O OAI-PMH não é responsável por:
•
Implementar a autenticação e o gerenciamento de acesso;
•
Disponibilizar o texto completo de um artigo para download;
•
Controlar o acesso ao conteúdo - os repositórios podem
implementar por conta própria. Independente do controle
de acesso sobre os metadados, o servidor inclui um
apontador (como URL) para o objeto descrito pelos
metadados;
•
Determinar como os harvesters identificarão os repositórios
que eles desejam coletar, quando a coleta deve ocorrer ou
com que frequência.
•
Pela qualidade dos metadados dos documentos e sua
validade.
Quem usa o OAI-PMH?
•
BDTD – Biblioteca Digital de Teses e Dissertações
– A BDTD utiliza as tecnologias do OAI e adota o modelo baseado em padrões de interoperabilidade consolidado em uma rede distribuída de bibliotecas digitais de teses e dissertações com a existência de dois atores principais:
– PROVEDOR DE DADOS (data provider) - administra o depósito e publicação, expondo os metadados para a coleta automática
(harvesting);
– PROVEDOR DE SERVIÇOS (service provider) - fornece serviços de informação com base nos metadados coletados junto aos provedores de dados.
– Nessa rede, as instituições de ensino e pesquisa atuam como provedores de dados e o Ibict opera como agregador, coletando metadados de teses e dissertações dos provedores, fornecendo serviços de informação sobre esses metadados e expondo-os para coleta por outros provedores de serviços, em especial pela
OAI - ORE
•
O protocolo OAI-PMH pode ter múltiplas utilizações, mas
está sobretudo vocacionado para expôr e recolher
metadados para criação de serviços de busca.
•
Para tentar desenvolver serviços envolvendo descrição e
troca de objetos complexos entre repositórios está sendo
especificado, na
Open Archives Initiative
, uma nova
arquitectura e protocolos de interoperabilidade
•
OAI-ORE
(Open Archives Initiative Object Reuse and
Exchange) define as normas para a descrição e troca de
agregações de recursos web.
– Estas agregações, objetos digitais compostos, podem combinar
recursos informativos distribuídos de diferentes tipos/formatos como texto, imagens, dados e vídeo (http://www.openarchives.org/ore/ ).
Saiba mais
•
Validador e extrator de dados via OAI-PMH
– http://validator.oaipmh.com/
•
Provedores de dados registrados no OAI
– https://www.openarchives.org/Register/BrowseSites
•
Diretórios OpenDOAR, DOAJ e OASISBR
– http://www.opendoar.org/ , https://doaj.org/ ,
http://oasisbr.ibict.br/vufind/
• Exemplos de acesso aos metadados do acervo digital da LC:
– https://memory.loc.gov/ammem/oamh/oai_request.html
• OAI-PMH tutorial para iniciantes
– http://travesia.mcu.es/portalnb/jspui/html/10421/1823/intro.htm
– Open Archives Initiative (Sitio web oficial de la OAI) http://www.openarchives.org/
– Open Archives Forum (Sitio web de OA-Forum) http://www.oaforum.org/
Provedores de dados
•
Scielo
http://www.scielo.br/oai/scielo-oai.php?verb=Identify • Transinf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=0103-3786 • Pers.Ci.Inf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=1413-9936 • Ci.Inf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=0100-1965 – Revista Transinformação • http://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/oai?verb=Identify– Revista Perspectivas em Ciência da Informação
• http://portaldeperiodicos.eci.ufmg.br/index.php/pci/oai?verb=Identify – Revista Informação & Sociedade
• http://www.ies.ufpb.br/ojs2/index.php/ies/oai?verb=Identify
– Revista Informação & Informação
• http://www.uel.br/revistas/uel/index.php/informacao/oai?verb=Identify
– Revista EncontrosBibli
• https://periodicos.ufsc.br/index.php/eb/oai?verb=Identify
– Revista EmQuestão
• http://seer.ufrgs.br/index.php/EmQuestao/oai?verb=Identify
– Revista Ciência da Informação
Materiais consultados
• Laureano Felipe Gómez Dueñas. Interoperabilidad de los Sistemas de Información Documental. In: Anais do IX CONGRESO NACIONAL DE BIBLIOTECOLOGÍA Y CIENCIAS DE LA INFORMACIÓN e XII
ENCUENTRO NACIONAL DE BIBLIOTECAS PÚBLICAS - Armenia, Quindío, Colombia – 11-14 de Septiembre de 2007
• MARCONDES, Carlos Henrique, SAYÃO, Luis Henrique. Integração e interoperabilidade no acesso a recursos informacionais eletrônicos em C&T: a proposta da Biblioteca Digital Brasileira. Ciência da Informação, Brasília, v. 30, n. 3, p. 24-33, 2001
• Gestão do Processo Editorial Eletrônico, baseado no Modelo Acesso Aberto: Estudo em Periódicos Científicos da UFBA. Rodrigo França Meirelles. Dissertação de Mestrado – Programa de Pós-Graduação em Ciência da Informação – UFBA, 2009
• Estudos sobre Repositórios Institucionais e Repositórios de Recursos Educativos: metodologias, resultados e recomendações. Elisabete Paula Coelho Cardoso. Dissertação de Mestrado. Mestrado em Sistemas de Informação. Universidade do Minho. Escola de Engenharia, 2009