• Nenhum resultado encontrado

FPS aula4 Protocolo OAIPMH

N/A
N/A
Protected

Academic year: 2021

Share "FPS aula4 Protocolo OAIPMH"

Copied!
39
0
0

Texto

(1)

Protocolo OAI-PMH

Renato Fernandes Corrêa

DCI-UFPE

(2)

Contextualizando…

Dificuldades encontradas na tradicional Comunicação

Científica na década de 1990.

– Alta exorbitante nos preços das assinaturas das revistas científicas e queda no orçamento das bibliotecas;

– Morosidade no processo de comunicação científica;

– Entrega dos direitos de copyright aos editors sem contrapartida;

Concentração do conhecimento científico gerado em países

localizados no hemisfério norte;

As novas tecnologias da informação e da comunicação

fornecem alternativas para transformar a comunicação

científica;

Início do Movimento do Acesso Livre a Informação

(3)

Open Archives Iniciative

Devido ao contexto da chamada Crise dos Periódicos

Científicos na década de 1990 e impulsionado pelo contínuo

avanço das tecnologias da informação surgiu a Open

Archives Initiative (OAI) -

http://www.openarchives.org/

– Movimento para proporcionar a democratização da disseminação da informação não circulada pelos periódicos comerciais e, por

conseqüência, do acesso.

– Iniciativa pioneira que teve papel fundamental para o estabelecimento de novos ideais e padrões tecnológicos

Arquivo Aberto: Servidor Web que oferece facilidades para:

– Submissão/publicação/descrição de documentos digitais em CT&I pelo próprio autor

– Armazenamento/Preservação digital

– Recuperação

(4)

Open Archives Iniciative

A OAI desenvolve e promove padrões de interoperabilidade

entre sistemas de informação, se constituindo no

mecanismo de operacionalização da Filosofia de Acesso

Livre à Informação Científica.

Essa iniciativa proporcionou a construção, implantação e

manutenção de diversos repositórios de acesso livre

Proporcionou também o surgimento de diversas ferramentas

de software para a construção e manutenção de repositórios

(5)

OAI - Precedentes

O Laboratório Nacional de Los Alamos lança o repositório

ArXiv

– ArXiv - início anos 90, repositório global de papers não revisados por pares (áreas da física)

1999 – Santa Fe – Criação da OAI – Open Archives

Initiative;

A Convenção de Santa Fé (1999) definiu princípios

organizacionais e especificações técnicas para facilitar um

mínimo nível funcional de interoperabilidade entre arquivos

e-print

” acadêmicos.

– Estabelecimento de padrões para integração de repositórios e bibliotecas digitais

(6)

Formatos e Padrões (Prof. Jayme Leiro) -set.2006

6

OAI - Glossário

Pre-print é um documento disponível em formato eletrônico não

revisado por pares.

Post-print é um documento cujo metadado coletável está disponível

depois do processo de revisão dos pares.

E-print é o termo coletivo para “qualquer-print”. Representa um

(7)

Ideais e princípios dos OA

Auto publicação

– Os pesquisadores são os editores;

– Publicação é de responsabilidade do autor/pesquisador de forma automatizada (FTP, e-mail, formulário Web etc);

Sistema de armazenamento a longo prazo

Política de gestão observando normas de preservação de

objetos digital

Acesso livre, inclusive para coleta e replicação dos

metadados

Uso de padrões e protocolos com vista a solução de

interoperabilidade entre as bibliotecas digitais

Uso de software open source

https://arxiv.org/

(8)

Formatos e Padrões (Prof. Jayme Leiro) -set.2006

8

OAI - Glossário

Coleta (harvesting) – trata-se de um procedimento de extração de

metadados de um conjunto de repositórios distribuídos remotamente e de seu armazenamento consolidado em um banco de dados.

Metadados – esse termo designa um tipo de dado que descreve um

(9)

Vantagens no uso do modelo OA

Maior rapidez na disseminação da literatura científica

publicada nesses repositórios

Maior visibilidade dos trabalhos publicados

Maior impacto

– Acesso livre => Maior Visibilidade => Maior possibilidade de ser citado

Maior interoperabilidade com outros repositórios

– OAI-PMH (Open Archives Initiative Protocol of Metadata Harvesting)

Dá suporte ao movimento do acesso livre à informação

científica

(10)

Open Archives Iniciative

Proporciona alto nível de interoperabilidade, por meio de

dois grandes pilares:

– O padrão de metadados Dublin Core e o

(11)

Relembrando o DC

O formato de metadados mais amplamente utilizado pela

OAI é o Dublin Core, que na sua formação simples consiste

de quinze elementos de metadados:

• Title: Título • Creator: Criador • Subject: Assunto • Description: Descrição • Publisher: Publicador • Contributor: Contribuidor • Date: Data • Type: Tipo • Format: Formato • Identifier: Identificador • Source: Origem • Language: Idioma • Relation: Relação • Coverage: Abrangência • Rights: Direitos

(12)

O Protocolo OAI-PMH

OAI Protocol for Metadata Harvesting (PMH)

Protocolo para coleta de metadados

– Trata-se de um protocolo de comunicação para permitir a coleta de metadados entre dois serviços, portanto o compartilhamento de metadados entre dois serviços de informação

Opera com envio de solicitações de metadados,

automaticamente, de um provedor de serviços a um

provedor de dados, que respondem obedecendo a um

padrão

Lembrando: Protocolo é um conjunto de regras de

comunicação entre dois sistemas. Exemplos: FTP, HTTP,

Z39.50 etc.

(13)

O Protocolo OAI-PMH

Permite a coleta registros de metadados de um sistema

para outro (de

provedores de dados

para

provedores de

serviço

);

Interface que um servidor de rede pode empregar para que

os metadados de objetos residentes no servidor estejam

disponíveis para aplicações externas que desejem coletar

esses dados.

(14)

Provedores de Dados

Hospedam o repositório digital

São os gestores de arquivos e-prints, os quais devem ser

dotados, no mínimo, das seguintes funcionalidades:

– mecanismos de submissão para o auto-arquivo dos trabalhos ou papers;

– sistema de armazenamento a longo prazo;

– mecanismos de exposição de metadados do arquivo para facilitar a sua coleta por terceiros, ou por provedores de serviços (usando o OAI-PMH – Open Archives Initiative Protocol for Metadata

(15)

Provedores de Dados

Provedores que utilizam o protocolo OAI-PHM como um

meio de expor metadados para facilitar sua coleta por

terceiros

Esses provedores também podem (mas não

necessariamente) oferecer acesso aberto a textos

completos e a outros recursos.

Eles são os veículos que armazenam registros dentro de

suas bases – revistas, bibliotecas digitais, comunidades ou

coleções.

(16)

Harvesters (Coletores)

Programas que utilizam a interface oferecida pelo protocolo

OAI-PMH para coletar metadados

Importam os metadados dos provedores de dados e

oferecem assim, a viabilidade de se construir novos serviços

sobre esses dados coletados.

(17)

Harvesters (Coletores)

Segundo Marcondes (2002, p. 52)

“a possibilidade de coleta automática de metadados

viabilizada pelo OAI PMH é a chave para uma nova prática

de cooperação entre bibliotecas, desonerando os

cooperantes do pesado ônus administrativo de gerenciar o

envio de lotes, correções, atualizações, operações estas

que permitem, num esquema de cooperação tão conhecido

dos sistemas de informação brasileiros, manter um catálogo

coletivo”.

(18)

Provedores de Serviços

• Utilizam os metadados coletados pelos harvesters via protocolo OAI-PHM como base para construção de novos serviços.

• Disponibilizam os registros – sites de busca, bases de dados e portais de acesso – por meio do OAI-PMH, que executa a coleta e alimentação dos metadados automaticamente

• São as instituições ou serviços de terceiros, que implementam os serviços com valor agregado, a partir dos dados recolhidos junto aos arquivos e-prints, ou repositórios digitais

• Na prática, isto quer dizer que os utilizadores podem encontrar um trabalho num repositório deste género, sem conhecer que os

repositórios existem, onde estão localizados, ou o que contêm

• Alguns exemplos são:

– OAISTER - http://www.oaister.org

(19)

Agregadores

• Os agregadores são sistemas de recuperação de

informação que cumprem a função de provedores de

serviços por meio do OAI-PMH, e provedor de dados do

catálogo unificado de diversos provedores de dados.

(20)
(21)

IBICT Protocolo OAI-PMH Metadados: MTD-BR Protocolo OAI-PMH Metadados: ETD-MS Instituições NDLTD

(22)

OAI-PMH - Resumo do Protocolo

Protocolo baseado em HTTP

Respostas codificadas em XML

– XML é a sintaxe de representação e transporte de metadados;

Suporta qualquer formato de metadatos (mas requer,

obrigatoriamente, o Dublin Core – ele é o básico)

Usa Conceito de Provedores de Dados e de Serviço

Metadados devem ser expostos aos serviços de usuários

Metadados devem ser coletados para facilitar a descoberta

de conteúdos de “e-prints” distribuídos.

(23)

“Verbos” do OAI

• O provedor de dados pode utilizar até seis “verbos” previstos no OAI para coletar metadados de um documento do provedor de dados, são eles:

– Identify – recupera dados administrativos do provedor de dados;

– ListSets – lista as classificações ou coleções utilizadas para organizar o documento no provedor de dados;

– ListMetadataFormats – lista os formatos de metadados utilizados para apresentar os documentos armazenados no provedor de dados;

– ListIdentifiers – lista de identificadores de registros armazenados no provedor de dados;

– ListRecords – Lista os metadados dos registros armazenados no provedor de dados segundo um formato de metadados especificado: todos que

pertencem a um set ou todos a partir de uma data; e

– GetRecords – obtém os metadados dos registros armazenados segundo um formato de metadados, dando um identificador de registro

(24)

Identify

Quem és ?

Qual a versão do protocol suportada?

Que tipo de material conténs ?

Qual é o copyright dos teus dados e metadados ?

Exemplo:

(25)

ListMetadataFormats

Que formatos de metadados disponibilizas ?

– Todos os repositórios devem suportar Dublin Core, mas podem suportar outros formatos (ex: MARC, MTD-BR, etc.).

Exemplo:

(26)

ListSets

Que coleções ou subconjuntos existem ?

– Alguns provedores definem os subconjuntos por assunto, por tipo de documento, etc

Exemplo:

(27)

ListIdentifiers

Listar os identificadores de todos os registros!

– Deve especificar o padrão de metadados

– Pode ser limitado por data de atualização

– Pode ser limitado a um subconjunto (set) do arquivo

Exemplos:

– http://www.repositorio.ufpe.br/oai/request?verb=ListIdentifiers&metad ataPrefix=oai_dc

– http://www.repositorio.ufpe.br/oai/request?verb=ListIdentifiers&metad ataPrefix=oai_dc&set=com_123456789_50

(28)

ListRecords

Listar os metadados de todos os registros !

– Pode ser limitado pela data de atualização dos registros

– Pode ser limitado a um subconjunto

Exemplos:

– http://www.repositorio.ufpe.br/oai/request?verb=ListRecords&metada taPrefix=oai_dc

– http://www.repositorio.ufpe.br/oai/request?verb=ListRecords&metada taPrefix=oai_dc&set=com_123456789_50

(29)

GetRecord

Mostrar os metadados

de determinado registro!

– Deve especificar o padrão de metadados do registro – Deve especificar o identificador do registro

Exemplo:

– http://www.repositorio.ufp e.br/oai/request?verb=Get Record&metadataPrefix=o ai_dc&identifier=oai:reposi torio.ufpe.br:123456789/3 87

(30)

GetRecord

Mostrar os metadados

de determinado registro!

(31)

GetRecord

Mostrar os metadados

de determinado registro!

<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2016-03-29T11:06:49Z</responseDate>

<request verb="ListRecords" metadataPrefix="oai_dc"

set="com_123456789_50">http://www.repositorio.ufpe.br/oai/request</request> <ListRecords> <record> <header> <identifier>oai:repositorio.ufpe.br:123456789/387</identifier> <datestamp>2015-05-26T22:34:21Z</datestamp> <setSpec>com_123456789_155</setSpec> <setSpec>com_123456789_52</setSpec> <setSpec>com_123456789_51</setSpec> <setSpec>com_123456789_50</setSpec> <setSpec>col_123456789_231</setSpec> </header>

<metadata><oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/"

xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">

<dc:title>Correlação da infecção por papillomavirus humano (hpv) com polimorfismos de dois genes de citocinas: fator de necrose tumoral (tnf) alfa e interleucina (il) 18 em pacientes com e sem lesão intraepitelial cervical</dc:title>

<dc:creator>Costa Mansur Fernandes, Mayara</dc:creator> <dc:contributor>Crovella, Sérgio </dc:contributor> <dc:subject>Papillomavirus Humano</dc:subject> <dc:subject>Neoplasia Intraepitelial Cervical</dc:subject> <dc:subject>Polimorfismos de única base</dc:subject> <dc:subject>Fator de Necrose tumoral alfa</dc:subject> <dc:subject>Interleucina 18</dc:subject>

<dc:description>O Papillomavirus humano (HPV) é responsável por afetar anualmente 500 mil mulheres com câncer cervical invasivo. Fatores de risco podem facilitar a persistência do vírus da cérvice uterina. Polimorfismos genéticos em regiões regulatórias e codificadoras de genes de citocinas estão associadas a patogênese de um vasto número de doenças humanas. Este trabalho objetivou determinar se existe relação entre os polimorfismos existentes na região -G308A do gene TNFalfa; e nas regiões -G137C e -C607A do gene IL18 na susceptibilidade a infecção pelo HPV e na progressão das lesões intraepitelial cervical. O estudo foi realizado com 122 mulheres HPV+ e 132 mulheres HPV-(controle). Os polimorfismos dos genes TNFalfa; e IL18 foram analisados pela técnica Specific Sequence Polymosphism (PCR-SSP) e analisadas em gel de agarose a 1,5%. As análises estatísticas para verificar a significância do estudo dos genótipos foram realizadas utilizando o programa BioEstat 5.0. Os resultados mostraram uma prevalência de 49,18% da infecção pelo HPV-16 e 70,49% delas apresentaram lesão cervical de alto grau. Em relação aos polimorfismos houve associação do alelo mutante na região -308A do gene TNFalfa; e -607A do gene IL18 com a susceptibilidade a infecção pelo HPV (p=0,0008; p&lt;0,0001, respectivamente), mas não foi verificada relação destes genes com a susceptibilidade ao desenvolvimento das lesões (p&gt;0,05). Porém não foi encontrada associação significativa em relação a região na região -137 do gene IL-18. Estes resultados sugerem dois possíveis marcadores genéticos de susceptibilidade a infecção pelo HPV na população em estudo e que estes não podem ser usados como marcadores de progressão da lesão cervical.</dc:description>

<dc:date>Fri May 30 18:11:59 GMT-03:00 2014</dc:date> <dc:date>2014-06-12T15:02:28Z</dc:date>

<dc:date>Fri May 30 18:11:59 GMT-03:00 2014</dc:date> <dc:date>2014-06-12T15:02:28Z</dc:date>

<dc:date>2012</dc:date> <dc:type>Dissertacao</dc:type>

<dc:identifier>Costa Mansur Fernandes, Mayara; Crovella, Sérgio. Correlação da infecção por papillomavirus humano (hpv) com polimorfismos de dois genes de citocinas: fator de necrose tumoral (tnf) alfa e interleucina (il) 18 em pacientes com e sem lesão intraepitelial cervical. 2012. Dissertação (Mestrado). Programa de Programa de Pós-Graduação em Biologia Aplicada à Saúde, Universidade Federal de Pernambuco, Recife, 2012.</dc:identifier>

<dc:identifier>http://repositorio.ufpe.br/handle/123456789/387</dc:identifier> <dc:language>pt_BR</dc:language>

<dc:publisher>Universidade Federal de Pernambuco</dc:publisher> </oai_dc:dc>

</metadata> </record>

(32)

OAI-PMH

Ao contrário do Protocolo Z39.50, o OAI PMH não executa

busca imediata e simultânea por vários servidores que

hospedam catálogos de bibliotecas

Ele busca uma solução mais simples e menos onerosa

Ele define a troca de informações entre provedores de

dados (data providers) e provedores de serviços (service

providers).

Um programa robô coletor (harvester) do provedor de serviços coleta automaticamente metadados de diversos provedores de dados e os armazena em uma base de dados centralizada, onde são feitas as buscas.

(33)

O OAI-PMH não é responsável por:

Implementar a autenticação e o gerenciamento de acesso;

Disponibilizar o texto completo de um artigo para download;

Controlar o acesso ao conteúdo - os repositórios podem

implementar por conta própria. Independente do controle

de acesso sobre os metadados, o servidor inclui um

apontador (como URL) para o objeto descrito pelos

metadados;

Determinar como os harvesters identificarão os repositórios

que eles desejam coletar, quando a coleta deve ocorrer ou

com que frequência.

Pela qualidade dos metadados dos documentos e sua

validade.

(34)
(35)

Quem usa o OAI-PMH?

BDTD – Biblioteca Digital de Teses e Dissertações

– A BDTD utiliza as tecnologias do OAI e adota o modelo baseado em padrões de interoperabilidade consolidado em uma rede distribuída de bibliotecas digitais de teses e dissertações com a existência de dois atores principais:

– PROVEDOR DE DADOS (data provider) - administra o depósito e publicação, expondo os metadados para a coleta automática

(harvesting);

– PROVEDOR DE SERVIÇOS (service provider) - fornece serviços de informação com base nos metadados coletados junto aos provedores de dados.

– Nessa rede, as instituições de ensino e pesquisa atuam como provedores de dados e o Ibict opera como agregador, coletando metadados de teses e dissertações dos provedores, fornecendo serviços de informação sobre esses metadados e expondo-os para coleta por outros provedores de serviços, em especial pela

(36)

OAI - ORE

O protocolo OAI-PMH pode ter múltiplas utilizações, mas

está sobretudo vocacionado para expôr e recolher

metadados para criação de serviços de busca.

Para tentar desenvolver serviços envolvendo descrição e

troca de objetos complexos entre repositórios está sendo

especificado, na

Open Archives Initiative

, uma nova

arquitectura e protocolos de interoperabilidade

OAI-ORE

(Open Archives Initiative Object Reuse and

Exchange) define as normas para a descrição e troca de

agregações de recursos web.

– Estas agregações, objetos digitais compostos, podem combinar

recursos informativos distribuídos de diferentes tipos/formatos como texto, imagens, dados e vídeo (http://www.openarchives.org/ore/ ).

(37)

Saiba mais

Validador e extrator de dados via OAI-PMH

– http://validator.oaipmh.com/

Provedores de dados registrados no OAI

– https://www.openarchives.org/Register/BrowseSites

Diretórios OpenDOAR, DOAJ e OASISBR

– http://www.opendoar.org/ , https://doaj.org/ ,

http://oasisbr.ibict.br/vufind/

• Exemplos de acesso aos metadados do acervo digital da LC:

– https://memory.loc.gov/ammem/oamh/oai_request.html

• OAI-PMH tutorial para iniciantes

– http://travesia.mcu.es/portalnb/jspui/html/10421/1823/intro.htm

– Open Archives Initiative (Sitio web oficial de la OAI) http://www.openarchives.org/

– Open Archives Forum (Sitio web de OA-Forum) http://www.oaforum.org/

(38)

Provedores de dados

Scielo

http://www.scielo.br/oai/scielo-oai.php?verb=Identify • Transinf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=0103-3786 • Pers.Ci.Inf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=1413-9936 • Ci.Inf.: http://www.scielo.br/oai/scielo-oai.php?verb=ListIdentifiers&set=0100-1965 – Revista Transinformação • http://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/oai?verb=Identify

– Revista Perspectivas em Ciência da Informação

• http://portaldeperiodicos.eci.ufmg.br/index.php/pci/oai?verb=Identify – Revista Informação & Sociedade

• http://www.ies.ufpb.br/ojs2/index.php/ies/oai?verb=Identify

– Revista Informação & Informação

• http://www.uel.br/revistas/uel/index.php/informacao/oai?verb=Identify

– Revista EncontrosBibli

• https://periodicos.ufsc.br/index.php/eb/oai?verb=Identify

– Revista EmQuestão

• http://seer.ufrgs.br/index.php/EmQuestao/oai?verb=Identify

– Revista Ciência da Informação

(39)

Materiais consultados

• Laureano Felipe Gómez Dueñas. Interoperabilidad de los Sistemas de Información Documental. In: Anais do IX CONGRESO NACIONAL DE BIBLIOTECOLOGÍA Y CIENCIAS DE LA INFORMACIÓN e XII

ENCUENTRO NACIONAL DE BIBLIOTECAS PÚBLICAS - Armenia, Quindío, Colombia – 11-14 de Septiembre de 2007

• MARCONDES, Carlos Henrique, SAYÃO, Luis Henrique. Integração e interoperabilidade no acesso a recursos informacionais eletrônicos em C&T: a proposta da Biblioteca Digital Brasileira. Ciência da Informação, Brasília, v. 30, n. 3, p. 24-33, 2001

• Gestão do Processo Editorial Eletrônico, baseado no Modelo Acesso Aberto: Estudo em Periódicos Científicos da UFBA. Rodrigo França Meirelles. Dissertação de Mestrado – Programa de Pós-Graduação em Ciência da Informação – UFBA, 2009

• Estudos sobre Repositórios Institucionais e Repositórios de Recursos Educativos: metodologias, resultados e recomendações. Elisabete Paula Coelho Cardoso. Dissertação de Mestrado. Mestrado em Sistemas de Informação. Universidade do Minho. Escola de Engenharia, 2009

Referências

Documentos relacionados

O levantamento dos dípteros califorídeos no município de Itaboraí se destinou a identificar as espécies existentes na área, quantificar as predominantes,

Uma dose inicial mais baixa deve ser considerada para pacientes com insuficiência renal grave (vide “Posologia e modo de usar” e “Advertências e

Geralmente, o espaço físico não é suficiente ou adequado para as atividades importante a serem desenvolvida pelas crianças dentro da sala de aula, como por

A prevalência global de enteroparasitoses foi de 36,6% (34 crianças com resultado positivo para um ou mais parasitos), ocorrendo quatro casos de biparasitismo, sendo que ,em

Foram desenvolvidas duas formulações, uma utilizando um adoçante natural (stévia) e outra utilizando um adoçante artificial (sucralose) e foram realizadas análises

5.2 Importante, então, salientar que a Egrégia Comissão Disciplinar, por maioria, considerou pela aplicação de penalidade disciplinar em desfavor do supramencionado Chefe

No entanto, quando se eliminou o efeito da soja (TABELA 3), foi possível distinguir os efeitos da urease presentes no grão de soja sobre a conversão da uréia em amônia no bagaço

Proteínas Cry1A.105 e Cry2Ab2, proteína 5- enolpiruvil-chiquimato-3- fosfato sintase (CP4 EPSPS), _ Milho geneticamente modificado resistente a insetos, evento MON 89034