ALINE VIEIRA DO NASCIMENTO
Repositórios Digitais: identificando fatores de sucesso para as
Bibliotecas Digitais e Repositórios Institucionais
INSTITUTO BRASILEIRO DE INFORMAÇÃO EM CIÊNCIA E TECNOLOGIA - IBICT
PROGRAMA DE PÓS-GRADUAÇÃO EM CIÊNCIA DA INFORMAÇÃO - PPGCI
ALINE VIEIRA DO NASCIMENTO
REPOSITÓRIOS DIGITAIS: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais
REPOSITÓRIOS DIGITAIS: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Ciência da Informação, convênio entre o Instituto Brasileiro de Informação em Ciência e Tecnologia e Universidade Federal do Rio de Janeiro/Escola de Comunicação, como requisito parcial para obtenção do título de Mestre em Ciência da Informação.
Orientadora: Profa. Rosali Fernadez de Souza
Dados Internacionais de Catalogação na Publicação Universidade Federal do Rio de Janeiro
A244r Nascimento, Aline Vieira.
Repositórios Digitais: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais. / Aline Vieira do Nascimento. – 2014.
116 f. : il. color.; enc.
Dissertação (Mestrado em Ciência da Informação) – Universidade Federal do Rio de Janeiro, Instituto Brasileiro de Informação em Ciência e Tecnologia, Escola de
Comunicação, Programa de Pós-Graduação em Ciência da Informação, Rio de Janeiro, 2014.
Orientação: Profª. Drª. Rosali Fernandez de Souza
REPOSITÓRIOS DIGITAIS: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais
Dissertação de Mestrado apresentada ao Programa de Pós-Graduação em Ciência da Informação, convênio entre o Instituto Brasileiro de Informação em Ciência e Tecnologia e Universidade Federal do Rio de Janeiro/Escola de Comunicação, como requisito parcial para obtenção do título de Mestre em Ciência da Informação.
Aprovada em: ___/____/____
Prof.ª Dra. Rosali Fernandez de Souza (Orientadora) UFRJ-IBICT-PPGCI
Prof. Dr. Jorge Calmon de Almeida Biolchini UFRJ-IBICT-PPGCI
Dra. Fabiola Maria Pereira Bezerra Universidade Federal do Ceará - UFC
A Deus
À minha família.
À D. Maria Zilda - minha avó – pelos
A Deus por estar comigo em todos os momentos.
À professora Rosali Fernandez de Souza, pela orientação, paciência e amizade.
Aos professores do IBICT, pelo conhecimento que repassaram com tanto compromisso.
Aos funcionários do IBICT, em especial à Janete, pela atenção e dedicação. Aos colegas de turma que compartilharam as dúvidas, alegrias, incertezas,
aprendizado.
À Universidade Federal do Ceará, que incentiva a qualificação profissional dos seus funcionários.
Aos colegas do Sistema de Bibliotecas da UFC que torceram por mim.
À minha família que com paciência superou tantos obstáculos ao meu lado, em especial à minha mãe, Alda Vieira e minha filha Alice Ferreira.
O saber a gente aprende com os mestres e com os livros. A sabedoria se aprende é com a vida e com os humildes.
NASCIMENTO, A. V. REPOSITÓRIOS DIGITAIS: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais. 2014. 117 f.
Dissertação (Mestrado em Ciência da Informação) – Universidade Federal do
Rio de Janeiro, Escola de Comunicação, Rio de Janeiro, 2014.
O trabalho tem como foco central os repositórios digitais entre eles as bibliotecas digitais e os repositórios institucionais, ferramentas utilizadas para
viabilizar o acesso livre à informação científica – movimento incitado pelas
comunidades científicas existentes em universidades e institutos de pesquisa para disseminar o resultado das pesquisas. Aborda a importância da produção e comunicação na Ciência compartilhada em livros e revistas científicas. Revela o percurso das bibliotecas digitais e repositórios institucionais, conceitos, objetivos e funções que possibilitaram a interoperabilidade dos sistemas propiciando o compartilhamento de informações entre as comunidades científicas e a sociedade em geral por meio do acesso aberto. Identifica os elementos de sucesso nos repositórios por meio da Revisão Sistemática da Literatura distribuída em sete fases distintas resultando em três artigos analisados. Em seguida foram pontuados os desafios, as ações e as oportunidades de prática de cada elemento detectado nos artigos analisados. O resultado das análises apontou para um conjunto de ações que deve ser observado pelos desenvolvedores de repositórios digitais, incluindo projeto, implantação e gestão.
NASCIMENTO, A. V. REPOSITÓRIOS DIGITAIS: identificando fatores de sucesso para as Bibliotecas Digitais e Repositórios Institucionais. 2014. 117 f.
Dissertação (Mestrado em Ciência da Informação) – Universidade Federal do
Rio de Janeiro, Escola de Comunicação, Rio de Janeiro, 2014.
The work has as its central focus digital repositories among them the digital libraries and institutional repositories, mechanisms used to facilitate open
access to scientific information – movements incited by scientific communities
existing in universities and research institutes to disseminate the results of research. It approaches the importance of production and communication in shared science in books and scientific journals. It reveals the course of digital libraries and institutional repositories, concepts, goals and functions which enable the interoperability of systems propitiating the sharing of information between the scientific communities and society in general through the open access. It identifies the elements of success in repositories through systematic literature review distributed into seven distinct stages resulting in three analyzed articles. Then the challenges, actions and opportunities for practice of each element detected in the analyzed articles were punctuated. The result of the analyses pointed to a set of actions that must be observed for developers of digital repositories, including design, implementation and management.
Figura 1 – Maximização da Pesquisa pelo Auto Arquivamento ... 30
Quadro 1 – Verbos e atribuições de colheita (harvesting) de metadados ... 40
Quadro 2 – Elementos descritivos e definições de padrão Dublin Core ... 43
Quadro 3 - Teste de Relevância I Aplicado aos resultados das buscas ... 69
Quadro 4 – Teste de Relevância II Aplicado aos resumos ... 70
Quadro 5 – Teste de Relevância III Aplicado aos artigos na íntegra ... 71
Quadro 6 - Roteiro para extração de informações dos artigos ... 72
Quadro 7 - Estratégia de busca no Portal de Periódicos CAPES ... 74
Quadro 8 - Distribuição dos resumos nas bases de dados após aplicação do teste de relevância I ... 76
Quadro 9 - Distribuição dos resumos nas bases de dados após análise do teste de relevância II ... 77
Quadro 10 - Resumos selecionados após a aplicação do teste de relevância II ... 78
Quadro 11 - Artigos selecionados após aplicação do teste de relevância III ... 81
Quadro 12 - Síntese do artigo 1 ... 83
Quadro 13 - Síntese do artigo 2 ... 84
Quadro 14 - Síntese do artigo 3 ... 85
Quadro 15 - Resultados das análises dos artigos selecionados pela RSL... 86
Quadro 16 – Resultados similares entre os três estudos, desafios, ações e oportunidades ... 87
Quadro 17 – Resultados encontrados em pelo menos dois artigos ... 89
Quadro 18 – Resultados e ações encontrados em cada artigo, mas que não se repetem ... 90
ALICE - Acesso Livre à Informação Científica da Embrapa
ARL - Association Research Libraries
BDs – Bibliotecas Digitais
BDTD – Biblioteca Digital de Teses e Dissertações
BIREME – Biblioteca Virtual em Saúde
BOAI – Budapeste Open Access Initiative
CC – Creative Commons
CAPES – Coordenação de Aperfeiçoamento de Pessoal de Nível Superior
CDD – Classificação Decimal de Dewey CRD - Centre for Reviews and Dissemination
CSIC - Consejo Superior de Investigaciones Científicas DCMI - Dublin Core Metadada Initiative
DELOS - Network of Excellence on Digital Libraries DOAJ - Directory of Open Access Journals
DLI - Digital Libraries Initiative EBSCO - Elton B Stephens Company EOS - Enabling Open Scholarchip
FAPESP – Fundo de Apoio a Pesquisa do Estado de São Paulo
HP - Hewlett Packard Corporation HTTP - Hypertext Transfer Protocol
IBICT – Instituto Brasileiro de Informação em Ciência e Tecnologia
IES - Instituições de Ensino Superior
IEEE – Instituto de Engenheiros Eletricistas e Eletrônicos
ISO - International Organization for Standardization
JISC – Joint Information Systems Committee
MARC - Machine Readable Cataloging MIT - Massachussets Institute Tecnology
NASA - National Aeronautics and Space Administration
NHS – National Institute for Health Research
OA – Open Access
OAI - Open Archive Initiative
OAI-PMH - Open Archive Initiative-Protocol of Metadada Harvesting
OCLC – Online Computer Library Center
OECD - The Organisation for Economic Co-operation and Development
OJS - Open Journal Systems
OPENDOAR - The Directory of Open Access Repositories PDF - Portable Document Format
RDF - Resource Description Framework REPEC - Research Papers in Economics
RD - Repositórios Digitais
RI – Repositório Institucional
RSL – Revisão Sistemática da Literatura
SCIELO – Scientific Eletronic Library Online
SEER - Sistema Eletrônico de Editoração de Revistas
SHERPA- Securing a Hybrid Environment for Research Preservation and Access
SPARC - The Schorlarly Publishing & Academic Resources Coalition
SURF- Collaborative Organisation for ICT in Dutch higher education and
Research
TIC – Tecnologias de Informação e Comunicação
UFMG - Universidade Federal de Minas Gerais
UNB – Universidade de Brasília
UNESCO- Organização das Nações Unidas para a Educação, a Ciência e a Cultura
1 INTRODUÇÃO ... 14
2 OBJETIVOS ... 19
2.1 Objetivo Geral ... 19
2.2 Objetivo Específico ... 19
3 A PRODUÇÃO CIENTÍFICA NO CONTEXTO DO ACESSO ABERTO E NOS REPOSITÓRIOS DIGITAIS ... 20
3.1 Produção e Comunicação na Ciência ... 20
3.2 O Movimento do Acesso Aberto à Informação ... 26
3.3 O modelo Open Archives: estrutura e acesso ... 37
3.4 Repositórios Digitais ... 43
3.4.1 Bibliotecas Digitais ... 44
3.4.2 Repositórios Institucionais ... 49
4 PERCURSO METODOLÓGICO E ANÁLISE DE DADOS ... 62
4.1 Descrição dos passos metodológicos da pesquisa ... 65
4.2 Coleta e análise dos dados ... 73
4.3. Resultados e discussão ... 82
5 CONSIDERAÇÕES FINAIS ... 92
REFERÊNCIAS ... 100
1 INTRODUÇÃO
Os repositórios digitais, que representam as tentativas de possibilitar o acesso universal ao conhecimento registrado por toda a sociedade e perpetuação dos saberes, nos remetem às diversas formas de transferência de informação e processo de comunicação que ao longo da história da humanidade vêm sendo, através das tecnologias, modificado de acordo com as
necessidades da dita “sociedade do conhecimento”. Nesse sentido os
repositórios digitais possuem o objetivo de democratizar a informação com a finalidade de disseminar e preservar o conhecimento, como vislumbrado pelo visionário Paul Otlet no século XIX.
Otlet buscava solucionar o problema informacional de toda e qualquer sociedade que necessita do acesso ao conhecimento registrado, pois pensava que o conhecimento transcende ao local que o abriga e acreditava que a informação traria para a humanidade à comunicação intelectual, a paz mundial, a mudança social.
As iniciativas de Paul Otlet, que reuniram informações dos registros das produções do conhecimento de todo o mundo, são um marco histórico da tentativa de não somente preservar, mas também de disseminar o conhecimento de forma que todos tivessem acesso quando dele necessitassem, através da cooperação universal, formando uma grande rede que interligava países e regiões.
A evolução da sociedade, principalmente após a Segunda Guerra Mundial, valorizou a informação que passou a desempenhar um papel importante nesse contexto, tornando-se elemento essencial para o progresso econômico-social juntamente com as tecnologias, que por sua vez possibilitam a interligação dos países e regiões através do desenvolvimento de sistemas de informação, como os repositórios digitais e as bibliotecas digitais, realizando o
sonho de Otlet – o conhecimento acessível, sem barreiras de tempo e espaço.
digitais, independente do formato e da natureza. Os repositórios digitais são tipificados como temáticos ou institucionais. Os repositórios temáticos lidam com a produção de determinada área sem se prender a uma instituição; os repositórios institucionais atendem a produção científica de determinada instituição e trazem ainda benefícios para as comunidades de pesquisadores e instituições ao proporcionarem maior visibilidade aos resultados das pesquisas e favorecerem a preservação da memória científica.
As bibliotecas digitais - BDs, por sua vez, são anteriores aos repositórios institucionais e ao movimento do acesso aberto, no entanto são consideradas um ambiente que reúne acervos, serviços e pessoas no apoio à disseminação, preservação e uso do conhecimento. Muitas terminologias são atribuídas às bibliotecas digitais, como: bibliotecas eletrônicas, bibliotecas virtuais, mas na verdade as BDs se referem a um sistema de informação gerenciador de arquivos digitais, que ao se tratar de uma coleção específica pode ser definido como um repositório digital, como as bibliotecas digitais de
teses e dissertações – BDTD, que armazena arquivos digitais de teses e
dissertações, disponibilizando o acesso à produção científica dos institutos de pesquisas e universidades, mas que se desenvolvem em ambiente virtual. As bibliotecas virtuais por sua vez se caracterizam por seu acesso remoto ao conteúdo e serviços da biblioteca e outras fontes de informação, na possibilidade de reproduzir, emular e ampliar os serviços das bibliotecas tradicionais. Já o termo biblioteca eletrônica se distingue pelas características do suporte dos documentos que disponibiliza, ou seja, documentos electrónicos, que por sua vez se refere a tipos de materiais que requerem o uso de periféricos.
A história das pesquisas e descobertas científicas pelos cientistas está vinculada à História e à Sociologia da Ciência, que tem como marco histórico o século 17, por ser o período em que surgiram os primeiros periódicos, as primeiras tentativas de divulgação da pesquisa científica, feitas através das cartas de membros e de outros correspondentes científicos, realçando as suas mais recentes descobertas.
A produção do conhecimento científico tem crescido
exponencialmente dentro das universidades, proporcionando cada vez mais informação e contribuindo para o desenvolvimento da ciência. Este conhecimento gerado deve ser disseminado, socializado para que todos tenham livre acesso e se beneficiem. Ao se estabelecer o livre acesso à produção científica, as intituições contribuem socialmente para o desenvolvimento do país e promovem a geração contínua de conhecimento.
Para acompanhar a rapidez com a qual as informações científicas são produzidas as tecnologias de informação e comunicação (TIC), aliadas ao uso da internet, favoreceram as alterações nos sistemas de recuperação de informação, facilitando a disseminação da informação científica para um público mais abrangente - agora através dos repositórios digitais - não se restringindo às comunidades acadêmicas ou público específico, mas de acesso aberto a todos, culminando na visibilidade dessas informações.
O movimento do acesso livre ou aberto surgiu através da iniciativa dos pesquisadores estrangeiros em facilitar o acesso e a circulação da informação científica. Esta inciativa incitou a elaboração de padrões e regras que viabilizassem a sua prática pelas instituições, inicialmente com a distinção das estratégias de divulgação das pesquisas, podendo ser pela via verde, que consiste no depósito das pesquisas em repositórios de acesso aberto, e a via dourada, que consiste no divulgação por meio de revistas científicas de livre acesso.
Na última década o movimento do acesso aberto à informação vem conquistando consideravelmente a confiança dos pesquisadores em todo o mundo. No Brasil este movimento foi motivado pelo Instituto Brasileiro de Informação em Ciência e Tecnologia - IBICT, estimulando nas comunidades científicas mudanças a cerca dos processos de comunicação científica, tais como: a importância de divulgar a comunicação informal e disseminar o conhecimento produzido nas universidades e instituições de pesquisas, objetivando maior visibilidade da produção científica. Nesse contexto inserem-se os repositórios digitais, uma importante ferramenta tecnológica, que aliada
ao movimento “open access” está expandindo o acesso à produção científica
para um público maior e não especializado, tornando isso uma realidade.
A preservação e a disseminação do conhecimento científico, a constituição de repositórios digitais e as questões de acesso aberto à informação são reconhecidas como temas de interesse atual de pesquisa em Ciência da Informação. Este estudo pretende ser uma contribuição no sentido de maximizar o acesso à informação científica nos repositórios e bibliotecas digitais, buscando refletir sobre como os repositórios digitais estão sendo operacionalizados para dar a visibilidade esperada pelos cientistas.
A proposta desta pesquisa refere-se ao estudo dos repositórios digitais, em como estão sendo trabalhados pelos seus desenvolvedores dentro dos institutos e universidades para alcançar a visibilidade da produção científica e em como os elementos que norteiam o seu desenvolvimento, alimentação e manutenção atendem a necessidade dos seus usuários. Este estudo se torna importante na medida em que, através da análise da literatura, pode-se conhecer a realidade dos repositórios e das ideias que permearam o seu desenvolvimento, que vai desde o planejamento até a gestão, e contribui para o melhoramento dos repositórios como ferramentas de disseminação e acesso à informação.
A questão que norteou a presente investigação foi “Quais elementos são considerados necessários para serem aplicados no desenvolvimento e
A estratégia utilizada para alcançar o objetivo desta pesquisa
consiste da Revisão Sistemática da Literatura – RSL, que a partir de uma
questão específica faz-se um levantamento bibliográfico em bases de dados específicas da área, no caso, Ciência da Informação, onde os resultados serão selecionados, avaliados criticamente, para então se coletar e analisar os dados.
Inicialmente foi realizada pesquisa bibliográfica para a construção e embasamento do referencial teórico que descreve os elementos de fundamentação teórica da pesquisa, bem como a definição dos conceitos empregados e apresenta como apoio para contextualizar o tema a produção científica no contexto do acesso aberto e nos repositórios digitais e a comunicação na Ciência como atividade geradora de conhecimento e de desenvolvimento social. Aborda ainda o movimento do acesso aberto à informação científica que surgiu do empenho dos pesquisadores em tornar livre o acesso ao que é produzido na pesquisa por todo o mundo, e permitiu a interoperabilidade entre os sistemas através do modelo OAI-PMH. Apresenta os conceitos de repositórios digitais, bibliotecas digitais e repositórios institucionais ressaltando o surgimento destes como forma de viabilizar o acesso livre.
O capítulo seguinte apresenta a metodologia empregada, Revisão Sistemática da Literatura, como método utilizado para encontrar dentro da literatura os subsídios que potencializam o uso dos repositórios digitais nas instituições. Inicialmente são descritas as fases a serem percorridas no decorrer da pesquisa, em seguida dar-se início a aplicação das fases com a elaboração da questão norteadora, localização e seleção dos estudos, seleção dos resumos, análise dos resumos, seleção dos artigos, extração de informações dos artigos e a análise dos dados e resultados.
2 OBJETIVOS
2.1 Objetivo geral
Investigar na literatura especializada fatores críticos de sucesso visando a obter subsídios para o planejamento, a implantação e a gestão de repositórios digitais.
2.2 Objetivos específicos
1) Apresentar aspectos conceituais, históricos e de finalidades específicas dos repositórios digitais buscando a contextualizar a sua atuação na produção e comunicação do conhecimento em Ciência;
3 A PRODUÇÃO CIENTÍFICA NO CONTEXTO DO ACESSO ABERTO E NOS REPOSITÓRIOS DIGITAIS
Esta seção discute aspectos da produção e da comunicação do conhecimento, como resultado das atividades científicas exercidas pelos pesquisadores. Apresenta o papel da Biblioteca Digital e do Repositório Institucional na dinâmica da comunicação e disseminação da produção científica. Destaca a questão do acesso aberto à informação nesse contexto, uma vez que os caminhos que compõem a dinâmica da disseminação da informação científica na atualidade estão voltados para o movimento do acesso aberto dos arquivos dispostos nos repositórios digitais, os quais de acordo com Moreno, Leite e Márdero Arellano (2006) estão sendo utilizados pelas
universidades “para apoiar e tornar mais ampla a divulgação dos resultados
das pesquisas bem como maximizar o seu impacto, criando mecanismos para
legitimar e estimular a publicação dos trabalhos produzidos”.
3.1 Produção e Comunicação na Ciência
A produção e a comunicação científica constituem-se de pré-requisitos para a efetivação e desenvolvimento de uma área do saber. É o resultado das pesquisas desenvolvidas pelos cientistas e compartilhadas, em livros e revistas científicas pelas comunidades específicas de cada área. Para
Targino (2000) é “atribuição dessas comunidades compartilhar os
conhecimentos científicos com toda a sociedade”, já que “o processo de
comunicação científica consiste na interação psicológica entre os interesses
individuais e grupais, mediante influência recíproca e permanente” (Muller,
1995).
A ciência é vista por Ziman como um produto da humanidade, “um
conhecimento público disponível livremente para todos”, que deve ser
compartilhada.
[...] não significa simplesmente conhecimentos ou informações publicados. Qualquer pessoa pode fazer uma observação ou criar uma hipótese [...] o conhecimento científico é mais do que isso. Seus fatos e teorias têm de passar por um crivo, por uma fase de análises críticas e de provas [...]. O objetivo da Ciência não é apenas adquirir informação, nem enunciar postulados indiscutíveis; sua meta é alcançar um consenso de opinião racional que abranja o mais vasto campo possível.(ZIMAN,1979, p. 24)
Em seu artigo “Comunicação Científica”, Targino (2000, p. 2)
defende que “a ciência busca, essencialmente, desvendar e compreender a
natureza e seus fenômenos, através de métodos sistemáticos e seguros”.
Sistemas estes de caráter não permanente, fazendo da ciência “uma instituição
social, dinâmica, contínua e cumulativa”, influenciando diretamente a
humanidade e ampliando as fronteiras do conhecimento.
A Ciência está sempre em constante transformação, influenciando e
ao mesmo tempo acompanhando o Homem, “criando e alterando convicções,
modificando hábitos [...] ampliando de forma contínua as fronteiras do
conhecimento” (TARGINO, 2000, p. 2). Mas para além de seus conceitos, “a
existência e o exercício da Ciência estão condicionados à sua função social, que pressupõe a comunicação ou o conhecimento público” (PINHEIRO, 1997).
Dessa forma, o ato de praticar a Ciência implica consequentemente o ato de publicá-la, registrá-la para que esta não se perca no tempo deixando de cumprir com a sua função na sociedade. Nesse sentido, a produção científica irá materializar o conhecimento científico.
A perpetuação da Ciência faz parte da sua natureza e utiliza métodos específicos de investigação e ainda produz uma literatura que registre os acontecimentos decorrentes da atividade científica. De acordo com Muller
(1995, p.64) “a literatura de um assunto científico é tão importante para ele
não fossem” registrados e divulgados, disponibilizando os resultados das pesquisas ao alcance de outras gerações de pesquisadores.
A comunicação faz parte do processo de construção do conhecimento científico. Essa necessidade levou cientistas e pesquisadores a buscarem soluções de intercâmbio para transferirem uns para os outros os resultados de suas pesquisas.
O termo “comunicação científica” teve suas primeiras definições
através do cientista irlandês John Desmond Bernal1, autor do livro a função
social da ciência, que de acordo com Souza (2003, p. 136) a definição de
Bernal refere-se a um “amplo processo de geração e transferência de
informação”. Ainda sobre a definição de comunicação científica, Garvey (1979) afirma que a esta engloba vários aspectos relativos à produção, disseminação e uso da informação sobre resultados de pesquisas, até que estes resultados se transformem em conhecimento científico.
O modelo adaptado do sistema de comunicação científica de Garvey é proposto por Hills, que de acordo com Costa (1999, p. 53) é o primeiro a ser sugerido após as contribuições de Garvey, e afirma que o processo de comunicação científica consiste na interação integral e complexa de seis componentes, a saber: o pesquisador, a comunidade científica, o editor, a pesquisa, o bibliotecário e as novas tecnologias de comunicação. Entre outros há também a proposta de Julie M. Hurd, que apresenta uma nova modelagem incluindo as novas tecnologias como um fator que influencia nos processos e considera o impacto que o desenvolvimento tecnológico possui sobre a transferência de informação.
De acordo com Costa
[...] o desenvolvimento tecnológico é considerado como tendo um impacto sobre a transferência de informações descrita neste modelo. Uma das preocupações desta discussão é que o maior impacto da tecnologia da informação no processo de comunicação científica esteja relacionada à mudança estrutural, tanto no sector da informação e do ambiente de trabalho dos autores e utilizadores
1
finais, que, assim, cria uma nova infraestrutura para a comunicação científica.(COSTA, 1999, p. 55)
Essas mudanças acarretaram um maior impacto nos processos de comunicação que envolve os pesquisadores, comunidade e usuários de
informação. Como descrito por Valério (2012, p. 151) “[...] essa nova forma vem
a serviço da solução de problemas relacionados à transmissão de dados ou informações que geram conhecimento, oferecendo novo meio de disseminação
e divulgação do conhecimento, beneficiando a todos”.
Parece ser comum entre estudiosos como Valério (2012), Pinheiro e Príncipe (2012) e outros que se dedicam a pesquisa sobre comunicação científica, que a demanda por informação, não só por parte dos pesquisadores de comunidades específicas, mas também por um público geral, tem incitado uma nova dinâmica na comunicação científica. Isso se deve ao fato de haver
“maior circulação da informação, do acesso livre, da rapidez na distribuição e
divulgação da produção científica” (VALÉRIO, 2012, p. 153), resultando no
acesso às informações científicas por meio da internet, sem que o público seja especializado e ao mesmo tempo reduzindo as barreiras de acesso ao conhecimento científico. O que vai de encontro com a proposta dos repositórios digitais.
Os repositórios digitais se constituem como ferramentas tecnológicas de informação e comunicação favorecendo a disseminação da produção e comunicação do conhecimento.
Nesse sentido muitos pesquisadores têm se dedicado em estudar as novas formas de comunicação em meio eletrônico. Souza (2003, p. 137)
argumenta que a “rapidez na divulgação faz com que descobertas sejam
colocadas à disposição de outros pesquisadores no menor espaço de tempo possível, possibilitando que o conhecimento circule e sirva para novas
pesquisas”. Nessa perspectiva de “rapidez da divulgação” da produção, os
repositórios digitais proporcionam a comunicação ser realizada em tempo real, permitindo a troca simultânea de ideias e colaborações entre pesquisadores.
Vickery (1999, p. 513) também faz contribuições ao analisar como se desenvolveu a comunicação técnico-científica durante o século XX e aponta para o acesso aberto como o mais novo meio utilizado pelas comunidades. Para o autor este novo modelo (acesso aberto) é flexível, uma vez que a comunicação científica acontece independente da ordenação sequencial das etapas. Dessa forma os autores passam a ser editores, e editores assumem a função de gráficas, bibliotecas e livrarias tornam-se produtores de banco de dados e hospedeiros. Dessa forma, entendemos que os repositórios digitais atendem a essa flexibilização de papeis.
Esta troca de funções nos processos comunicacionais, consolidada a partir do uso da internet para o acesso aberto da produção científica, se caracteriza como um novo paradigma para a sociedade que abre caminhos para o acesso ao conhecimento científico, como demostram as palavras de Orrico e Oliveira:
[...] a partir do advento das tecnologias da informação que vieram à luz com a internet e com a discussão a respeito do impacto dos arquivos abertos e do movimento do livre acesso no ensino e pesquisa, passou-se a ter a chance de facilitar o acesso ao que é produzido dentro do universo acadêmico. (ORRICO E OLIVEIRA, 2007)
pares por novos canais de comunicação, como os repositórios de pré-prints ou
e-prints. Valério (2012) aponta que “a primeira iniciativa de arquivamento para
pré-prints eletrônicos (e-prints) e artigos científicos foi o ArXiv.org, criado por
Paul Ginsparg”. Posteriormente outros mecanismos foram surgindo, como o
E-lis, repositório específico da área de Ciência da Informação, o Eprints Network de área multidisciplinar e muitos outros abrangendo várias áreas do conhecimento.
O acesso livre e aberto proporcionado pelos repositórios reforça o quanto as redes eletrônicas impulsionam na operacionalização da oferta de informação, dando um amplo acesso à ciência não só para as comunidades científicas, mas também para a população e com isso abrindo novos públicos na busca do conhecimento.
Para Le Coadic o sistema de construção do conhecimento, integrou-se ao deintegrou-senvolvimento econômico e social a ponto de conferir às sociedades modernas suas características principais. Na sociedade atual, há integração da ciência com o sistema de produção. A industrialização passa pela ciência e a ciência passa pela industrialização. O sistema de pesquisa científica está diretamente ligado ao desenvolvimento econômico, sendo representado pelo esquema produção, distribuição e consumo.
Para o pesquisador (a construção do conhecimento) se desenvolve
em volta de um “sistema de relações objetivas entre posições adquiridas [...] é
o lugar, o espaço de jogo, de uma luta concorrencial” (ORTIZ, 1983, p. 124).
“Atualmente percebe-se que cada ator que compõe esse sistema participa de
um jogo, cada qual defendendo seus interesses, e o fato de cada um
desempenhar vários papéis torna o sistema ainda mais complexo” (BARROS,
2010, p. 58).
A visibilidade da produção científica de uma instituição ou de uma universidade ganha impulso tanto através do movimento de acesso aberto à informação quanto pela criação de repositórios digitais, como as bibliotecas digitais e os repositórios institucionais, temas que serão abordados a seguir.
3.2 O Movimento do Acesso Aberto à Informação
Remover as barreiras de acesso a essa literatura vai acelerar a pesquisa, enriquecer a educação, compartilhar o aprendizado dos ricos com os pobres e os pobres com os ricos, fazer essa literatura tão útil quanto pode ser, e lançar as bases para unir a humanidade em um intelectual comum conversa e busca de conhecimento (BUDAPESTE OPEN ACCESS INITIATIVE, 2002).
A comunicação da pesquisa científica é alvo de muitos estudos, principalmente se considerarmos que a explosão informacional tem acelerado a produção científica desde a Segunda Guerra Mundial, e o controle e disseminação dessa informação têm sido um desafio constante no cenário científico. Neste sentido o ciclo que envolve a produção científica oriunda das Universidades e Institutos de Pesquisa não se encerra na comunicação da
pesquisa, “que deve promover novos usos na literatura para alcançar seu
objetivo social” (WEITZEL, 2006), interagindo com outros cientistas e
estimulando novos trabalhos. Para isto se faz necessário que um trabalho científico além de ser assimilado seja também transferido por outros cientistas,
gerando outras novas pesquisas, através da citação desses documentos. “Em
quase todas as disciplinas científicas, o meio mais aceito para se fazer isso e
determinar a prioridade é o artigo científico” (GOTTFREDSON 1976 apud
WEITZEL, 2006, p. 166).
No entanto Guedon (2001) afirma que o periódico científico passou a
ser uma “marca de produto” não correspondendo a sua principal função, que é
a de transferir informação e alimentar a demanda e necessidade de pesquisa dos cientistas. Consequentemente tornaram-se uma barreira de acesso ao
conhecimento, pois na medida em que se tornavam “marca”, também se
A partir de então surgiram propostas que tentavam solucionar questões levantadas a cerca do atual sistema de comunicação e disseminação
de informação científica, como a de Garvey e Gottfredson (1976 apud
WEITZEL, 2006.) que pensavam em viabilizar um sistema integrado de periódicos para submissão de preprints.
Entre tantas tentativas de solucionar o problema, destaca-se o consórcio feito entre editores e bibliotecas que pagam para ter acesso aos periódicos por um longo período. No Brasil este consórcio foi feito através da
CAPES2 com a criação do portal de periódicos3, que tinha o objetivo de
fortalecer a pós-graduação no Brasil. O projeto disponibiliza para as bibliotecas
de Instituições de Ensino Superior – IES mais de 33 mil periódicos com texto
completo, porém com o acesso restrito. Este tipo de iniciativa foi denominado por Duranceau e Harnad (1999) de “Cavalo de Tróia”.
Porém Harnad defende e é precursor de uma proposta que visa o acesso livre à produção científica, removendo as barreiras de custos que impossibilitam o acesso à informação científica produzida com o financiamento dos investimentos públicos. Esta proposta impulsionou a criação do movimento do acesso livre, que foi motivado pela vontade dos pesquisadores em publicar os resultados de suas pesquisas e contribuir para o progresso da ciência sem ter que pagar tão caro para acessá-las, sendo isso feito de forma gratuita e livre.
O movimento do acesso livre ou OA (open access) surgiu de uma polêmica proposta em incentivar os autores ou pesquisadores acadêmicos a alterar a forma de publicar seus estudos que até então eram submetidos às revistas científicas ou anais de eventos pagos, de forma a permitir que estes resultados de pesquisas estivessem disponíveis em periódicos gratuitos na
internet. (BRENT, 1995); (SYLVIA, 1995). Uma “subversiva” alteração nos
modelos de publicação e acesso ao conhecimento científico, um conclame para
2
Sigla que corresponde à Coordenação de Aperfeiçoamento do Pessoal de Nível Superior. http://www.capes.gov.br/
3
Portal de Periódicos Capes:
que os pesquisadores divulguem suas pesquisas livre das altas cobranças para
ter acesso. (HARNAD, 1994 apud BRENT, 1995)
O OA consiste na “disponibilização livre na internet da literatura de
caráter acadêmico ou científico, permitindo a qualquer utilizador ler, descarregar, copiar, distribuir, imprimir, pesquisar ou referenciar o texto
integral” (RODRIGUES, 2004. p. 9). Ou ainda, “o acesso amplo e sem
restrições aos conteúdos disponíveis em formato digital, no sentido em que remove barreiras de preço e de permissão, tornando a literatura científica
disponível com o mínimo de restrições de uso” (SUBER, 2003, p. 4). Neste
contexto os repositórios digitais se caracterizam como uma das formas de viabilização do acesso aberto, eles possibilitam a acessibilidade e comunicação que produzirão benefícios para a sociedade (SWAN, 2008), que por sua vez necessita cada vez mais do acesso ao conhecimento para melhor se desenvolver. O fato é que o acesso aberto facilita o fluxo da informação numa
específica área do conhecimento. “É simplesmente uma forma de tornar os
resultados de investigação acessíveis livremente online para toda a
comunidade científica” (RODRIGUES, 2004).
O movimento também impulsionou o surgimento de alternativas no
processo de comunicação científica, “se afirmando e dominando o panorama
da publicação e originando uma mudança significativa na paisagem da publicação científica, [...] sendo um dos eventos mais significativos em
publicação nos últimos anos” (THE THOMSON CORPORATION, 2004, p. 16).
“A informação técnico-científica constitui-se de um bem público e global,
devendo estar disponível para o benefício de todos” (ALBERTS, 2002). Nessa
dinâmica, o acesso aberto está aos poucos transformando a cultura da aquisição da informação científica, bem como a sua produção, disseminação e uso (WEITZEL, 2006, p. 115).
Para Leite (2006) o “acesso aberto é visto como um maximizador ao acesso à pesquisa propriamente dita”, “acelerando o impacto das pesquisas e
sua produtividade, progresso e recompensas” (HARNAD, 2004).
indexação ou utilizá-los para qualquer outro propósito legal (LEITE, 2006).
Para Harnad (2004) as publicações com acesso restrito possuem impacto limitado, em contra partida o acesso aberto proporciona ao pesquisador um acesso ilimitado às produções científicas (ver figura 1). Um
estudo realizado por HARNAD4 (2004 apud LAWRENCE, 2001) constatou que
artigos de acesso aberto on line possuem uma média de 336% a mais de citações em relação aos artigos pagos off-line publicados no mesmo local.
Também se constataram os benefícios do acesso aberto num estudo encomendado pela SURF foundation à Victoria University de Melborn em que se analisaram os custos e os benefícios potenciais de modelos alternativos
para comunicação científica e acadêmica na Holanda. “O relatório conclui que
as vantagens não seriam apenas em longo prazo, na fase de transição também, um acesso mais aberto aos resultados da investigação teriam efeitos
positivos” (HOUGHTON, 2009).
Com esse mesmo propósito foi realizado dois estudo que merecem destaque:
a) Research Communication Cost in Australia, Emerging Opportunites and Benefits sobre a realidade dos custos na Austrália;
b) Economic Implications of Alternative Scholarly Publishing Models: Exploring the Costs and Benefits encomendado pelo JISC com relação aos custos e benefícios com as alternativas de comunicação científica no Reino Unido.
4
Artigo publicado na revista Nature (2001), disponível em:
Figura 1 – Maximização da Pesquisa pelo Auto Arquivamento
Fonte: HARNAD, 2004
Ainda de acordo com Harnad (2004) existem duas estratégias de acesso aberto: a via verde e a via dourada.
1. Via verde é a estratégia de auto arquivamento pelos autores que possuem seus artigos publicados em revistas científicas de acesso restrito, mas que também os depositam em repositórios institucionais sob proteção de licença específica (Creative Commons);
2. Via dourada trata-se das revistas científicas que possuem os artigos disponíveis sem restrições de acesso e respeitando os direitos autorais.
Na década de 1980 as revistas acadêmicas tiveram uma alta nos
preços de mais de 200%5. Os preços subiram rapidamente e sem correlações
diretas com a qualidade e o impacto das revistas, inclusive as bibliotecas que detinham um bom incentivo financeiro pelas suas instituições de origem não conseguiam comprar o conteúdo do qual necessitavam seu público, neste momento o crescimento do conhecimento chegava a ser exponencial e os orçamentos não conseguiam alcançá-lo. Esse período ficou conhecido pela
literatura científica como a “crise dos periódicos científicos”
(SALAGER-MEYER, 2012); (BAPTISTA et al., 2007); (KURAMOTO, 2012); (WEITZEL, 2005, 2006); (HARNAD, 2001)
Os preços das revistas tornaram-se um entrave para que os pesquisadores tivessem acesso às publicações, dificultando de certa forma o
acesso aos resultados da ciência. “Essa alta nos preços dos periódicos fez
proliferar uma dicotomia na realidade científica, a primeira relacionada aos pesquisadores que tentavam maximizar o acesso ao conhecimento, e a segunda relacionada aos editores de revistas que tentavam maximizar os
lucros” (SALAGER-MEYER, 2012, p. 58).
O movimento do acesso aberto se manifestou de várias formas e
todas com a intenção de “fornecer ao público, irrestrito, livre acesso à pesquisa
acadêmica, financiada pelo governo” (BUDAPESTE OPEN ACCESS
INITIATIVE, 2012). Como consequência a pesquisa tornar-se-ia acessível publicamente para todos, de forma gratuita e sem restrições de copyright e licenciamento, acelerando os resultados das pesquisas científicas e permitindo aos autores um maior número de leitores.
Das iniciativas que marcam o movimento do acesso aberto à
informação científica destacam-se: 1) a criação do ArXiv6 em agosto de 1991
originalmente desenvolvido por Paul Ginsparg e inicialmente um arquivo de preprints da Física e posteriormente expandido a outras áreas como a Matemática, Ciência da Computação, Biologia Quântica e Estatística. Atualmente é mantido e operado pela Biblioteca da Universidade de Cornell; 2)
5
Estudo realizado pela ARL com os periódicos vendidos entre os anos de 1986 e 2004. Disponível em:< http://www.arl.org/stats/arlstat/graphs/2004/monser2004.pdf)>.
6
a criação da “The Schorlarly Publishing & Academic Resources Coalition” –
SPARC pela Association Research Libraries - ARL, em 19987 (RODRIGUES,
2004, p. 33), uma aliança internacional de bibliotecas acadêmicas e de pesquisa que trabalham para corrigir as dificuldades no sistema de publicação científica e estimulam o surgimento de novos modelos de comunicação científica que ampliam a divulgação da pesquisa acadêmica e reduzam as
pressões financeiras sobre as bibliotecas; 3) o Fórum da American Scientist8,
também denominado de September98-Forum, moderado por Steven Harnad, precursor do movimento do acesso aberto; e 4) a Declaração de Independência, que segundo Rodrigues (2004) está relacionada ao ato de
demissão de parte dos editores do “Journal of Academic Librarianship” e do
lançamento do “Portal: Libraries and the Academy”.
Outra iniciativa que merece destaque é a Open Archives Initiative9 –
OAI, apoiada e financiada pela Andrew W. Mellon Foundation, Coalition for Networked Information, a Biblioteca Digital da Federação, e da National Science Foundation, a OAI desenvolve e promove padrões de interoperabilidade que visam facilitar a disseminação eficiente da informação.
Pensando em otimizar a forma como se disponibilizavam arquivos de Eprints em acesso aberto, no ano de 1999, a OAI reuniu em Santa Fé, no Novo México, representantes de organizações mantenedoras ou que planejavam futuros arquivos de Eprints, a Convenção de Santa Fé, tinha o
objetivo de “estabelecer padrões para arquivos de Eprints se tornando um
mecanismo instituído para a comunicação científica, com um nível de
interoperabilidade entre eles” (CONVENÇÃO DE SANTA FÉ PARA INICIATIVA
DE ARQUIVOS ABERTOS). A Convenção de Santa Fé apresenta uma estrutura técnica e organizacional concebida para facilitar a descoberta de conteúdo armazenado em arquivos Eprints. Faz recomendações técnicas
7
Hoje a SPARC possui cerca de 800 membros na América do Norte, China, Japão, Austrália e Europa e trabalha para promover o compartilhamento mais rápido das pesquisas acadêmicas, aumentando o impacto, estimulando o avanço do conhecimento e elevando o retorno sobre os investimentos em pesquisa e bolsa de estudos. Mais informações sobre a SPARC em: http://www.sparc.arl.org/index.shtml
8
Disponível em:< http://www.cogsci.soton.ac.uk/~harnad/Hypermail/Amsci/subject.html >
9
fáceis de implementar permitindo que os dados dos arquivos tornem-se amplamente disponíveis através da sua inclusão em uma variedade de serviços para o usuário final. Dessa forma a Open Archives Initiative Protocol for Metadada Harvesting - OAI-PMH contribuiu com o desenvolvimento e maior aceitação do acesso aberto pelas comunidades acadêmicas. Este assunto será abordado numa seção específica.
Posteriormente outras manifestações de apoio, que visavam o reconhecimento do acesso aberto pela comunidade científica, foram elaboradas, dentre elas destacamos as seguintes:
a) A Budapeste Open Access Initiative - BOAI10
Realizada no ano de 2002 em Budapeste, na Hungria, a BOAI é considerada uma das reuniões mais importantes para o movimento do acesso aberto, tendo como objetivo a promoção do acesso livre à informação científica. Recomenda duas estratégias para se atingir o acesso aberto: 1) o auto arquivamento: que se caracteriza no depósito pelos autores dos arquivos publicados anteriormente em revistas de acesso restrito em repositórios institucionais; e 2) revistas de acesso aberto: revistas que possuem seu acesso livre e gratuito para que o seu conteúdo seja consultado, sem que haja o pagamento, pois o preço é uma barreira ao acesso.
Em comemoração aos dez anos de realização da campanha mundial para o acesso aberto pela Budapeste Open Access Initiative, fora realizado em 2012 um novo encontro pelos maiores representantes do movimento de todo mundo a fim de promover recomendações para os próximos anos e reafirmar o
compromisso de “acelerar a pesquisa, enriquecer a educação, compartilhar a
aprendizagem11” (BUDAPESTE OPEN ACCESS INITIATIVE, 2012).
10
Disponível em: http://www.opensocietyfoundations.org/openaccess
11
Dez anos depois da Budapest Open Access Initiative: definir o padrão para abrir. Disponível em:
Como resultado desta reunião a BOAI estabeleceu padrões que abrangem todos os envolvidos no processo do acesso aberto, como as Universidades, Institutos de Pesquisa, Fundações de Amparo à Pesquisa, Pesquisador-Autor. As recomendações são referentes à:
1. Política;
2. Licença de uso e Reutilização;
3. Infraestrutura e Sustentabilidade (Repositórios);
4. Coordenação e Promoção de uso do acesso aberto (Diretrizes em comum acordo com as políticas institucionais);
b) Declaração de Berlim
A Conference on Open Access to Knowledge in the Science and Humanities realizada em 2003 em Berlim, sob a coordenação da Max Planck
Institute, culminou na Declaração de Berlim12. Esta conferência é considerada
pela literatura da área como um acontecimento de grande importância para o acesso livre, por discutir questões relativas ao acesso aberto ao resultado das pesquisas financiadas com os recursos públicos; e para a comunicação científica, por destacar o uso da tecnologia como alternativa para a sua promoção.
De acordo com Kuramoto (2006a) a Declaração de Berlim obteve o apoio de vários institutos de pesquisa na Europa, bem como de pesquisadores e órgãos internacionais e estabeleceu a seguinte missão:
A nossa missão de disseminar o conhecimento estará incompleta se a informação não for tornada rapidamente acessível e em larga escala à sociedade. Novas possibilidades de difusão do conhecimento, não apenas através do método clássico, mas também, e cada vez mais, através do paradigma do acesso livre via Internet devem ser apoiadas. Nós definimos o acesso livre como uma fonte universal do conhecimento humano e do património cultural que foi aprovada pela comunidade científica. Para concretizar esta visão de uma representação global e acessível do conhecimento, a Web do futuro tem de ser sustentável, interativa e transparente. Conteúdos e ferramentas de software devem ser livremente acessíveis e
12
compatíveis. DECLARAÇÃO DE BERLIM (2003 apud KURAMOTO, 2006).
c) Declaração de Bethesda
Também realizada em 2003, a Declaração de Bethesda13 instituiu-se
da reunião de pesquisadores da Biomédica em tornar possível o acesso aberto a todos que necessitam do acesso ao conhecimento gerado como resultado das pesquisas realizadas.
Estas conferências serviram de abertura para muitas outras realizadas mundialmente como a Declaration on Access to Research Data from Public Funding declaração aprovada por representantes da The Organisation
for Economic Co-operation and Development – OECD14; o apoio da UNESCO15
ao acesso aberto e livre aos resultados das pesquisas científicas;
Compromisso do Minho – elaborado durante o 2º. Congresso sobre Acesso
Livre à Informação Científica em Países Lusófonos, realizado em 2006, na Universidade do Minho, Portugal (ROSA, 2011).
As iniciativas de tornar acessível livremente os resultados das pesquisas científicas colocou o Brasil numa posição favorável de desenvolvimento do acesso livre, que teve seus primeiros registros a partir de 1996 com a publicação eletrônica na web e de acesso livre da Revista Encontros Bibli. Em seguida com o financiamento do Fundo de Apoio a Pesquisa do Estado de São Paulo - FAPESP e Biblioteca Virtual em Saúde - BIREME e com a colaboração da Scielo várias revistas científicas tiveram seu acesso livre (CUNHA, 2005).
Entre as iniciativas no Brasil destaca-se a Biblioteca Digital de Teses
e Dissertações – BDTD, uma ação do Instituto Brasileiro de Informação em
Ciência e Tecnologia - IBICT, que adotou o modelo Open Archives e Open
13
Informações sobre a Declaração de Bethesda podem ser vistas na íntegra em: http://legacy.earlham.edu/~peters/fos/bethesda.htm
14
http://www.oecd.org/about/
15
Access, disponibilizando teses e dissertações na íntegra; e posteriormente o lançamento da revista eletrônica Ciência da Informação nos moldes do Open
Journal Systems – OJS, um software de editoração de revistas eletrônicas que
utiliza o modelo OAI.
Porém o movimento do acesso aberto obteve maior destaque na sociedade científica brasileira após o lançamento do Manifesto Brasileiro de Acesso Livre à Informação Científica, conferência realizada em 2005 por meio
eletrônico “para representantes das sociedades e associações científicas,
Universidades e pesquisadores” (KURAMOTO, 2006b). Ainda no ano de 2005,
em Salvador por ocasião do 9º Congresso Mundial de Informação em Saúde e Bibliotecas foi também lançada, no International Seminar on Open Access, um evento paralelo, no qual os participantes elaboraram a Declaração de
Salvador16, que exibia uma lista de motivos em favor ao open access.
Outro momento importante fora a publicação da Declaração de São
Paulo17 em 2005, e no ano seguinte, 2006 a Declaração de Florianópolis18,
lançada por ocasião do XI Simpósio de Intercâmbio Científico da Associação Nacional de Pesquisa e Pós-graduação em Psicologia. Estas iniciativas foram importantes para a ampliação do movimento do acesso aberto no Brasil, estimulando muitas outras comunidades científicas a se engajar na legitimação do movimento no país.
O movimento do acesso livre aos poucos tenta se estabelecer no meio acadêmico, na medida em que os pesquisadores tomam consciência do quão gratificante é para as instituições e para o progresso da Ciência o livre acesso tenta aos poucos se legitimar. Essa legitimação conta com o apoio da Iniciativa dos Arquivos Abertos ou OAI, que estabeleceu um modelo padrão de interoperabilidade que será apresentado na próxima seção.
16
Declaração de Salvador disponível em:
<http://www.icml9.org/channel.php?lang=pt&channel=86&content=428>
17
Declaração de São Paulo:
<http://www.acessoaberto.org/carta_de_sao_paulo_acesso_aberto.htm>
18
3.3 O modelo Open Archives: estrutura e acesso
O modelo Open Archives surgiu “com o intuito de transformar o
processo de comunicação científica, propor uma unidade de especificações
técnicas e princípios administrativos, baseando-se na “Filosofia aberta” para o
compartilhamento de informações” (MORAES, 2010). Para isso, em 1999 na
Convenção de Santa Fé fora criado a Open Archives Initiative – OAI, que
propunha especificações técnicas e princípios gerenciais cujo objetivo é de publicar os resultados das pesquisas científicas em canais de acesso aberto, para isso fora estabelecido pela Iniciativa dos Arquivos Abertos padrões e normas de interoperabilidade através do protocolo OAI-PMH visando proporcionar a comunicação entre os diversos repositórios digitais de acesso livre.
A seguir discutiremos a questão da interoperabilidade, por ser considerada uma característica chave na estrutura e acesso aos modelos de Open Archive.
A interoperabilidade “consiste na possibilidade de um usuário
realizar buscas a recursos informacionais heterogêneos, armazenados em
diferentes servidores na web, [...]” (SANTOS JUNIOR, 2010, p. 40) em uma
plataforma única.
No dicionário on line de Biblioteconomia e Ciência da Informação19 a
interoperabilidade é definida como “a capacidade de um sistema de hardware e
software se comunicar e trabalhar efetivamente com o intercâmbio de dados de outros sistemas diferentes, projetados e produzidos por fornecedores diferentes”.
Para Baptista (2010, p. 75) a interoperabilidade é importante para se estabelecer uma comunicação em diversos níveis e a sua falha ou inexistência poderá comprometer toda tentativa de comunicação.
Atualmente a interoperabilidade tem sido um alvo para os desenvolvedores e operadores de repositórios institucionais e bibliotecas
19
digitais que funcionam em rede. E se constitui como um processo que assegura aos diferentes sistemas e também às diferentes culturas organizacionais se comunicarem entre si, maximizando a recuperação e a utilização sem fronteiras da informação.
De acordo com os comentários de Carvalho (2009, p. 25) sobre Arms (2000) a interoperabilidade é o desafio de projetar serviços para diversos usuários a partir de sistemas e organizações diferenciados exigindo certo grau de cooperação, o que pode ser feito através de três níveis de acordo, a saber: a) nível técnico: incluem formatos, protocolos, sistemas de segurança para a troca de mensagens; b) nível de conteúdo: incluem a interpretação das mensagens através de acordos semânticos, dados e metadados; c) nível organizacional: incluem as regras básicas para acesso.
Dessa forma, para se estabelecer a interoperabilidade é necessário
que haja entendimento e para isso necessita-se de “um idioma comum que
possibilite a partilha não só da sintaxe e da estrutura, mas também, e isto é
muito importante, do significado dos termos, ou seja, da semântica”
(BAPTISTA, 2010, p, 72).
De acordo com o Dublin Core Metadada Initiative – DCMI20 e
corroborado por Sá (2013, p. 92) a interoperabilidade está distribuída em três níveis que dependem um dos outros. A saber:
a) interoperabilidade sintática, que está relacionada com a representação dos dados idênticos de forma que seja compartilhado por humanos e máquinas. Como por exemplo: Machine Readable Cataloging - MARC;
b) interoperabilidade estrutural, que por meio de modelos de dados especifica-se esquemas semânticos possibilitando o compartilhamento desses modelos. Por exemplo: Resource Description Framework - RDF;
c) interoperabilidade semântica que é obtida através da busca de informações em bases de dados distribuídas e heterogêneas, no qual o
20
esquema de metadados fora mapeada por outros. Isto é possível através das normas de descrição de conteúdo, como o Dublin Core.
De modo a assegurar a interoperabilidade e proporcionar o acesso à informação em diferentes meios e em diferentes línguas e formas, tornando-a acessível a um receptor ou a um grupo de receptores através de um código linguístico, foi desenvolvida uma série de protocolos e padrões de comunicação que transmitem, armazenam e codificam a informação, como o RDF, XML, OAI-PMH, Dublin Core, MARC, etc.
Para efeito desta pesquisa abordaremos apenas dois destes padrões: o OAI-PMH e o Dublin Core, por estarem diretamente relacionados ao movimento do acesso aberto.
a) Open Archives Initiative-Protocol of Metadada Harvesting (OAI-PMH)
Elaborada pelo Open Archives Initiative na Convenção de Santa Fé nos Estados Unidos, o OAI-PMH fornece um quadro de interoperabilidade aplicativa independente com base na coleta de metadados a partir do Dublin Core que rastreia e evita ao máximo a criação de novos metadados. O PMH
possui 6 request/solicitações que são codificadas em XML21 e oferece
simplicidade e eficiência na unificação das consultas a bases de dados científicas.
O uso eficaz dos metadados22 na representação da informação
favorece na recuperação precisa da informação e cada vez mais esse recurso vem sendo empregado no desenvolvimento de bibliotecas e repositórios
digitais. Isto porque “eles descrevem os atributos e conteúdo de um documento
original” (SÁ, 2013, p. 102), criando uma estrutura padronizada de descrição
dos documentos eletrônicos, sendo ainda uma tecnologia de baixo custo.
A primeira versão do OAI-PMH foi iniciada em 2001, uma plataforma experimental disponível para teste da coleta de metadados pelos utilizadores. Já a versão 2.0 de 2002, ainda utilizada nos dias de hoje, trata-se de uma
21
XML é uma linguagem apresentada pelo W3C, especifica dados em um formato legível por humanos, similar ao HTML. Sendo uma meta linguagem, pode ser utilizada para definir outros domínios ou linguagens específicas de um domínio (ex. matemático, químico, biológico).
22
revisão detalhada da versão 1.0. e melhorada através do comitê técnico formado pelos idealizadores da primeira versão.
A busca por metadados pelo protocolo é chamada de harvesting ou
colheita, é “um processo unilateral, que, a partir da lista de repositórios
cadastrados na Iniciativa, por meio do envio de solicitações/verbos coletam os
metadados para exibição pelos provedores de serviços” (GARCIA, 2003, p. 14).
Este harvesting pode ser realizado por base em critérios ou integral: a) set-based (baseado em conjuntos): que se estrutura como uma árvore de assuntos que representa a hierarquia do repositório; ou em b) date-based (baseado em data): onde serão colhidos os metadados alterados e/ou incluídos após uma data específica. (LAGOZE, VAN DE SOMPEL, 2001). O Quadro 1 a seguir apresenta os verbos e descreve as respectivas atribuições na colheita dos metadados pelos provedores de serviços, segundo Lagoze e Van de Sompel.
Quadro 1 - Verbos e atribuições de colheita (harvesting) de metadados
Verbos Atribuições
GetRecord Este verbo é usado para recuperar um registro individual (metadados) de um item em um repositório. Argumentos necessários especificam o
identificador, ou chave, o registro solicitado e o formato do metadados que devem ser incluídos no registro.
Identify Este verbo é usado para recuperar informações sobre um repositório. O esquema de resposta especifica que a seguinte informação deve ser devolvido pelo verbo identificar:
• Um nome legível para o repositório; • A URL base do repositório;
• A versão do protocolo OAI apoiado pelo repositório; • O endereço do administrador do repositório de e-mail.
ListIdentifier Este verbo é usado para recuperar os identificadores de registros que podem ser colhida a partir de um repositório. Argumentos opcionais permitem seletividade dos identificadores - com base em sua participação em uma conjunto específico no repositório ou com base na sua modificação, criação ou exclusão dentro de um período específico.
ListMetadataFormats Este verbo é usado para recuperar os formatos de metadados disponíveis num repositório. Um argumento opcional que restringe o pedido para os
formatos disponíveis para um registro específico.
ListRecords Este verbo é usado para coletar registros de um repositório. Argumentos opcionais permitem a selectividade da colheita - com base na adesão de registros em um conjunto específico no repositório ou base sobre a sua modificação, criação ou exclusão dentro de uma data específica range.
ListSets Este verbo é usado para recuperar a estrutura do conjunto em um repositório.
Estes verbos são enviados pelo provedor de serviços como solicitações ao provedor de dados, via HTTP (Hypertext Transfer Protocol), que
por sua vez atua fazendo a colheita. “Este processo é transparente para o
usuário final, que receberá a informação já coletada e tratada pelo provedor de
serviços, de maneira amigável” (GARCIA, 2003, p. 15).
Após a primeira tentativa da Iniciativa de estabelecer padrões de interoperabilidade para as bibliotecas digitais e repositórios de todo o mundo através do OAI-PMH, muitas instituições vem aderindo ao uso de recursos informacionais como Dspace, Eprints, etc, que promovem o uso e implementação do protocolo sem onerar custos altos para as instituições. Consequentemente estas instituições que adotam o modelo OAI compartilham dos mesmos metadados, integrando a produção científico-acadêmica e tornando-a visível ao mundo.
Atualmente muitos padrões de metadados vêm sendo aplicados na descrição de conteúdos, porém a norma Dublin Core é a mais usual, principalmente pelo OAI-PMH.
b) Dublin Core
Um dos maiores padrões internacionais de recursos de descrição de informações digitais, o Dublin Core, surgiu na cidade de Dublin, Ohio nos Estados Unidos, durante uma reunião, conforme descrevem Tammaro e Salarelli:
Em 1995, o OCLC, junto com o National Center for Supercomputing Applications (NCSA), promoveu uma oficina sobre metadados em Dublin, Ohio (EUA), que reuniu profissionais de informática, editores e especialistas de várias áreas disciplinares, com o objetivo de definir uma norma simples e utilizável para descrever os recursos informacionais em rede. Essa oficina levou ao surgimento de um dos mais notáveis e difundidos esquemas de metadados, que passou a ser conhecido, logo depois do encontro, como Dublin Core. (TAMMARO E SALARELLI, 2008, p. 219)
Atualmente a Dublin Core Metadada Initiative – DCMI tem como
De acordo com as palavras de Souza et al (2006) o Dublin Core estabeleceu um conjunto de elementos descritivos e possui características relevantes, como:
Simplicidade na descrição dos recursos - pode ser
usado por
não-catalogadores, autores ou websiters sem
conhecimento
prévio de todas as regras de catalogação;
Interoperabilidade semântica - promove o
entendimento comum
dos descritores, ajudando a unificar padrões de conteúdo, aumentando a possibilidade de interoperabilidade semântica
entre as disciplinas;
Consenso internacional - reconhecimento da
cobertura
internacional do escopo do recurso;
Extensibilidade - constitui uma alternativa aos
modelos de
descrição mais elaborados e caros. Possui flexibilidade e extensibilidade para codificar semânticas mais elaboradas em
padrões mais sofisticados.