Curadoria Digital
Arquivística
e Software Livre
http://documentosdigitais.blogspot.com
UFC - 10 de Março 2015
Prof. Dr. Daniel Flores
Estrutura
● Curadoria Digital;
● Repositórios Digitais;
● Vai além da Preservação Digital; é difusão,
acesso,
● O Software Livre;
● Alternativas e perspectivas;
● Conclusões;
Curadoria Digital
seleção, preservação, manutenção, coleção e
arquivamento de ativos ou dados digitais.
Curadoria Digital
Curadoria digital está relacionada ao processo de:
- criação e desenvolvimento de repositório de
dados para consultas atuais e futuras realizadas
por pesquisadores, cientistas, historiadores e
estudiosos.
Empresas/instituições
estão
começando a utilizar curadoria digital para
melhorar a qualidade da informação e dados em
seus processos operacionais e estratégicos .
Curadoria Digital
De acordo com Sayão (2012),
Os conhecimentos e as práticas acumulados na
última década em preservação e acesso a recursos
digitais resultaram num conjunto de estratégias,
abordagens tecnológicas e atividades que agora são
coletivamente conhecidas como “curadoria digital”.
Aspectos da curadoria digital
● Coleta de ativos digitais;
● Fornecimento de busca e recuperação de ativos digitais;
● Certificação de confiabilidade e integridade do conteúdo;
● Continuidade e comparabilidade semântica e ontológica do
conteúdo;
Desafios enfrentados pela curadoria digital
● Obsolescência e evolução do formato de armazenamento;
● Taxa de criação de novos dados e conjuntos;
● Amplo acesso e busca flexível e variada;
● Comparabilidade de definições semânticas e ontológicas dos
conjuntos de dados;
Os elementos-chaves são:
dado, objetos digitais e bases de dados.
Descrição e a representação da informação:
é efetivada pela atribuição de metadados administrativos, técnicos, estruturais e de representação de acordo com os padrões apropriados; visa assegurar a descrição adequada e o controle de longo prazo; compreende também a coleta e a atribuição de informações de representação necessárias para o entendimento do dado e para a sua apresentação (ou renderização).
Planejamento da Preservação:
é necessária a definição de um plano de preservação cujo espectro englobe todo o ciclo de vida da curadoria do material digital, incluindo gestão, administração, politicas, e tecnologias.
Participação e monitoramento:
enfatiza a necessidade de atenção para as atividades que se desenrolam no âmbito das comunidades envolvidas com o problema de curadoria, bem como a necessidade de participação no desenvolvimento de padrões, de ferramentas e de software adequados ao problema e que possam também serem compartilhados;
Curadoria e preservação:
estar continuamente alerta e empreender as ações administrativas e gerenciais planejadas para a curadoria e preservação por todo o ciclo de vida da curadoria.
Curadoria Digital
Ciclo de vida
CORRENTE
(1ª idade documental)INTERMEDIÁRIO
(2ª idade documental)PERMANENTE
(3ª idade documental) valor secundário Destinação Final é o Recolhimento/ Preservação “Permanente” TTDGestão considerando o e-ARQ
Sistema: SIGAD
Um ou vários sistemas, e pode conter sistemas de GED como ferramentas, garantindo controle do ciclo de vida,
o cumprimento da destinação prevista e a manutenção da autenticidade e da relação orgânica.
Repositório Arquivístico Digital Confiável:
Corrente e Intermediário
Repositório Arquivístico
Digital Confiável:
Permanente
Pode utilizar
Repositórios
No permanente é estratégico, fundamental: Resolução n° 39/2014 Conarq, OAIS, TRAC,METS, PREMIS Plano de Classificação
(Quadro de Arranjo), Navegação multinível, Acesso e Difusão AtoM
Ciclo de vida dos documentos, as 3 idades, Lei 8.159 (Lei de Arquivos), a 12.527, a LAI de
acesso à informação, Princípios Arquivísticos, Normas, Metodologias, sua epistemologia, etc
Ocorre aqui uma alteração da:
CADEIA DE CUSTÓDIA
RDC-Arq’s Repositórios Arquivísticos Digitais
FLORES, D., 2015 (Grupo CNPq Ged/A UFSM)
DAD’s
Plataformas
de Acesso
e-ARQ
Brasil/Moreq-JUS:
Gestão de Documentos
- Somente Idades
Corrente e Intermediária:
Nuxeo DM, KTree,
Alfresco, SIE, SIE-Gad?,
SEI, SIGAD-Aer,
Res. 43 CONARQ:
Arquivo Permanente Digital, e
Corrente e Intermediário para Docs.
Complexos e Longas Temporalidades
TRAC Auditoria e Certificação ISO
16.363, OAIS ou SAAI, Metadados
METS, Empacotamento BAG-It
Archivematica, RODA,
Acesso e Difusão:
ISAD(g), NOBRADE,
ISDF, ISDIAH, LAI Lei
12.527, EAD, EAC,
EAG
ICA-AtoM, AtoM,
ArchivistToolKit,
ContentDM, SepiaDES
DIP
SIP
AIP AIP AIPSIGAD’s
GestãoDOCPRODUTOR
ADMINISTRADOR
CONSUMIDOR
Sequência de ações do modelo de
ciclo de vida da curadoria digital
Conceitualização – conceber e planejar a criação do dado,
incluindo os métodos de captura e as opções de
armazenamento;
Criação e/ou Recebimento – compreende a criação do dado
incluindo o elenco de metadados necessários à sua gestão e
compreensão, ou seja, metadados administrativos, descritivos,
estruturais e técnicos;
Avaliação e seleção – avaliar o dado e selecionar o que será
objeto dos processos de curadoria e de preservação por longo
prazo;
Arquivamento – transferir o dado para um arquivo, repositório,
Sequência de ações do modelo de
ciclo de vida da curadoria digital
Ações de preservação – promover ações para assegurar a
preservação de longo prazo e a retenção do dado de natureza
oficial; as ações de preservação devem assegurar que o dado
permaneça autêntico, confiável e capaz de ser usado
enquanto mantém sua integridade;
Armazenamento – armazenar o dado de forma segura
mantendo a aderência aos padrões relevantes.
Acesso, uso e reuso – garantir que o dado possa ser
acessado tanto pela sua comunidade-alvo, quanto pelos
demais usuários interessados no reuso do dado;
Transformação – compreende a criação de novos dados a
Estágios aplicados eventualmente
ações ocasionais
Eliminação – eliminar os dado que não foram selecionados
para curadoria e preservação de longo prazo de acordo com
políticas documentadas, diretrizes ou exigências legais.
Reavaliação – retornar ao dado cujos procedimentos de
avaliação foram falhos para nova avaliação e possível
seleção para curadoria.
Migração – migrar os dados para um formato diferente; isto
pode ser feito no sentido de compatibilizá-lo com o ambiente
de armazenamento ou para assegurar a imunidade do dado
contra a obsolescência de hardware e de software.
Repositórios Institucionais
Refletindo com Sayão et al (org.) (2009, p. 10), os:
Repositórios Institucionais são entendidos hoje como
elementos de uma rede ou infraestrutura informacional
de um país ou de um domínio institucional destinados a
garantir a guarda, preservação a longo prazo e,
fundamentalmente, o livre acesso à produção científica
de uma dada instituição.
Repositório Digital
Um repositório digital é aquele onde conteúdos
digitais, recursos, estão armazenados e podem
ser pesquisados e recuperados para uso posterior.
Um
repositório
suporta
mecanismos
de
importação,
exportação,
identificação,
armazenamento e recuperação de recursos
digitais. (Digital Repositories JISC Briefing Paper,
2005)
Repositório Digital
Márdero Arellano (2010) define repositório
digital como sendo as aplicações provedoras de
dados que são destinadas ao gerenciamento de
informação
e
como
vias
alternativas
de
comunicação científica.
Já, Weitzel (2006) compreende que um
repositório digital é um arquivo digital que reúne
uma coleção de documentos digitais.
Repositório Digital
Sistemas de informação que armazenam, preservam,
divulgam e dão acesso à produção intelectual de
comunidades universitárias. Ao fazê-lo, intervêm em duas
questões estratégicas: contribuem para o aumento da
visibilidade e o “valor” público das instituições, servindo
como indicador tangível da sua qualidade; permitem a
reforma
do
sistema
de
comunicação
científica,
expandindo o acesso aos resultados da investigação e
reassumindo o controle acadêmico sobre a publicação
científica (DSPACE/IBICT, 2013).
Repositório Digital
A concepção de repositórios digitais como sendo um
simples armazenador estático de informação digital
com capacidade de recuperação foi rapidamente
ultrapassada. A ideia original deslocou-se para um
conceito mais sofisticado de sistema de informação que
incorpora a facilidade da comunicação, da colaboração
e de outras formas de interação dinâmica entre
usuários
de
um
vasto
universo
(SAYÃO
E
MARCONDES, 2009, p. 26).
Políticas do Software Livre
●
A FSF - Free Software Foundation considera um software como livre
quando atende aos quatro tipos de liberdade para os usuários:
○
Liberdade 0: A liberdade para executar o programa, para qualquer
propósito;
○
Liberdade 1: A liberdade de estudar o software;
○
Liberdade 2: A liberdade de redistribuir cópias do programa de modo
que você possa ajudar ao seu próximo;
○
Liberdade 3: A liberdade de modificar o programa e distribuir estas
modificações, de modo que toda a comunidade se beneficie.
●
Colabora para a preservação digital;
●
Leva consigo a adoção de padrões abertos, formatos abertos de
documentos (ODF: .odt, .odp, .ods, etc), PDF/A, OGG, PNG, XML, etc;
●
Interoperabilidade, independência de hardware, auditabilidade (acesso ao
código fonte), etc.
● auditabilidade;
● acesso ao código fonte;
● acesso à documentos sem restrições de licenças
proprietárias, com pagamentos de royalties;
● padrões abertos de documentos – ODF (ISO
26.300);
● colabora para a preservação digital;
● não é o grátis, e sim o acesso (liberdade).
Ainda,
● a interoperabilidade;
● a segurança;
● a privacidade;
● o enriquecimento tecnológico do país;
● fomento do idioma próprio;
● o princípio do conhecimento científico, não
reinventando a “roda”;
● etc.
Preservação Digital
“O conjunto de atividades ou processos responsáveis
por garantir o acesso continuado a longo-prazo à
informação e restante patrimônio cultural existente em
formatos digitais.” (FERREIRA, 2006, p. 20)
Ainda: - INNARELLI (2008); - MÁRDERO ARELLANO
(2004).
Conjunto de ações gerenciais e técnicas exigidas para
superar as mudanças tecnológicas e a fragilidade dos
suportes,
garantindo
acesso
e
interpretação
dos
documentos digitais pelo tempo que for necessário (CTDE).
- RODRIGUES (2003);
- FERREIRA (2006).
● Preservação de tecnologia;
● Refrescamento;
● Emulação;
● Migração/conversão;
● Migração para suportes
analógicos;
● Atualização de versões;
● Conversão para formatos
concorrentes;
● Normalização;
● Migração a pedido;
● Migração distribuída;
● Encapsulamento;
● A pedra de Rosetta
digital;
● Software Livre;
● Reprografia/
Microfilmagem.
Repositórios Digitais
● Diferente de um banco de dados com objetos digitais
inseridos;
● Tem mecanismos próprios de preservação digital;
● Considera os requisitos arquivísticos;
● Navegação multinível;
● fixidez (PREMIS …), estratégias de preservação digital
embutidas, etc.;
● o RDC-Arq é um conceito, temos aplicações em Software
Livre como o RODA e Archivematica, mas também pode ser
uma implementação a partir de um Repositório Digital que não
tem os requisitos arquivísticos, como o DSpace, Fedora,
Eprints, etc.
Repositório arquivístico digital
Um repositório digital de documentos arquivísticos é um
repositório digital que armazena e gerencia esses
documentos, seja nas fases corrente e intermediária, seja na
fase permanente. Como tal, esse repositório deve:
● gerenciar os documentos e metadados de acordo com
as práticas e normas da Arquivologia, especificamente
relacionadas
à
gestão
documental,
descrição
arquivística multinível e preservação;
● resguardar as características do documento arquivístico,
em especial a autenticidade (identidade e integridade)
Repositório Digital Confiável
TRAC, Nestor, Magenta, etc.
Uma forma de atestar a confiabilidade de um
repositório digital junto à comunidade-alvo se dá por meio
da sua certificação por terceiros. Para esse fim, o
RLG/OCLC em parceria com o National Archives and
Records Administration – NARA publicou em 2007, o
documento TRAC - Trustworthy Repository Audit &
Certification: Criteria and Checklist critérios e um checklist
a serem tomados como referência para a certificação de
repositórios digitais confiáveis. Esse documento serviu de
base para a elaboração da norma ISO 16363: 2012, que
lista os critérios que um repositório digital confiável deve
atender.
OAIS
O modelo de referência Open Archival
Information System – OAIS – é um esquema
conceitual que disciplina e orienta um sistema de
arquivo dedicado à preservação e manutenção
do acesso a informações digitais por longo
prazo.
ABNT - NBR 15.472/2007 (SAAI – SISTEMA ABERTO
DE ARQUIVAMENTO DE INFORMAÇÃO).
Origem do OAIS
●
Desenvolvimento
coordenado
pelo
CCSDS
–
Consultative Comittee for Space Data System;
●
ligado à NASA por encomenda da ISSO;
●
Participação ampla em escala mundial [do Brasil: INPE e
CTA];
●
Um produto de 10 anos de trabalho;
●
.. Red Book – maio de 1999;
●
.. Blue Book – janeiro de 2002;
Pacotes
SIP
– Pacote de Submissão de Informação
Entregue pelo Produtor a um OAIS para construção de
um ou mais AIP.
AIP
– Pacote de Arquivamento de Informação
Pacote de informação que será objeto de preservação.
DIP
– Pacote de Disseminação de Informação
Pacote de Informação derivado de um ou mais AIP,
recebido pelo Consumidor em resposta a uma requisição
dirigida ao OAIS.
Fluxograma dos Pacotes SIP/AIP/DIP
Empacotamento dos
SIPs:
Direto do SIGAD ou
Memorandos, Ofícios, e-mails, Fotografias, etc.
+ Metadados
(.CSV Excel - Dublin Core, METS)
Repositório Arquivístico Digital Confiável:
- Ao receber o pacote SIP, submete-o aos: - micro-serviços: anti-virus, validação, formatos,
metadados, etc …
- para então gerar o Pacote de Armazenamento, o AIP;
Passa permanentemente por:
- Políticas de Preservação; - Estratégias de Preservação; - Atualização de Formatos: - FPR (PREMIS); Pacote AIP gerado Submetido Pacote DIP para o ICA-AtoM Confirmado Difusão
Acesso e Difusão dos Documentos Arquivísticos Descritos, normalizados via Web.
Aplicabilidade
● O modelo OAIS pode ser aplicado a qualquer
instituição/arquivo,mas
ele
é
especificamente
dirigido
para
organizações
que
têm
a
responsabilidade de tornar a informação disponível
a longo prazo.
● O Modelo é também de interesse das organizações
e pessoas que criam informações que podem
necessitar de preservação de longo prazo, bem
como das organizações que adquirem tais
informações;
Ambiente
PRODUTORES
Pessoas ou sistemas clientes que fornecem a informação a ser
preservada.
ADMINISTRAÇÃO
Entidade responsável pelo estabelecimento de políticas mais
gerais do arquivo.
CONSUMIDORES
Pessoas ou sistemas clientes que interagem com os serviços do
OAIS para recuperar e adquirir informações preservadas de
interesse. Uma classe especial de Consumidores é a Comunidade
Alvo. (Designated Community).
COMUNIDADE ALVO
Conjunto de Consumidores capazes de compreender a
informação preservada
DSpace - www.dspace.org
É um sistema de repositório digital, desenvolvido
conjuntamente
pelas
bibliotecas
do
MIT
e
pela
Hewlett-Packard (HP). Disponível como um sistema de livre
acesso que possa adaptar-se e estender-se à captação,
armazenamento, indexação, preservação e redistribuição de
documentos em formatos digitais. A comunidade de
utilizadores do DSpace gere o código base, dando origem a
novas versões do software. Atualmente há mais de 200
instalações de DSpace à nível mundial, a maior parte dando
suporte, principalmente, à repositórios institucionais nas
universidades, mas também, à repositórios de objetos de
aprendizagem, de teses online, assim como sistemas de
arquivos digitais.
RBE, Newsletter 3, Repositórios Digitais
Eprints - www.eprints.org
Criado e ainda sendo desenvolvido pela School of
Electronics and Computer Science of University of
Southampton, UK. Disponível como software de acesso
livre e é descrito como a maneira mais fácil e mais
rápida de criar repositórios de acesso livre na
investigação da literatura, bases de dados científicas,
teses, relatórios e multimídia. Centrado no acesso livre
à investigação na literatura. Eprints é a plataforma mais
usada para repositórios institucionais, porém apenas
alguns sejam significativos no uso de materiais de
aprendizagem, arquivos digitais e etc.).
Fedora - www.fedora.info
É uma proposta de sistema de repositório, desenvolvido
conjuntamente pelas Universidades de Ciências da
Informação de Cornell e pela Biblioteca da Universidade da
Virgínia. Fedora visa fornecer um software de repositório de
livre acesso e serviços relacionados para servir de base
para muitos tipos de sistemas de gestão da informação.
Provavelmente o sistema com maior flexibilidade arquitetural
para suportar tipos diferentes de repositórios e de
conteúdos. Fedora é, atualmente, o menos usado dos três
sistemas, provavelmente porque é o que exige mais tempo e
conhecimento nas fases da instalação, da configuração e de
adaptação.
Sistema de preservação digital que visa
oferecer
um
ambiente
integrado
de
ferramentas free e Open Source para capacitar
o processamento de objetos digitais de acordo
com o modelo funcional ISO-OAIS (14721);
Archivematica (CIA)
● Pacote de Informação de Submissão (SIP) [enviada pelo produtor da informação ao arquivo].
● Pacote de Informação de Armazenamento (AIP) [pacote de informação armazenado pelo arquivo]. ● Pacote de Informação de
Disseminação (DIP) [pacote transferido para o usuário em resposta a uma solicitação].
ICA-AtoM
ICA-AtoM é o acrônimo de
Access to Memory. O projeto de
software ICA-AtoM resulta de um
esforço de colaboração entre o ICA e
alguns parceiros e patrocinadores (a
UNESCO, a Escola de Arquivos de
Amsterdam, o Banco Mundial, a
Direção dos Arquivos da França, o
Projeto Alouette Canadá e o Centro
de Documentação dos Emirados
Árabes Unidos). Destaques: - Total
conformidade às normas do ICA; -
Apoio
para
outras
normas
relacionadas, incluindo EAD, EAC,
METS,
MODS,
Dublin
Core;
-
Aplicação
concebida
inteiramente
para ambiente web; - Interfaces
multilingues;
-
Catálogo
multi-institucional; - Interfaces com
repositórios digitais. Requer Wamp
ou Lamp.
RODA
-
Repositório de Objetos Digitais Autênticos
O RODA é o arquivo nacional digital em Portugal. Através deste sistema complexo a DGARQ -
Direção Geral de Arquivos terá capacidade de incorporar documentos eletrônicos de forma
controlada assegurando a sua gestão ao longo do tempo e a sua acessibilização aos usuários.
Este projecto é desenvolvido pela DGARQ, contando com a colaboração informática da
Universidade do Minho. A estratégia seguida foi o desenvolvimento progressivo de funcionalidades
básicas e sólidas e ir progressivamente aumentando estas funcionalidades de forma a receber
maiores tipologias de objetos digitais e futuramente, dar resposta e apoio direto a organizações que
possuam objectos digitais mas não disponham de recursos especializados nesta área.
O RODA foi construído tendo como base o OAIS (Open Archival Information System) e documentos
técnicos produzidos no âmbito do projeto Interpares 2. A base do repositório RODA assenta na
plataforma FEDORA.
São utilizados vários esquemas de metainformação nomeadamente o EAD (Encoded Archival
Description), PREMIS (PREservation Metadata: Implementation Strategies ), METS (Metadata
Encoding and Transmission Standard), Z39.87.
o RODA
● Necessidade de Repositórios Digitais Confiáveis;
● OAIS, Archivematica e Roda;
● Interligação Archivematica e ICA-AtoM;
● Interoperabilidade Archivematica e DSpace;
● O potencial da Curadoria Digital: pesquisa,
formação, preservação, acesso e difusão.
● O
RDC-Arq é o Arquivo Permanente
Digital;
● O
RDC-Arq necessita de CURADORIA
DIGITAL ARQUIVÍSTICA;
● O Arquivista é o CURADOR DIGITAL do
RDC-Arq.
Referências
ABBOUT, Daisy. What is digital curation? Edinburgh, UK : Digital Curation Centre, 2008. Disponível em: <http://www.era.lib.ed.ac.uk/bitstream/1842/3362/3/Abbott%20What%20
is%20digital%20curation_%20_%20Digital%20Curation%20Centre.doc>. Acesso em: 20 dez. 2011.
Arquivo Nacional. Conselho Nacional de Arquivos. Publicações digitais. Requisitos funcionais para sistema informatizado de gestão arquivística de documentos: e-ARQ Brasil. Dezembro, 2009. Disponível em:
<http://www.conarq.arquivonacional.gov.br/media/publicacoes/earqmet/earqbrasilv1.1.pdf>. Acesso em: 09 ago. 2011.
CCSDS. Consultative Committee for Space Data Systems. Reference Model for an Open Archival Information System (OAIS). Janeiro, 2002. Disponível em:
<http://public.ccsds.org/publications/archive/650x0b1.pdf>. Acesso em: 09 ago. 2011.
CTDE. Câmara Técnica de Documentos Eletrônicos do Conselho Nacional de Arquivos. Glossário de Documentos Arquivísticos Digitais. 2010. Disponível em:
<http://www.documentoseletronicos.arquivonacional.gov.br/media/publicacoes/glossario/2010glossario_v5. 1.pdf>. Acesso em: 09 ago. 2011.
InterPARES. International Research on Permanent Authentic Records in Electronic Systems. Disponível em: <http://www.interpares.org>. Acesso em: 09 ago. 2011.
Diretrizes do Produtor - A Elaboração e a Manutenção de Materiais Digitais: Diretrizes para Indivíduos Disponível em:
Diretrizes do Preservador - A Preservação de Documentos Arquivísticos Digitais: Diretrizes para Organizações -
http://www.interpares.org/display_file.cfm?doc=ip2_preserver_guidelines_booklet--portuguese.pdf RLG/NARA.Trustworthy repositories audit & certification. RLG, OCLC, Feb. 2007. Disponível em: <http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf>. Acesso em 09 ago.2011.
Sayão, L.F. Repositórios Digitais Confiáveis para a Preservação de Periódicos Eletrônicos Científicos. Ponto de Acesso, Salvador, V.4, n.3, p. 68-94, dez 2010 - www.pontodeacesso.ici.ufba.br
Sayão, L.F. Uma Outra Face dos Metadados: Informações para a Gestão da Preservação Digital.
Sayão, Luis Fernando. SALES, Luana Farias. CURADORIA DIGITAL: um novo patamar para preservação de dados digitais de pesquisa. Inf. & Soc.:Est., João Pessoa, v.22, n.3, p. 179-191, set./dez. 2012.
CNEN - Rio de Janeiro - RJ - Enc. Bibli: R. Eletr. Bibliotecon. Ci. Inf., ISSN 1518-2924, Florianópolis, v. 15, n. 30, p.1-31, 2010.
Thomaz, K. Repositórios digitais confiáveis e certificação. Arquivística,net, v.3. n.1, p.80-89, jan/jun. 2007. Disponível em: <http://www.arquivistica.net/ojs/include/getdoc.php?id=372&article=118&mode=pdf>.
Acesso em: 09 ago. 2011.