5 INICIATIVAS DE GESTÃO E PRESERVAÇÃO DE DOCUMENTOS
5.2 Requisitos de preservação de documentos digitais
5.2.2 Repositórios Digitais Confiáveis
O Research Libraries Group e o Online Computer Library Center (OCLC), em 2000, se reuniram para elaborar um relatório que ficou conhecido como Trusted Digital Repositories: Attributes and Responsibilities, publicado em 2002. O seu objetivo era estabelecer atributos para Repositórios Digitais Confiáveis (RDC) levando em consideração o modelo OAIS.
Para os pesquisadores, um RDC “[...] é aquele cuja missão é fornecer acesso confiável e de longo prazo para gerenciar recursos digitais para sua comunidade designada, agora e no futuro” (RLG/OCLC, 2002, p. 3, tradução nossa). Assim, o relatório apresentado pelo grupo buscou sistematizar a estrutura e responsabilidade para que um repositório transmitisse confiabilidade.
Os atributos apontados pelo relatório e que devem ser observados em um RDC são:
1) conformidade com o modelo de referência OAIS: contempla toda a estrutura comum oferecida pelo modelo; 2) Responsabilidade administrativa: corresponde ao compromisso em implementar padrões que objetivam as melhores práticas de operação do RDC; 3) viabilidade organizacional; trata-se do compromisso que a organização que assume ser um RDC deve assumir; 4) sustentabilidade financeira; 5) adequação tecnológica e processual; 6) segurança do sistema e 7) responsabilidade processual.
As recomendações apresentadas pelo relatório são expressas a seguir:
1. Desenvolver um processo de certificação de repositórios digitais;
2. Pesquisar e criar ferramentas para identificar os atributos significativos dos materiais digitais que devem ser preservados;
3. Pesquisar e desenvolver modelos para redes e serviços de repositórios cooperativos;
4. Desenvolver sistemas para identificação única e persistente de objetos digitais que apoiem expressamente a preservação a longo prazo;
5. Investigar e divulgar informações sobre a complexa relação entre preservação digital e direitos de propriedade intelectual;
6. Determinar as estratégias técnicas que melhor fornecem acesso contínuo;
7. Definir os metadados de nível mínimo necessários para a gestão a longo prazo e desenvolver ferramentas para gerar e/ou extrair automaticamente o máximo [de metadados necessários] possível (RLG/OCLC, 2002, p. 3, tradução nossa).
Desta forma o RDC é o ambiente capaz de transmitir a credibilidade aos documentos digitais mantidos para a preservação permanente, seus elementos tratam-se de uma preocupação em construir ambientes seguros para a preservação digital aliado ao modelo OAIS, devendo ser também auditado e certificado. Esta preocupação resultou em uma lista de requisitos, conforme a seguir.
5.2.3 Repositório Arquivístico Digital Confiável (RDC-Arq)
No Brasil os sistemas de preservação de documentos digitais são conhecidos como Repositório Arquivístico Digital Confiável (RDC-Arq). Esta ideia foi apresentada pela resolução 39, de 2014, e alterada pela resolução 43, de 2015, do CONARQ. Que apresenta as diretrizes para os RDC-Arq’s, arquivamento e manutenção para os documentos de arquivo nas fases corrente, intermediária e permanente.
A resolução aponta três conceitos primordiais, os quais são demonstrados a seguir:
• Repositório digital: “[...] é um ambiente de armazenamento e gerenciamento de materiais digitais”;
• Repositório arquivístico digital: “[...] é um repositório digital que armazena e gerencia esses documentos, seja nas fases corrente e intermediária, seja na fase permanente”;
• Repositório digital confiável: “[...] é um repositório digital que é capaz de manter autênticos os materiais digitais, de preservá-los e prover acesso a eles pelo tempo necessário” (CONARQ, 2015a, p. 9).
Estes conceitos se complementam e traduzem a ideia de um repositório arquivístico digital confiável que é entendido como aquele que é “[...] capaz de atender aos procedimentos arquivísticos em suas diferentes fases e aos requisitos de um repositório digital confiável” (CONARQ, 2015a, p. 10, grifo do autor).
Os requisitos de um RDC-Arq estão estruturados em três conjuntos: infraestrutura organizacional; gerenciamento do documento digital; e tecnologia, infraestrutura técnica e segurança. Os quais contemplam os seguintes modelos e padrões: 1) Modelo de referência OAIS, 2) Relatório da Research Library Group (RLG) e da Online Computer Library Center (OCLC) – Repositórios digitais confiáveis: atributos e responsabilidades, 3) Certificação e
auditoria de repositórios confiáveis: critérios e checklist – TRAC, 4) Requisitos técnicos para entidades de auditoria e certificação de organizações candidatas a serem repositórios digitais confiáveis, 5) Metadados de preservação – PREMIS, 6) Norma Geral Internacional de Descrição Arquivística – ISAD(G), 7) Norma Brasileira de Descrição Arquivística – NOBRADE, 8) Metadados do e-ARQ Brasil, 9) Protocolo para coleta de metadados – OAI-PMH, 10) Padrão de codificação e transmissão de metadados – METS e 11) Descrição arquivística codificada – EAD.
5.2.4 Certificação e Auditoria de Repositórios Confiáveis
Em 2003, o RLG e o NARA se reuniram para criar uma força tarefa de certificação de repositórios confiáveis, o que originou o Trustworthy Repositories Audit and Certification Checklist (TRAC), em 2007. O trabalho é oriundo da motivação em auditar e certificar repositórios que estivessem em conformidade com o modelo OAIS e que transmitisse confiança.
As métricas desenvolvidas na TRAC são divididas em três grupos (CRL/OCLC, 2007):
• A) Infraestrutura organizacional: A1) Governança e viabilidade organizacional, A2) Estrutura organizacional e pessoal, A3) Responsabilidade processual e estrutura política, A4) Sustentabilidade financeira, A5) Contratos, licenças e responsabilidades;
• B) Gestão de objetos digitais: B1) Fase inicial da ingestão que aborda a aquisição inicial, B2) A fase final da ingestão que coloca o conteúdo digital adquirido nos formulários, chamados de AIP’s usado pelos repositórios para a preservação a longo prazo, B3) Estratégias de preservação atuais, sólidas e documentadas, juntamente com mecanismos para mantê-las atualizadas em face das mudanças do ambiente técnico, B4) Condições mínimas para a preservação a longo prazo de AIP’s, B5) Metadados de nível mínimo para permitir que objetos digitais sejam localizados e gerenciados dentro do sistema, B6) A capacidade do repositório de reproduzir e disseminar versões precisas e autênticas dos objetos digitais;
• C) Tecnologias, infraestrutura técnica e segurança: C1) Requisitos gerais de infraestrutura do sistema, C2) Tecnologias adequadas com base nos requisitos de infraestrutura do sistema, com critérios adicionais especificando as tecnologias de uso
e estratégias apropriadas para a(s) comunidade(s) designada(s) do repositório, C3) Segurança - desde sistemas de TI, como servidores, firewalls, ou roteadores, até sistemas de proteção contra incêndio e detecção de inundação, até sistemas que envolvem ações de pessoas.
A TRAC é ainda acompanhada de quatro princípios básicos: documentação (prova), transparência, adequação e mensurabilidade.
A lista TRAC está contemplada também nas recomendações para práticas em sistemas de dados espaciais do CCSDS, através do documento intitulado “Audit and Certification of Trustworthy Digital Repositories” e da ISO 16363, de 2012, de mesmo nome.
Outra iniciativa para a certificação RDC foi mobilizada pela comissão europeia, que definiu o “European Framework for Audit and Certification of Digital Repositories”, que engloba além da ISO 16363, o CoreTrustSeal, antes Data Seal of Approval, e o Nestor - Seal for Trustworthy Digital Archives.
A certificação de repositório tem recebido a mesma preocupação, assim como os sistemas de gestão de documentos digitais. Na verdade, a TRAC teve reflexões de sua construção através de certificações como as utilizadas pelo Estados Unidos em seus sistemas, no entanto, com foco nos sistemas que preservam documentos em fase permanente.
Um documento que pode complementar a TRAC, no entanto é direcionado para entidade que certifica e audita um RDC, é descrito a seguir.
5.2.5 Requisitos técnicos para entidades de auditoria e certificação de organizações candidatas a serem repositórios digitais confiáveis
O Requirements for bodies providing audit and certification of candidate trustworthy digital repositories é um uma recomendação do CCSDS, que foi publicado como ISO/IEC 17021, cujo objetivo é estabelecer critérios de auditoria para avaliar a confiança de repositórios digitais através de certificação.
É estruturado em seções, as quais são: seção 1) fornece o objetivo e o escopo, a justificativa, estrutura, terminologia e conceitos; seção 2) fornece a visão geral das práticas de auditoria; seção 3) descreve o órgão de autorização do repositório digital confiável
primário; e as seções de 4) a 10) fornecem as regras normativas para as organizações que fornecem as auditorias e certificações.
A norma, assim como outras, adota como referência o modelo OAIS, no entanto optando por utilizar o termo “repositório” ou repositório digital” para se referir ao “arquivo digital” do modelo, indicando que ambas possuem o mesmo sentido atribuído a esta entidade, que é a organização responsável pela preservação digital.
Uma outra iniciativa que merece destaque por se relacionar com a temática aqui apresentada, é a que trata do padrão de metadados, o PREMIS.
5.2.6 Metadados de preservação
A OCLC e a RLG formaram um grupo de trabalho, entre 2003 a 2005, denominado Preservation Metadata: Implementation Strategies (PREMIS), o que resultou no Data Dictionary for Preservation Metadata: Final Report of the PREMIS Working Group, cujo objetivo era orientar a aplicação de metadados de preservação para acompanhar os objetos digitais em repositórios, que conta com um dicionário de dados, um esquema XML e documentação de apoio.
Como muitos padrões desenvolvidos, o PREMIS se baseou no modelo OAIS, em especial em seu modelo de informação, sendo desta forma traduzido como uma estrutura conceitual para implementação (PREMIS, 2015).
O modelo define quatro entidades importantes, as quais são: objetos, eventos, agentes e direitos. A figura 7 demonstra como estas se relacionam.
Figura 7: Modelo de dados PREMIS
Fonte: PREMIS (2015)
Os elementos do modelo são definidos da seguinte forma (PREMIS, 2015, p. 6, tradução nossa):
• Objeto: “uma unidade discreta da informação sujeita a preservação digital”;
• Ambiente: “tecnologia (software e hardware) que suporta um objeto de alguma forma”;
• Evento: “uma ação que envolve ou afeta pelo menos um objeto ou agente associado ou reconhecido pelo repositório de preservação”;
• Agente: “pessoa, organização ou programa/sistema de software associado a eventos na vida de um objeto ou com direitos associados a um objeto. Também pode estar relacionado a um objeto de ambiente que atua como agente”;
• Declaração de direitos: “afirmação de um ou mais direitos ou permissões pertencentes a um objeto e/ou agente”.
O PREMIS é mantido pela Library of Congress (LoC) e suas atualizações são feitas por um comitê. A LoC possui uma ferramenta para implementação do PREMIS, a PREMIS in METS (PIM) Toolbox, que automatiza a criação de metadados de preservação.
O padrão tem sido utilizado por muitos países, no intuito de não apenas especificar os elementos necessários apenas para a preservação, mas também completar os padrões de metadados específicos para serem implantados nos seus respectivos sistemas de gestão de documentos em ambiente digital.
As demais normas estipuladas nas diretrizes de um RDC-Arq não serão apresentadas aqui porque são de suporte para a descrição e o acesso, não que estas não possam estar no fluxo de trabalho da preservação digital, mas para a delimitação desta seção o nosso objetivo é demonstrar as iniciativas apenas de gestão e preservação dos documentos digitais.
É de valia ainda mencionar dois modelos que se diferenciam das iniciativas que apresentamos e foram desenvolvidos pelo projeto InterPARES, pensando exclusivamente nos documentos de arquivo em ambiente digital mantidos de forma segura e confiável ao longo do tempo.
5.2.7 Os modelos do InterPARES
Os modelos a seguir foram elaborados tendo em vista os modelos de gestão de documentos utilizados na teoria arquivística, o ciclo de vida dos documentos e o records continnum, possuindo uma preocupação que vai da gênese à preservação de documentos de arquivo digitais confiáveis e autênticos. Tratam-se de modelos conceituais que podem ser implementados independentemente da estrutura tecnológica.
5.2.7.1 Modelo de Cadeia de Preservação
O modelo da cadeia de preservação14 (Chain of Preservation - COP) é entendido como “Um sistema de controles que se estende por todo o ciclo de vida dos documentos para garantir sua identidade e integridade ao longo do tempo” (INTERPARES GLOSSARY, 2021, p. 11, tradução nossa). Trata-se de um produto desenvolvido pelo projeto InterPARES 2 e que tem como perspectiva gerenciar o documento digital de forma confiável desde sua gênese até a sua preservação.
A COP é um modelo que unificou outros três modelos: o modelo produzido pelo projeto UBC, com perspectiva do produtor para gerenciar os documentos; e os modelos funcionais de seleção e preservação, desenvolvidos pelo InterPARES 1 com perspectiva do preservador.
O modelo divide-se em quatro grandes atividades, que são:
• 1) Gestão da estrutura para cadeia de preservação: ‘[...] envolve os requisitos de projeto, estrutura e implementação da COP, isso implica utilizar elementos de política, estratégia e métodos” (DURANTI; PRESTON, 2008, p. 200);
• 2) Gestão para a produção de documentos: “[...] envolve a supervisão e coordenação de todas as atividades referentes a produção de um registro digital, transferência para um sistema de manutenção e monitoramento das operações desse sistema de produção” (DURANTI; PRESTON, 2008, p. 207);
14 Modelo desenvolvido com base na teoria do ciclo de vida dos documentos, que trata de distintas fases da existência do documento, desde a produção até a destinação. Disponível em:
https://dictionary.archivists.org/entry/life-cycle.html. Acesso em 28 set. 2021.
• 3) Gestão de documentos em um sistema de manutenção: “[...] supervisão e coordenação do sistema de manutenção visando a garantia da autenticidade de um registro digital” (DURANTI; PRESTON, 2008, p. 211);
• 4) Preservação dos documentos selecionados: “[...] envolve todas as atividades associadas à preservação de documentos no sistema de preservação permanente visando a garantia da preservação contínua sob a custódia do preservador”
(DURANTI; PRESTON, 2008, p. 221).
Para Duranti e Preston (2008) o modelo COP indica uma preservação a longo prazo duradoura, onde todas as atividades em torno dos registros ao longo de sua existência estão em uma cadeia. Se algo compromete esta cadeia, ela não poderá executar seu trabalho, o que indicaria a perda da confiança e consequentemente colocaria os registros em perigo.
Sobre a implementação do modelo COP, Duranti em mensagem eletrônica enviada em 4 de outubro de 2020 indica duas instituições que têm trabalhado com o modelo: o NARA e o City of Vancouver Archives. Este último foi a gênese do desenvolvimento do sistema de preservação digital Archivematica, que contempla o modelo COP.
5.2.7.2 Modelo Business-Driven Recordkeeping
O modelo Business-Driven Recordkeeping15- BDR foi influenciado pelo modelo da COP do InterPARES 2, o modelo de preservação do InterPARES 1, o projeto DELOS, o projeto Clever Recordkeeping Metadata, o grupo de pesquisa Records Continuum16 da Monash University, os padrões ISO 15489:2001 e ISO 23081-1:2006, a metodologia DIRKS e o modelo OAIS.
15 Nas diretrizes do produtor, traduzida pela equipe brasileira do projeto InterPARES 3, o BDR ficou
conhecido como Modelo de Manutenção de Documentos Orientada pelas Atividades do Produtor. Disponível em: http://www.siga.arquivonacional.gov.br/images/publicacoes/diretrizes_produtor_digital.pdf. Acesso em 28 set. 2021
16 O records continuum, desenvolvido na Austrália, é um modelo de prática de manutenção de documentos (recordkeeping) que conceitua as interações dos documentos em dimensões e eixos inter-relacionados, sem distinguir onde termina a produção e a gestão de ativos de documentos e onde começa a gestão arquivística destes documentos. As dimensões rastreiam os documentos na produção, captura, organização e pluralização (tornando os documentos disponíveis como prova). Os eixos representam diferentes facetas da
responsabilidade: a identidade da entidade envolvida em uma transação documentada pelos documentos, o que esta entidade fez, do que os documentos fornecem prova e como eles são encontrados e recuperados para uso posterior. Disponível em: https://dictionary.archivists.org/entry/records-continuum.html. Acesso em: 28 set. 2021.
Este modelo tem como ideia estar dentro das organizações abordando o seu próprio negócio em diferentes contextos (jurídico, econômico e cultural) e consequentemente seus registros (DURANTI; PRESTON, 2008).
Seus objetivos concentram-se em:
1. [...] oferecer uma visão integrada do negócio de uma organização e manutenção de registros;
2. [...] apoiar contextos paralelos e múltiplas visões e perspectivas (ou seja, não apenas aquelas dentro das organizações, mas também aquelas que podem ser partes interessadas, clientes, parceiros, etc., também como outros, como arquivistas, que podem ter interesse nos documentos gerados pelos negócios;
3. [...] fornecer uma estrutura para: [3.1] identificar os requisitos legais, jurídicos, éticos, comerciais, organizacionais e arquivísticos de linhas de negócios específicas e seus contextos jurídicos; [3.2] ilustrar as relações (nexos/conexões) e dependências entre atividades de negócios meta-processo de captura de registros (provas) dessas atividades e processos de gerenciamento dos próprios registros;
[3.3] integrar os requisitos de manutenção de registros nas atividades de negócios, de modo que os registros necessários forneçam provas de que as atividades de negócios podem ser capturas e preservadas de maneira mais adequada; e gestão de registros (autênticos e confiáveis) ao longo de sua existência e dentro de diferentes contextos de uso e interpretação (DURANTI; PRESTON, 2008, p. 48-49, tradução nossa).
Diferente da COP que possui uma perspectiva do preservador, o modelo BDR possui a perspectiva do produtor. Conforme Duranti e Preston (2008), na COP o arquivista olha para o "negócio" de uma organização que produz os registros e identifica aqueles de interesse histórico e social que são necessários para a preservação. Assim, o arquivista é considerado uma terceira parte confiável (trusted third party) com responsabilidade na preservação a longo prazo de documentos confiáveis, as outras duas partes seriam o produtor (records creator) e o usuário (user of records external) que também são interessados em manter a integridade dos registros.
Já no modelo BDR, Duranti e Preston (2008) explicam que se trata de uma perspectiva do “negócio”, onde a base da narrativa é o próprio produtor, ou da organização produtora dos documentos. Nesta perspectiva os documentos são produzidos por atividades e processos de negócios para apoiar os objetivos da organização e são de interesse, também, por partes interessadas (stakeholders) que possuem seu próprio objetivo. Estes interessados seriam clientes, parceiros e a sociedade em geral, e o papel do arquivista estaria englobado neste grupo.
O modelo BDR pode, ser assim, sistematizado da seguinte forma (DURANTI.
PRESTON, 2008, p. 249, tradução nossa):
• A visão do negócio: “[...] assumindo a perspectiva (organizacional) de um negócio em suas atividades e produção de registros; o item central do negócio é a transação.
Deste ponto de vista a manutenção dos registros é feita como uma função dos negócios”;
• A visão da manutenção do registro: “[...] assumindo a perspectiva de captura da gestão de registros produzidos em um negócio; o item central para a manutenção (recordkeeping) são os registros. Deste ponto de vista uma atividade de negócios fornece o contexto dos registros”;
• A visão da estrutura: “[...]assumindo a perspectiva da necessidade de integrar tanto o ponto de vista do negócio como a da manutenção para que fiquem devidamente alinhados. Isso reflete a camada que controla [...] ou integra as duas perspectivas anteriores”;
• A visão da sociedade: “[...] assumindo a perspectiva do ambiente contextual, necessária para atender as influências externas em um negócio e suas práticas de manutenção (recordkeeping). Esta camada tem sua própria dinâmica e (geralmente) está fora do controle da organização que dirige um negócio”.
No modelo BDR, apresentado por Duranti e Preston (2008), são enunciadas duas modelagens: uma que englobaria as três primeiras perspectivas, tendo em vista que estas podem acontecer em qualquer situação do negócio; e uma outra direcionada apenas para a última camada.
Nas três primeiras etapas, entendidas como o núcleo, estariam os eixos transacional, identidade e evidência, na última etapa seria o eixo referente à sociedade (pluaralizar). O modelo enfatiza que estes estariam interligados e representariam a visão multidimensional do records continuum.
A respeito da aplicabilidade do modelo BDR, Duranti em mensagem eletrônica recebida em 14 de março de 2021 nos explica: “O Australian National Archives parece ter a intenção de usá-lo, uma vez que não aceita mais registros para a preservação das agências, que agora devem preservar seus próprios registros seguindo recomendações arquivísticas”.
Questionada se isso seria parte da teoria do records continuum Duranti afirma que não, o Australian National Archives na verdade está desistindo do esforço da preservação de documentos, mesmo isso sendo responsabilidade de um arquivo nacional.
Desta forma, a seção enunciou dois importantes ambientes, considerando o modelo OAIS, conhecidos como de gestão e preservação, os quais estão aqui direcionados para o
tratamento dos documentos de arquivo digital. O ambiente de gestão de documentos digitais (SIGAD) deve estar regulamentado com os padrões determinados em cada país, conforme esfera de jurisdição, para assim garantir elementos de confiabilidade em sua produção.
Posteriormente a esse momento, estes devem ser recolhidos via pacote SIP para o ambiente de preservação de documentos digitais (RDC-Arq) no intuito de manter a integridade dos documentos digitais por meio do pacote AIP.
Como vimos, estas garantias são asseguradas por meio de normas e modelos que através de requisitos, contribuem para que os documentos digitais possam ser acessíveis e preservados sem nenhuma alteração ao longo do tempo. O acesso deve ser garantido via pacote DIP por uma plataforma de acesso, difusão e transparência ativa, mas para que isso ocorra de forma efetiva as plataformas de gestão e preservação de documentos digitais devem estar em conformidade com requisitos a fim de garantir uma cadeia de custódia arquivística digital confiável.
Esta cadeia de custódia digital arquivística também pode ser garantida através da adoção dos modelos do projeto InterPARES, seja o modelo COP voltado para o ciclo de vida dos documentos ou o BDR voltado para records continuum, apesar de não difundidos no âmbito brasileiro, não podia deixar de ser mencionada sua pertinência para a gestão, preservação e acesso aos documentos digitais.
Com isso, podemos inferir que tais referenciais podem nos levar a refletir o quão
Com isso, podemos inferir que tais referenciais podem nos levar a refletir o quão