a perda de dados para uso futuro possa resultar em implicações significativas para os pacientes e para os negócios.
Diante disso, nos pautamos em Márdero Arellano (2009) a fim de chamar a atenção da responsabilidade das instituições e organizações para o fato de que a preservação digital deve ser além de uma preocupação, uma responsabilidade dos produtores e detentores da informação. Ou seja, são as instituições e organizações de saúde que devem estabelecer e praticar habitualmente uma política de preservação digital, com o apoio de profissionais da informação.
Entretanto, de modo a compreender os diferentes processos envolvidos na preservação de digital e pensando na PDS, torna-se necessário apresentar o modelo de referência OAIS, seus preceitos e aspectos relacionados com a informação digital, a partir do momento que o modelo constituiu um ponto de partida para a discussão em torno das iniciativas relacionadas com a preservação digital.
Esse modelo é uma iniciativa do Consultative Comitee for Space Data Systems (CCSDS) que junto com a International Organization for Standardization (ISO), definiram um modelo de referência de alto nível para arquivos que precisem de preservação de longo prazo. Assim, em 2003, nasce à norma internacional ISO 14.721.
Este modelo tem por finalidade proporcionar uma diversidade de funções e sistemas de armazenamento e preservação, alcançando seus objetivos, superando o problema da obsolescência da informação digital e minimizando os custos dessa operação.
No Brasil, a norma foi traduzida e se tornou ABNT NBR ISSO 14.721/2021 – Sistema Aberto de Arquivamento de Informações (SAAI), adotado por comunidades preocupadas com a preservação digital. O referido sistema possui uma infraestrutura funcional que inclui admissão, armazenamento, gestão de dados, planejamento da preservação, administração e acesso, se enquadrando conceitualmente para um repositório digital genérico, aberto, interoperável e com garantias de confiabilidade (SARAMAGO, 2004).
O modelo OAIS foi inicialmente projetado para uso dentro da comunidade científica, visando preservar digitalmente dados de missões espaciais. No entanto, tem sido amplamente adotado por bibliotecas, especialmente aquelas dos países que participaram de sua elaboração, como a Biblioteca do Congresso dos Estados Unidos, a Biblioteca Britânica, a Biblioteca Nacional Alemã e a Biblioteca Nacional de Nova Zelândia, que foi a pioneira na implantação. É por isso que o modelo OAIS tem uma ampla aplicabilidade para preservação a longo prazo em qualquer contexto (VERICAD, 2012).
O modelo OAIS incorpora vigilância tecnológica, preservação digital e todos os processos que exigem que os documentos digitais em um centro de dados não possam estar sujeitos a alterações, modificações ou perdas. O objetivo principal do OAIS é propagar a compreensão dos conceitos para a preservação de objetos digitais, ampliar o consenso sobre os elementos e os processos relacionados à preservação e acesso à informação digital. De forma igual, cria um esquema para orientar a identificação e o
desenvolvimento de padrões, a fim de tornar a informação preservada e disponível em qualquer repositório, já que possui um caráter genérico e que pode ser aplicado em diversos tipos de ambientes e documentos (THOMAZ;
SOUZA, 2004).
O modelo OAIS estabelece uma série de fluxos de dados e determinam as obrigações de um sistema de longo prazo para arquivamento e gerenciamento de objetos digitais. Para tanto, define três funções que interagem com o ambiente OAIS: Produtor, Consumidor e Gerenciamento, mais o próprio arquivo OAIS. Nesse processo o produtor está encarregado de enviar objetos digitais para conservação a longo prazo, o consumidor se responsabiliza por entender e acessar as informações que serão acessadas e o gerente que é responsável pelas políticas de conservação, entrada e acesso em um arquivo OAIS (MÁRDERO ARELLANO, 2008).
Na vertente dessa interação, Sayão (2010) explica que, o OAIS define duas infraestruturas abstratas: um modelo funcional e um modelo de informação. De acordo com o referido autor
O modelo funcional é compreendido como um conjunto de atividades que devem ser desempenhadas por um repositório OAIS, seja ele digital ou não; a infraestrutura funcional especificada no documento inclui admissão, armazenamento, gestão de dados, planejamento da preservação, administração e acesso. O modelo de informação define as informações, expressas por metadados, necessárias para a preservação de longo prazo e acesso aos objetos armazenados num sistema baseado no OAIS. O modelo de informação constitui uma conceitualização dos objetos de informação incorporados, armazenados e disseminados por um repositório digital orientado para a preservação (SAYÃO, 2010, p. 14, grifo nosso).
No modelo de informação, a representação da informação, que indica se um fluxo de bits representa um parágrafo de texto, um arquivo de som, uma imagem, etc., pode assumir duas formas: a informação estrutural e a semântica. De acordo com Saramago (2004) e Sayão (2010), a informação estrutural inclui especificações, como formato dos dados, descrição do ambiente de hardware e de software em que os dados foram criados. Por
sua vez, a informação semântica acrescenta significado à estrutura de dados identificada através da informação estrutural.
Conforme Márdero Arellano (2008, p. 89), o modelo de referência OAIS, guarda as informações processadas em pequenas unidades designadas como pacote de informação, que seria um recipiente que encapsula informação de conteúdo e de descrição para metadados para preservação e outros metadados. No esquema do OAIS, está incluído um modelo de informação para inserção dos metadados para preservação, conforme Figura 3.
Figura 3 – Modelo de Informação do OAIS
Fonte: Thomaz e Soares (2004, p. 12).
Segundo Thomaz e Souza (2004) e Sayão (2010) nesse modelo de informação os objetos físicos e digitais podem ser referenciados como objetos de dados. A interpretação desses objetos de dados como informação significativa pela comunidade alvo do arquivo ocorre por meio da combinação da base de conhecimento da comunidade alvo e a informação de representação associada ao objeto de dados.
Quando o objeto de dados, a base de conhecimento da comunidade alvo e a informação de representação são combinados, formam um objeto de informação que representa uma "informação significativa" para a comunidade alvo. O significado, obviamente, está relacionado à definição
da comunidade alvo atendida pelo arquivo (THOMAZ; SOUZA, 2004). Este, por sua vez, pode ser de quatro tipos:
[1] Informação de conteúdo – é a informação que o repositório tem obrigação de preservar, inclui a informação de representação, que são informações necessárias à apresentação e à interpretação da cadeia de bits que constituem o objeto armazenado como informação com significado para uma determinada comunidade alvo;
[2] Informação de descrição de preservação – informação que apoia e documenta a preservação dos objetos arquivados no repositório;
[3] Informação de empacotamento – informação que agrega todos os componentes de um pacote de informação – conteúdo e seus metadados - numa única unidade lógica;
[4] Informação descritiva – informação que apoia o usuário na descoberta e na recuperação de objetos armazenados no repositório (SAYÃO, 2010, p. 17, grifo nosso).
Na compreensão de Saramago (2004, p. 5) a informação descritiva de preservação subdivide-se em quatro tipos:
a) Informação acerca da referência, a qual enumera e descreve os identificadores destinados à informação sobre o conteúdo, de tal forma que se tornem inequívocos, interna e externamente ao depósito;
b) Informação acerca da proveniência, que documenta a história da informação sobre o conteúdo;
c) Informação acerca do contexto, documenta as relações entre a informação sobre o conteúdo e o seu ambiente;
d) Informação acerca da reparabilidade. Este tipo documenta mecanismos de reparabilidade e autenticação usados para assegurar que o conteúdo da informação não foi alterado de forma não documentada.
Esse modelo propõe três tipos de Pacotes de Informação, são eles:
[1] Pacote de informação de submissão [PSI] [Submission Information Package – SIP], formado pelo conteúdo e metadados que são submetidos pela entidade externa, Produtor, ao repositório no momento do depósito;
[2] Pacote de informação de armazenamento [PAI] [Archival Information Package – AIP], formado pelo conteúdo e pelos metadados que são efetivamente armazenados e gerenciados pelo repositório por longo prazo; e o
[3] Pacote de informação de disseminação [PDI] [Dissemination Information Package – DIP] que é o conteúdo e os metadados entregues pelo repositório em resposta a uma requisição de acesso demandada pelo usuário, ou melhor, pelo consumidor (SAYÃO, 2010, p. 17, grifo nosso).
O modelo funcional do OAIS é composto por seis entidades:
recepção, armazenamento, gerenciamento de dados, administração do sistema, planejamento de preservação e acesso, como pode ser visualizado na Figura 4.
Figura 4 – Modelo Funcional do OAIS
Fonte: Thomaz e Souza (2004, p. 13).
Nesse modelo, as entidades funcionais “gerenciam o fluxo de informação entre as entidades que formam o ambiente OAIS e identificam os componentes funcionais dos arquivos relacionados com a preservação dos objetos digitais” (MÁRDERO ARELLANO, 2004, p. 20). De acordo com Thomaz e Soares, (2004) cada uma das entidades desse modelo funcional diz respeito a algum processo do sistema no ambiente OAIS, conforme descrições a seguir:
a) Recepção atua na recepção dos PSI, garantindo qualidade e geração de informações descritivas;
b) Armazenamento é responsável por armazenar, manter e recuperar os PAIs, incluindo recepção e incorporação dos PAIs na área de armazenamento permanente. Entre suas atividades estão:
gerenciamento da hierarquia de armazenamento, renovação de
mídias, verificação de erros, recuperação de falhas e fornecimento de dados para o acesso;
c) Gerenciamento de dados visa manter e acessar tanto a informação descritiva, que identifica e documenta os acervos do arquivo, quanto os dados administrativos usados para gerenciá-los.
Resumidamente, ela administra a base de dados que captura e gerencia todos os metadados necessários para operar o sistema, promove suas atualizações e consulta os dados da entidade para gerar relatórios;
d) Administração do sistema gerencia a rotina operacional do arquivo como um todo. Ela negocia acordos de submissão com produtores, gerencia a configuração do sistema, atualiza as informações do arquivo, faz o controle físico de acesso e auditora os dos pacotes de informação, para garantir que estão atendendo aos padrões do arquivo;
e) Planejamento de preservação é a função central de um OAIS. Ela define e gerencia estratégias que possibilitam que os objetos digitais, armazenados como PAIs, atravessem o tempo sem sofrerem perdas inaceitáveis e mudanças de conteúdo ou funcionalidade, monitorando o ambiente OAIS e fornecendo recomendações para garantir que a informação armazenada permaneça acessível para a comunidade algo ao longo do tempo, mesmo diante da obsolescência do ambiente computacional. Para tanto, ela promove o desenvolvimento de estratégias e padrões de preservação, assim como, projetos de empacotamento e planos de migração.
f) Acesso apoia os consumidores na determinação da existência, descrição, localização e disponibilidade da informação armazenada no OAIS e permite que os Consumidores solicitem e recebam produtos de informação. Ela tem como função comunicar com os consumidores para receber solicitações, aplicar controles para limitar o acesso (principalmente à informação
protegida), coordenar a execução de solicitações para que se completem com sucesso, gerar respostas (pacotes de disseminação de Informação, resultados, relatórios) e entregar as respostas aos consumidores (THOMAZ; SOARES, 2004).
Para justificar a importância desse modelo para esta pesquisa, destacamos que o modelo OAIS pode ser considerado tanto um modelo funcional quanto um modelo de dados, justamente por não fornecer um conjunto de metadados, mas por ser um modelo em que os padrões podem ser propostos. Trata-se de uma característica relevante por permitir os fundamentos para o plano de implementação de um sistema de arquivamento de informação digital.