• Nenhum resultado encontrado

Proposta de Formatos de Preservação Normalizados e Estratégias de Preservação

PRESIDÊNCIA DA REPÚBLICA

6.4. Caracterização de formatos e aplicações

6.4.1. Proposta de Formatos de Preservação Normalizados e Estratégias de Preservação

A normalização dos formatos relativos à identificação dos OD tem como objectivo simplificar o processo de preservação através da redução do número de formatos digitais que se encontram nos repositórios dos objectos digitais. Havendo um número controlado de formatos estes poderão ser usados na descrição de OD do mesmo tipo e alargar a sua utilização a um maior número de OD, com economias a vários níveis.

O formato escolhido deve ser capaz de representar toda a informação e as relações significativas entre a informação no documento de arquivo original; deve ser definido por uma norma nacional, internacional ou disponível publicamente; testado em termos de longevidade ou de utilização generalizada; directamente utilizado para efeitos de acesso,

155 ou ser capaz de ser transformado noutros formatos que sejam utilizáveis; independente de qualquer ambiente de software ou hardware específico; capaz de ser convertido automaticamente de formatos originais para formatos de preservação, com detecção automática e produção, sempre que aplicável, de relatórios de problemas de conversão ou de erros; capaz de conversão automática de um formato de preservação para o formato usado nos sistemas de arquivo produtor ou em utilização.

O PPD deve produzir uma tabela que relacione cada um dos formatos utilizados na organização, e um ou mais formatos de preservação digital normalizados definidos para o efeito bem como uma listagem de critérios de apoio à escolha dos formatos. A escolha do formato de preservação deve ser feita, preferencialmente, antes da criação do OD que se pretende preservar, evitando-se custos adicionais na sua conversão para o formato final. A utilização de formatos normalizados e bem documentados de aplicações com especificações abertas permitem garantir uma continuidade de utilização mais estável e prolongada quando comparados com os formatos e aplicações proprietários.

Para a série estudada, e perante o levantamento dos formatos utilizados pela instituição, definimos algumas categorias de formatos de preservação de longo prazo:

para imagens fixas bidimensionais, propõe-se o formato TIFF sem compressão; para texto estruturado/ documentos Office, propõe-se o formato PDF/A;

para bases de dados relacionais, propõe-se o formato MYSQL / DBML (um formato XML).

Proposta de Formatos de Preservação Digital para os OD da Série em estudo

Categorias Formatos Actuais Formatos Propostos

Base de Dados SQL Software Livre

MYSQL, DMBL (formato XML) Texto estruturado/ Documentos do office DOC TXT PDF PPT XLS RTF PDF/A PDF/A PDF/A PDF/A

156 Imagens fixas Bi-dimensionais Documentos Digitalizados: JPEG Documentos Nativos: JPEG TIFF GIF Ficheiro Principal

TIFF 300 a 600 dpi sem compressão.

Ficheiro de acesso

TIFF 300 dpi para duplicação.

Ficheiro de Miniatura

JPEG (100 a 150 dpi) para uso correntes, na Intranet e Internet. Imagens em Movimento Audio e Video WAVE WMA MPEG 2 MWMV AVI WAVE 1 MPEG 2

Folhas de Recolha de Dados FRD Inserir metados na base de dados

1 e 2: Não se tratando de formatos de preservação, são os recomendados pela Standard Digital Repository como os que têm mais qualidade para a preservação a longo prazo

Estratégias de Preservação Digital para a Série em estudo Categoria Características Formatos Aplicações

Estratégia de

Preservação Recomendada

Dados alfanuméricos existentes numa vasta variedade de

aplicações de processamento de

dados;

Migração para novas plataformas.

Dados Tabulares (Data Set)

Dados geridos em ficheiro linear (flatfile)

em rede, hierárquica;

Conversão de dados e estrutura para formatos normalizados.

157 Bases de dados relacionais e orientadas a objectos. SQL Server (2000-2005) Doculive Arqgest Arqmultimédia Bibliobase Actualmente é impossível migrar as componentes comportamentais

relacionadas com motores de gestão de bases de dados, normalmente proprietários. Deve considerar-se a estrutura de base de dados (tabelas, relações entre elas) e os dados

Dados alfanuméricos Migração para novas

plataformas.

Dados de marcação (markup);

Conversão para formatos normalizados.

Texto estruturado/ documentos do Office

Etiquetas para outros tipos de dados (imagens vectoriais de mapas de bits [raster]) existentes em processadores de texto/programas para escritório e digitalização de documentos/sistemas aplicacionais de gestão de documentos electrónicos, bases de dados relacionais, e outros ambientes de tipos de documentos de aplicações específicas. DOC XLS PDF RTF TXT PPT Microsoft Word Microsoft Excell Adobe Reader Microsoft Refrescamento de suportes.

158 Imagens Fixas

Imagens de mapas de bits e dados alfanuméricos existentes no software de captura/edição de imagens, bases de dados orientadas a objectos, relacionais ou simples de livrarias de fotos, colecções de digitais de belas-artes, colecções de imagens médicas.

JPEG TIFF GIF

Adobe Photoshop Retrocompatibilidade.

Conversão para formatos normalizados. Refrescamento de suportes. Documentos de som e voz Dados de som em processamento de voz, bases de dados relacionais ou simples (flat) de registos áudio em colecções de música e repositórios similares. WAVE WMA Arqmultimédia Windows Media Player AVID

Retrocompatibilidade.

Conversão para formatos normalizados.

Refrescamento de suportes.

A preservação da tecnologia é necessária em situações de curto prazo quando os dados estão fechados em sistemas proprietários.

Documentos de Vídeo

Vídeo Digital, ecrã total (fullscreen)/vídeo (em movimento) em fotogramas de vídeo digital armazenadas em ficheiros de mapas de bit e som armazenadas em bases de dados relacionais ou simples (flat) em colecções de música e repositórios similares. MPEG2 WMV AVI Arqmultimédia Windows Media Player AVID

Conversão para formatos normalizados.

Refrescamento de suportes.

A preservação da tecnologia é necessária em situações de curto prazo quando os dados estão fechados em sistemas proprietários.

159 As estratégias de preservação dos Documento de Arquivo Electrónico podem ser de curto, médio e longo prazo cabendo à Instituição definir essa calendarização e a sua aplicação. A opção pela estratégia de preservação da tecnologia implica a conservação e manutenção de todo o hardware e software necessários à correcta apresentação dos OD. Pode ser a solução para preservação de curto prazo em que os OD, como documentos vídeo, se encontram fechados em sistemas proprietários. Esta estratégia, no entanto, apresenta as desvantagens inerentes à obsolescência própria de qualquer plataforma tecnológica para além dos custos inerentes à sua manutenção bem como dificuldades de gestão do espaço de armazenamento ocupado.

A estratégia que garante, através de um emulador (software específico), reproduzir o comportamento de uma plataforma de hardware e software numa outra plataforma, à partida incompatível, é a estratégia por emulação. Existem muitos defensores desta estratégia, que já é utilizada com sucesso em aplicações informáticas, sistemas operativos e até de plataformas de hardware, preservando de forma fiel as características e funcionalidade dos OD. Há, contudo, quem defenda que esta opção só deverá ser utilizada quando não for possível converter os OD para formatos actuais, pois esta estratégia centra- se nas funcionalidades dos sistemas de informação e não nos OD enquanto evidência, conteúdo, estrutura e contexto.

A monitorização de suportes e formatos, através de processos de verificação do tempo

de vida estimado para os suportes, tempo de prevalência de versões informáticas e retrocompatibilidade assegurada pelos fabricantes, é outra estratégia aconselhada sobretudo para formatos que não tenham, no momento, formatos adequados de preservação.

O encapsulamento permite preservar o objecto digital e toda a informação necessária para se poder desenvolver as condições necessárias (conversores, visualizadores, emuladores) à recuperação futura dos OD. É tida como uma estratégia de adiamento de preservação e usada normalmente em situações que não justificam o imediato investimento necessário à preservação ou em que não existem formatos adequados á preservação desses OD.

A migração parece ser uma boa estratégia de preservação a longo prazo e a que é mais experimentada. A migração envolve a cópia periódica de documentos de arquivo para novos suportes de gravação do mesmo tipo ou de diferentes tipos (refrescamento), ou a transferência da informação de um formato de ficheiro para outro formato de ficheiro mais recente ou ainda a transposição de formatos e suportes. Esta opção poderá levantar alguns

160 problemas na transposição de formatos, sobretudo em documentos compostos e complexos como bases de dados e documentos multimédia.

Outline

Documentos relacionados