• Nenhum resultado encontrado

PRESIDÊNCIA DA REPÚBLICA

6.4. Caracterização de formatos e aplicações

6.4.5. Os Metadados: Levantamento e Soluções Propostas

A metainformação tem um papel primordial na preservação digital, visto que permitirá uma melhor gestão dos objectos digitais, sistemas de informação, utilizadores e funcionalidades a disponibilizar. A metainformação descreve atributos do documento de arquivo electrónico dando-lhe significado, contexto e organização, permitindo a produção, gestão e utilização de documentos de arquivo ao longo do tempo. A série estudada apresenta alguma metainformação produzida automaticamente nas propriedades dos ficheiros, cujo levantamento foi sistematizado e apresentado em quadro anexo (anexo11). A metainformação de preservação digital, deve ser aplicada por camadas:

metainformação descritiva ou de identificação, que pode incluir elementos como o título,

o assunto, autor e palavras-chave; metainformação administrativa atribuindo informação para apoio à gestão do documento de arquivo electrónico (quando e como foi criado, tipo de ficheiro e outra informação técnica e quem tem privilégios de acesso); metainformação

estrutural que permite relacionar hierarquicamente os diferentes OD que fazem parte de

um mesmo documento; metainformação técnica que descreve as características técnicas dos ficheiros e dos seus formatos; metainformação de preservação que inclui informação necessária para arquivar e preservar os OD.

Existem muitos esquemas de metainformação normalizados. A EAD (Encoded Archival

Description) define metainformação descritiva dos objectos custodiados de forma

contextualizada, ajudando a categorizar e localizar a informação seguindo o modelo da ISAD(G) (anexo 11). A NISO Z39.87 define esquemas de metainformação técnica muito completos ao nível da caracterização de imagens digitais. O METS (Metadata Encoding e

Transmition Standard) permite associar metadados descritiva, administrativa e

estrutural sobre objectos digitais. O PREMIS (Preservation Metadata: Implementation

Strategies) guarda informação necessária à preservação dos OD ao longo do tempo,

descrevendo representações, conjuntos de ficheiros necessários para apresentar uma entidade, e ainda os próprios ficheiros, que são o alvo da preservação.

Existem, contudo, outros standards de metainformação que dependendo das especificidades exigidas pelas organizações, respondem igualmente às necessidades de descrição dos OD (ex: Dublin Core, o MARCXML, MODS ou ONIX)

Os esquemas de metainformação são, na maioria das situações, articulados de forma a cobrir as necessidades de descrição que melhor se adequem à preservação dos OD ingeridos no sistema de arquivo digital e que permitam manter também todas as

164 funcionalidades. Várias são as instituições que têm desenvolvido modelos conceptuais para metadados de preservação que resultam das suas necessidades específicas. É o caso da Universidade de Cornell e das Bibliotecas Nacionais da Austrália e da Nova Zelândia tidas como modelos de referência pelos trabalhos que têm desenvolvido nesta área. Apresentamos em anexo (anexo 13) o modelo de metadados da Biblioteca Nacional da Austrália, tida como exemplar no que diz respeito à descrição de metadados de preservação de sub elementos dos objectos digitais (imagem, vídeo, áudio, imagem e base de dados). Igualmente se anexa (anexo14) uma matriz da Biblioteca do Laboratório Nacional de Pesquisa de Los Alamos por integrar algumas tipologias documentais iguais à da série em estudo: jornais, artigos de jornais e audio-visual. A escolha dos formatos é completamente diferente da anterior justificada pela natureza dos OD, do relacionamento entre eles e da sua função.

Embora, de uma forma geral, os documentos electrónicos contenham alguma metainformação, fornecida pelas aplicações que os produzem, esta é insuficiente ou não se encontra organizada, como se verificou através do levantamento da metainformação dos OD da série em estudo. A metainformação associada ao OD permite a referenciação única e persistente de cada OD; a localização e recuperação expedita de cada OD; a criação do histórico de cada OD; o registo das transformações realizadas sobre cada OD.

O PREMIS é, todavia, o esquema de metadados de preservação mais usado e recomendado pela DGARQ. A versão 2 apresenta um esquema único, bastante completo ao nível das várias camadas de metadados. Esta versão do PREMIS integra as recomendações de outras matrizes, mais completas ao nível da meta informação descritiva e técnica, e define cinco entidades relevantes para a preservação digital: as entidades intelectuais, os objectos, os eventos, os direitos e os agentes.

A entidade intelectual é o conjunto do conteúdo considerado como única unidade intelectual (ex. livro, fotografia, mapa, base de dados). Pode incluir outras entidades intelectuais (ex: site que inclui uma página web).

O objecto é a unidade discreta da informação. Existem três tipos de objecto: a representação (conjunto de ficheiros), o ficheiro (sequência de bytes ordenados e com nome reconhecida por um sistema operativo) e o bisttream (dados de um ficheiro com propriedades relevantes para a preservação). O repositório não tem que controlar os objectos a todos os níveis. Mas as propriedades devem ser definidas de acordo com o nível escolhido.

165 O evento é a acção com impacto sobre o objecto: evento de migração, evento de ingestão, evento de validação. Consegue-se localizar a história do objecto através da cadeia de eventos que ocorrem durante o ciclo de vida do objecto.

O agente é a pessoa, organização ou sistema de software associado a eventos ou direitos. Os direitos estão relacionados com as permissões ao repositório para por em curso acção/acções associadas ao objecto dentro do mesmo repositório (ex: agente X garante permissão Y ao repositório em relação ao objecto Z)

A unidade semântica é propriedade de uma entidade única e é condição fundamental para que os repositórios possam continuar as suas funções de preservação digital. Existem dois tipos : Contentor - agrupamento de unidades semânticas relacionadas e Componentes semânticas – unidades semânticas agrupadas no mesmo contentor.

Os objectos, eventos, agentes e direitos são apenas identificados pelos identificadores e as relações entre os vários tipos de documentos são também relevantes para a preservação devendo ser indicado, por exemplo, que “A é uma parte de B”.

Outline

Documentos relacionados