• Nenhum resultado encontrado

Preservação da informação em objetos digitais

2.2 PRESERVAÇÃO DIGITAL

2.2.1 Preservação da informação em objetos digitais

A preservação é um dos grandes desafios do século XXI. Durante os últimos anos do século XX, as bibliotecas, os arquivos e os centros e institutos de pesquisa e organismos governamentais criavam conteúdo digital relevante. Segundo Cunha (1999, p. 266), duas das funções básicas das bibliotecas estão sofrendo “[...] perigo de extinção: a provisão de acesso à informação e a preservação do conhecimento para futuras gerações [...]”.

Muitas coleções digitais importantes estão sendo construídas fora das bibliotecas e dos arquivos por diferentes organizações, ou sendo publicadas diretamente na Internet. Com o aumento da produção de informação em formato digital, tem sido questionada cada vez mais a importância de garantir a sua disponibilização e preservação por grandes períodos de tempo. Os objetos digitais não podem ser deixados em formatos obsoletos para serem transferidos, depois de longos períodos de esquecimento, para repositórios digitais, pois existe o risco de a tecnologia não conseguir recuperar as informações. Esta preocupação envolve tanto os produtores dos dados quanto os órgãos detentores dessa informação.

Para Hedstrom (1996, p. 189), a preservação digital se refere ao “[...] planejamento, alocação de recursos e aplicação de métodos e tecnologias para assegurar que a informação digital de valor contínuo permaneça acessível e utilizável [...]”. A preservação digital compreende os mecanismos que permitem o armazenamento em repositórios de dados digitais que garantem a perenidade dos seus conteúdos. Para atingir esse fim, os objetos digitais devem ser compreendidos e gerenciados em vários níveis: como um objeto físico, como uma codificação lógica, como objetos conceituais ou possuidores de significado para os humanos e como

um conjunto de elementos essenciais que devem ser preservados para oferecer aos futuros usuários a essência do objeto (UNESCO, 2003).

A condição básica à preservação digital seria, então, a adoção desses métodos e tecnologias que integrariam a preservação física, lógica e intelectual dos objetos digitais. A preservação física está centrada nos conteúdos armazenados em mídia magnética (fitas cassete de áudio e de rolo, fitas VHS e DAT) e discos óticos (CD-ROM, WORM e discos óticos regraváveis). A preservação lógica procura, na tecnologia, formatos atualizados para inserção dos dados (correio eletrônico, material de áudio e audiovisual e material em rede), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura.

A preservação digital é a parte mais longa e também a última do ciclo de gerenciamento de objetos digitais. Ela permite o emprego de mecanismos que viabilizam o armazenamento em repositórios de objetos digitais e que garantem a autenticidade e perenidade dos seus conteúdos. São necessários, não apenas, procedimentos de manutenção e recuperação de dados, no caso de perdas acidentais para resguardar a mídia e seu conteúdo, mas também estratégias e procedimentos para manter sua acessibilidade e autenticidade através do tempo, podendo requerer colaboração entre diferentes financiadoras e boa prática de licenciamento, metadados e documentação, antes de aplicar ações técnicas.

Ao analisar o ciclo da informação (geração, tratamento, preservação e conservação e, finalmente, difusão da informação), percebe-se que a preservação e conservação necessitam ser revistas no âmbito da informação digital. Até pouco tempo, entendia-se a preservação no sentido de conservar e prevenir os documentos do risco de deterioração. É importante analisar a preservação a partir da necessidade de assegurar o acesso e recuperação da informação científica como fundamento para a pesquisa acadêmica. Aliado a isso, deve-se considerar o crescente uso dos computadores e a quantidade de informações disponíveis em meio eletrônico (algumas, inclusive, somente neste meio).

A natureza dos documentos digitais está permitindo ampla produção e disseminação de informação no mundo atual. É fato que, na era da informação digital, muita ênfase é dada à geração e/ou aquisição de material digital, em vez de manter a preservação e o acesso de longo prazo aos acervos eletrônicos existentes.

Outro conceito associado ao da preservação digital, que surgiu da comunidade arquivística, é o de ciclo de vida do material digital. Nos primeiros

estudos do grupo de trabalho do National Preservation Office e do Joint Information Systems Committee (JISC/NPO) (BENNETT, 1997), encarregado de desenvolver um arcabouço para uma política estratégica de criação e preservação de objetos digitais, o ciclo de vida foi dividido em cinco partes: criação de dados; gerenciamento de coleções e preservação; aquisição, retenção e descarte; gerenciamento de dados; dados de uso. Foi graças a esses trabalhos que ficou esclarecido que os envolvidos (stake-holders) têm variados interesses em estágios diferentes do ciclo, assim como a importância que há em considerar o assunto preservação em todas as etapas, e não apenas no final do ciclo, exigindo a cooperação entre as grandes iniciativas.

A partir da formulação dessa estrutura, começaram a ser desenvolvidos guias estratégicos para os responsáveis por todos e cada um dos estágios do ciclo de vida dos objetos digitais. Neles, existem recomendações sobre a valorização de um estágio do ciclo em particular, assim como a relação entre eles, e como as decisões podem afetar as tarefas dos outros responsáveis. Em geral, as tarefas relacionadas com a preservação digital seriam os procedimentos de manuseio e armazenamento da mídia digital, a cópia da informação contida, a migração para novas mídias e a preservação da integridade da informação digital.

Como mostra o Quadro 1, a preservação física continua relevante na mídia eletrônica, ainda que o seu armazenamento haja demonstrado a necessidade de constante atividade de migração para novos materiais que favoreçam sua disseminação e uso (disquete, fita VHS, CD-ROM, DVD).

Requisitos Documentos Impressos Documentos Digitais

Preservação física Relevante Relevante

Preservação lógica Pouco relevante Relevante

Preservação intelectual Não relevante Relevante

Quadro 1 – Relevância dos requisitos de preservação

Na preservação intelectual, o foco são os mecanismos que garantem a integridade e a autenticidade da informação nos documentos eletrônicos. Uma

solução tem sido a autenticação digital (digital time-stamping8, DTS). Essa técnica permite que os documentos sejam criptografados no momento em que são depositados (GRAHAM, 1998).

No caso dos materiais impressos, a preservação lógica é pouco relevante, por estar garantida no formato específico em que foram publicados (periódico, livro, entre outros formatos). Na publicação digital, a preservação lógica está associada à necessidade de garantir a conversão dos formatos originais que se tornaram obsoletos ou de custosa manutenção. O Quadro 1 mostra, também, que a importância da preservação intelectual é maior no caso dos materiais digitais devido, principalmente, à capacidade de o objeto digital ser passível de modificação no seu leiaute, apresentação ou interação no formato de publicação. Com isso, a perda do conteúdo intelectual original pode ser declarada inaceitável pelo autor.

Esse requisito envolve a preservação da propriedade intelectual (Intellectual Propriety Rights9, IPR), que tem um significado mais argüível do que na mídia tradicional. O IPR deve considerar não apenas o conteúdo, mas também qualquer ação relacionada ao software (cópias, encapsulamento de conteúdo, emulação de software, migração de conteúdo) que envolva atividades que podem infringir permissões específicas daqueles que mantêm os direitos. Para Bullock (1999), o IPR é uma das principais barreiras que interferem na preservação dos objetos digitais. Ela enumera os aspectos técnicos da preservação dos documentos digitais da seguinte forma:

• limites do objeto digital;

• presença física;

• conteúdo básico (ex.: arquivo ASCII);

• apresentação;

• funcionalidades;

• autenticidade;

• localização e rastreamento do objeto digital no tempo;

• proveniência;

• contexto.

Esses requisitos especificam os elementos que deverão ser efetivamente mantidos de um documento digital, a cadeia de bits que deverá ser recuperada.

8 Selo de tempo digital. Tradução nossa. 9 Direitos de Propriedade Intelectual.

Referem-se à capacidade de acesso aos conteúdos dinâmicos independentemente da sua apresentação, componentes de multimídia, hipertextualidade e interatividade. Observar essas condições significa identificar o objeto digital na sua origem e pelas suas dependências de hardware e software.

Um documento digital pode estar representado em um ou vários objetos digitais, em diversos formatos lógicos, e pode ser suportado por grande variedade de representações físicas. A sua dependência de software tem origem em sua natureza binária, armazenada em forma codificada, apenas legível por programas. Sem esses programas, os objetos digitais não podem ser acessados, lidos ou impressos.

Salvar os bits de um objeto digital é necessário, mas não suficiente para preservá-lo. É necessário também conhecer os atributos da aplicação na qual ele foi criado e com o qual ele pode ser interpretado. O esforço da preservação engloba também o software e o hardware no qual o objeto digital pode ser executado, já que eles também podem ficar obsoletos.

A problemática dos objetos digitais aumenta a partir do momento no qual eles são inerentemente digitais, quando não podem ser representados em forma de imagem ou páginas de texto; tentar representar documentos audiovisuais dessa forma significa perder aspectos essenciais dos seus conteúdos e comportamento, como no caso de artefatos interativos e dinâmicos (multimídia, dados meteorológicos em imagens ou gerados automaticamente em JavaScript, cgi, páginas ASP, entre outros). Sem deixar de mencionar simulações de experimentos, bases de dados e realidade virtual interativa.

As soluções propostas para a preservação desse tipo de objeto digital vão desde a arqueologia digital, até soluções mais completas, como a formalização (substituição dos artefatos pelas descrições formais deles), a migração (converter os artefatos em novos formatos repetidamente) e a emulação (rodar os softwares originais em hardware recriados virtualmente); passando pela reprodução dos objetos em forma de imagens e salvando os componentes principais dos artefatos.

Em geral, um objeto digital é um componente digital necessário para reproduzir um documento eletrônico. Ele não é apenas um arquivo, dentro de uma biblioteca digital, mas está composto de várias partes:

• metadados (descritivos, administrativos, estruturais, de preservação); • arquivos de preservação;

• arquivos de disseminação.

Para mantê-los organizados e conectados, é necessária uma prática correta de organização de diretórios e projetos de documentação. O lugar ao qual pertencem é o repositório de documentos digitais.

É preciso chamar a atenção para a importância de informar o contexto do objeto digital a ser registrado (e preservado) para que, assim, futuros usuários possam entender o ambiente tecnológico no qual ele foi criado10. A preservação dos

documentos continua a ser determinada pela capacidade de o objeto informacional servir às utilizações que lhe são imputadas, às suas atribuições que garantem que ele continue a ser satisfatório às utilizações posteriores. Porém no caso específico dos documentos em formato digital, a preservação dependerá principalmente da solução tecnológica adotada e dos custos que ela envolve.

Tanto a arquivologia quanto a ciência da informação prevêem a descrição de documentos digitais como uma maneira de possibilitar o armazenamento e a recuperação da informação. A descrição arquivística e a descrição bibliográfica compreendem o contexto e o conteúdo dos documentos digitais (os padrões de metadados resultantes começam a homogeneizar-se, e espera-se a criação de redes interoperáveis de arquivos e bibliotecas digitais).

Na preservação de documentos digitais, assim como em papel, é necessária a adoção de ferramentas que protejam e garantam a sua manutenção. Essas ferramentas deverão servir para restaurar registros protegidos, prevendo os danos e reduzindo os riscos dos efeitos naturais (preservação prospectiva), ou para restaurar os documentos já danificados (preservação retrospectiva).

O suporte físico da informação, o papel e a superfície metálica magnetizada se desintegram ou podem se tornar irrecuperáveis. Existem, ademais, os efeitos da temperatura, umidade, nível de poluição do ar e das ameaças biológicas; os danos provocados pelo seu uso indevido e o uso regular; as catástrofes naturais e a obsolescência tecnológica. A aplicação de estratégias de preservação para documentos digitais é uma prioridade, pois sem elas não existiria nenhuma garantia de acesso, confiabilidade e integridade dos documentos de longo prazo.

10 Um documento eletrônico é um registro que foi criado (elaborado ou recebido) de forma eletrônica.

Um documento digital é aquele que existe em formato eletrônico, mas que pode ou não ter sido criado em formato eletrônico - pode ter sido criado em papel e digitalizado. (CONSELHO NACIONAL

Quando a primeira versão eletrônica de um documento é criada, inicia-se uma longa lista de ameaças inerentes aos documentos digitais. Segundo Greenstein e George (1998), para proteger a informação digital da destruição causada pelo tempo, a obsolescência tecnológica e a deterioração da mídia magnética, precisa-se de métodos apropriados para diferentes tipos de dados e estruturas.

Uma das principais ameaças é o problema da obsolescência tecnológica. Hardware e software são dispositivos para gerar e acessar informações gravadas que requerem estratégias técnicas diferenciadas para garantir seu funcionamento (FEENEY, 1999). Nesse contexto, os documentos multimídia são os mais comprometidos, pois não existem garantias de que a essência da informação possa ser preservada, se não houver dispositivos que leiam as mídias magnéticas usadas.

A busca por estratégias de preservação digital requer não apenas procedimentos de manutenção e recuperação de dados, no caso de perdas acidentais, para resguardar a mídia e seu conteúdo, mas também estratégias e procedimentos para manter sua acessibilidade e autenticidade através do tempo, podendo requerer colaboração entre diferentes organizações, boa prática de licenciamento, aplicação de padrões de metadados e documentação.

Todas as tarefas aplicadas às coleções digitais têm sido objeto de ações por parte da comunidade da área da ciência da informação, que tem entre seus desafios viabilizar a recuperação e o processamento da informação no futuro (FUNARI, 2004). Especificamente a preservação digital está sendo observada como o resultado do uso de normas nos processos de arquivamento dos documentos digitais. O uso de repositórios digitais que adotam essas normas está sendo apontado como uma melhoria na qualidade da produção da informação digital a ser preservada pelas organizações.

Os especialistas da área que trabalham com informação em formatos digitais estão elaborando normas necessárias para armazenar e compartilhar em repositórios digitais esses materiais, assim como buscam a formulação de políticas institucionais de preservação.

Segundo Jones (2003), existem três tipos de criadores de documentos digitais: 1) aqueles que não acreditam que os repositórios digitais tenham a habilidade de preservar seus materiais; 2) aqueles que desconhecem que esses repositórios existem; 3) aqueles que desejam que seus materiais digitais sejam preservados, mas para os quais tais recursos são inexistentes. Como Jones aponta,

existe relutância por parte desses criadores de documentos digitais em lidar com a responsabilidade da preservação desses materiais, além do desconhecimento das necessidades reais de preservação dos seus acervos digitais.

Se os criadores de materiais digitais originais não compreendem as implicações das suas ações em termos de viabilização a médio e longo prazo dos materiais criados, eles não serão capazes de proporcionar o suporte e o acompanhamento necessários com as infra-estruturas técnica e organizacional que possam dar assistência e facilite um gerenciamento eficiente da preservação digital.