• Nenhum resultado encontrado

2.2 PRESERVAÇÃO DIGITAL

2.2.3 Estratégias para a preservação digital

2.2.3.3 Migração

Para Martin e Coleman (2002), no ambiente tecnológico atual, todos os dados eletrônicos devem ser migrados a cada ano para que possam sobreviver. A migração periódica da informação digital a partir de um ambiente de hardware ou de um software para outro é a estratégia operacional para a preservação digital mais freqüentemente usada pelas instituições detentoras de grandes acervos.

Segundo a definição da Task Force on the Archiving of Digital Information da Commission on Preservation and Access e o Research Library Group (1996), migração é a transferência periódica de materiais digitais de uma configuração de hardware/software para outra, ou de uma geração de tecnologia computacional para a geração seguinte. O propósito da migração é preservar a integridade dos objetos digitais e assegurar a habilidade dos clientes para recuperá-los, expô-los e usá-los de outra maneira diante da constante mudança da tecnologia. A importância da migração é transferir para novos formatos enquanto for possível, preservando a integridade da informação.

Um arquivo digital pode converter objetos digitais para um reduzido número de formatos-padrão. Por exemplo, dados textuais podem ser estocados em um formato de software relativamente independente como ASCII, em formatos proprietários de grande difusão como PDF, ou em formatos baseados em aplicações de Standard Generalized Markup Language (SGML) como XML (COLEMAN; WILLIS, 1997).

Com o passar do tempo, os dados podem ser copiados, recriados e atualizados como migrações periódicas necessárias em novos formatos para seu uso em novas gerações de hardware e software. Na área de documentos digitais, alguns modelos começam a surgir com a finalidade de converter materiais de formatos proprietários para a linguagem XML.

Os metadados têm um papel importante em qualquer estratégia de migração bem-sucedida. Esse tipo de estratégia dependerá dos metadados criados para registrar a história da migração de um objeto digital. Também, existe a necessidade de informação do contexto para ser registrada (e preservada) para que, dessa maneira, futuros usuários possam entender o ambiente tecnológico no qual um objeto digital foi criado. A International Federation of Library Associations (IFLA) recomenda a utilização de formatos padrão nos objetos digitais e nos metadados. Esses formatos devem permitir a migração dos próprios metadados para outros padrões.

Vários estudos têm mostrado que a migração é a estratégia mais adotada pelas instituições que produzem informação científica (OCLC/RLG PREMIS WORKING GROUP, 2004). Mas como a Task Force on the Archiving of Digital Information apontou, “[...] apenas uma única estratégia aplicada para todos os

formatos de informação digital e nenhum dos métodos de preservação atuais são inteiramente satisfatórios [...]” (TASK FORCE, 1996, p. 38).

A metodologia de migração está evoluindo, as técnicas ligadas a essa estratégia estão sendo amplamente aceitas, mas a sua adoção está apenas começando a ser aplicada no caso dos objetos digitais complexos. Para alguns especialistas a migração continua sendo experimental e permanece como uma área de pesquisa interessante.

Para a Task Force a migração não é opcional, mas sim uma operação essencial:

Existe uma variedade de estratégias de migração para a transformação de informação digital contida em sistemas obsoletos para sistemas de hardware

software atuais, para que essa informação continue acessível e usável.

Nenhuma única estratégia pode ser aplicada a todos os formatos de informação digital e nenhum dos métodos de preservação atuais é totalmente satisfatório. As estratégias de migração e seus custos variam dependendo dos contextos de aplicação, dos formatos, dos graus de preservação que as estratégias atendem e das suas possibilidades de recuperação. (TASK FORCE, 1996 p.27)

A migração continua sendo a estratégia mais adotada; entretanto, para muitas instituições ainda é cedo para pensar em uma grande mudança tecnológica. Além das grandes e antigas instituições, os arquivos e bibliotecas não têm iniciado nenhuma mudança tecnológica significativa. A prevalência da migração significa a prevalência de produtos comerciais como os da Microsoft Office e dos produtos da empresa Adobe na área científica (PDF/A). Os assuntos ligados com a atualização de software e hardware não estão sendo tratados pelas instituições, que manifestam estar mais preocupadas em coletar e inserir os conteúdos nos sistemas atuais.

Assim como aumenta o número de versões de software ou documentos que são movidos de uma aplicação para outra (por exemplo, de WordStar para WordPerfect ou Microsoft Word para o Open Office), o risco de corrupção e de perdas essenciais de informação também crescem.

O trabalho das bibliotecas na estratégia de migração envolve grande número de formatos, complexos e proprietários. Uma tarefa que diminui a sucessiva migração de formatos é a transferência de recursos digitais em formatos preserváveis no momento da submissão em um repositório. Um autor pode escrever seu trabalho em Microsoft Word e submetê-lo dessa forma no repositório. Como o repositório considera o Word não ajustável para preservação, os bibliotecários o

convertem para PDF, que possui especificações de formatos públicos e que promete uma representação imutável no futuro.

Como sendo um componente da estratégia de migração, várias iniciativas de preservação estão sistematicamente documentando formatos de dados, os softwares nos quais eles estão sendo criados, e coletando suas especificações dos formatos quando elas estão disponíveis. Nos Estados Unidos, a Library of Congress está construindo sites com informações sobre formatos de conteúdo digital. Na Inglaterra, a National Archives criou o primeiro registro operacional de formato, Pronom, e a comunidade internacional de preservação está trabalhando na criação de um formato de registro de dados internacional. Mesmo assim, um registro operacional de formato pode oferecer uma variedade de serviços, incluindo identificação de formato, verificação e conversão. Entretanto, isto ainda pode demorar alguns anos, devido principalmente a assuntos organizacionais.

O DSpace do MIT utiliza a migração como sua principal estratégia de preservação. O MIT mantém o original e permitirá o suporte através da migração de formatos classificada como “suportada” (ou não proprietária). Espera-se, mas sem nenhuma garantia, que serão migrados os arquivos de sistemas proprietários como Word, Excel, etc., para os quais as ferramentas de conversão tornam-se possíveis de serem disponibilizadas porque são formatos originais instalados pelos usuários.

Existe também a “migração a pedido”, na qual a versão original do material é retida, e quando necessário, são aplicadas ferramentas próprias para converter o original para os formatos requeridos pelo usuário (MELLOR, 2003). Com ela é possível poupar tempo, pelo fato de que os usuários não atualizam uma versão de software ou hardware para a seguinte com a mesma velocidade. Esse conceito foi testado no projeto CAMiLEON (CAMiLEON, 2001).

Nos últimos 10 anos, um grande número de estratégias de preservação surgiu, como projetos desenvolvidos em todo o mundo (LEE et al., 2002). Todos os trabalhos analisados mostraram que a estratégia mais citada e aplicada é a de migração (WHEATLEY, 2001). Essa estratégia tem sido usada principalmente nos contextos em que não existem objetos digitais interativos, apenas imagens, bases de dados e documentos de texto.

O tipo e a quantidade de recursos devem ser levados em consideração na escolha de uma estratégia de preservação. A decisão deverá garantir que a melhor estratégia de preservação foi escolhida entre as opções disponíveis. Como todas as

estratégias usadas até hoje, a migração depende de fatores tais como: experiência técnica, expectativas de usuários, orçamento institucional, equipamento existente e tempo disponível.

Para Ferreira, Baptista e Ramalho (2006), é necessário entender todos os passos envolvidos no processo de migração, considerando uma seqüência de atividades:

1. Seleção da estratégia: as decisões a serem tomadas inicialmente

envolvem os formatos e as aplicações. As instituições devem procurar otimizar a combinação do formato a ser tratado e o software para a conversão “[...] um que preserve o maior número das propriedades do objeto digital a um custo baixo [...]”. Especificamente com relação ao custo, esses autores falam que ele deve ser considerado como uma variável multidimensional.

2. A conversão: a tarefa da conversão consiste na reorganização dos elementos que compreendem o objeto digital em estruturas lógicas definidas por formatos diferentes. Para o responsável pela preservação, a ação da conversão consiste na preparação de uma aplicação de conversão e sua execução em uma coleção de objetos digitais. O processo pode ser automatizado com a ajuda de scripts de programação.

3. Avaliação dos resultados: após o processo de conversão, os objetos

resultantes deverão ser avaliados para determinar a quantidade de dados perdidos durante a migração. Para conseguir isso, as propriedades que compreendem o objeto original devem ser comparadas (chamadas de propriedades significativas) com as propriedades dos objetos convertidos. Se os resultados da avaliação não correspondem às expectativas (ex.: as propriedades do objeto foram degradadas para níveis inaceitáveis), deverá ser selecionada uma alternativa de migração diferente e o processo reiniciado na integra. O processo de avaliação requer de trabalho manual com relação aos documentos comprimidos de arquivos de imagem e a elementos gráficos nos documentos de texto.

Em Portugal, na Universidade do Minho estão sendo realizados estudos para automatizar as três atividades relacionadas com a migração (seleção das

opções de migração, conversão e avaliação). Os pesquisadores da Universidade do Minho esperam testar uma Arquitetura de Serviço Orientado (SOA) para combinar vários sistemas distribuídos ou repositórios digitais que permitam às instituições preservar suas coleções automaticamente. O sistema trabalharia na fase inicial da entrada de dados (ingest processes) oferecendo uma série de serviços. O exemplo que eles apresentam é o do Arquivo Nacional de Portugal: na instituição está sendo desenvolvido um sistema de repositório digital para preservar objetos digitais autênticos produzidos por instituições filiadas (Projeto RODA).

Ao mesmo tempo está sendo criado o processo de ingest e as políticas de preservação, para ajudar aos produtores na preparação do material antes de ele ser submetido ao repositório. Dessa forma, será realizado um processo de normalização para lidar com objetos em formatos não identificados. Na presença de um formato não reconhecido o repositório solicitará um serviço de identificação de formato ao SOA, para obter informação e conferir a sua integridade. Após essa tarefa, a instituição solicita ao SOA uma lista de formatos para os quais o documento pode ser convertido, informando suas preferências e requisitos de preservação (provenientes das políticas), por exemplo:

- as intervenções de preservação deverão ser acessíveis e rápidas; - as intervenções deverão preservar o número máximo de propriedades do objeto original;

- as intervenções não deverão recorrer a formatos que sejam dependentes de pagamentos ou direitos autorais (FERREIRA, BAPTISTA; RAMALHO, 2006).

Na estratégia de migração a habilidade de decodificar o formato atual deve estar sempre presente, garantindo a compatibilidade retroativa, a interoperabilidade dos programas e o uso de formatos padrão. Os recursos digitais podem ser transportados de uma plataforma para outra através de migrações múltiplas, considerando as corrupções acumulativas que podem alterar algumas dessas características (ROTHENBERG, 2000).

Uma das vantagens da migração é que ela permite o acesso rápido ao recurso, já que o documento estará sempre em formato padrão. Dessa forma os usuários encontraram como resultado da conversão, recursos digitais considerados suficientes apesar da perda de algum atributo visual (look-and-feel).