• Nenhum resultado encontrado

2. Gestão de dados de investigação

2.2. Ciclo de vida dos dados

Como já foi referido, a curadoria envolve gerir e promover o uso de dados a partir do seu ponto de criação. Planeando cuidadosamente a maneira pela qual os dados são produzidos e processados, as tarefas posteriores a serem desenvolvidas pela curadoria podem ser, consideravelmente, mais fáceis. Por exemplo, no caso de um repositório, este pode ter mais certeza das ações de preservação que pode executar, se os direitos e o estado de licenciamento dos dados já tiverem sido esclarecidos, e é mais provável que os investigadores sejam capazes de detalhar as metodologias e os fluxos de trabalho que foram usados, se os registarem no momento.

Foi neste sentido que foram desenvolvidos modelos com o propósito de caracterizar, de forma detalhada, o ciclo de vida dos dados.

2.2.1. Data Documentation Initiative Lifecycle Model

Como referido anteriormente, o modelo conceitual Data Documentation Initiative (DDI), desenvolvido pelo DDI Alliance10, é um padrão de documentação internacional para descrever dados produzidos em investigação e outros métodos do tipo observacionais nas ciências sociais, comportamentais, económicas e de saúde, e foi uma das primeiras iniciativas para conceber a ideia de um ciclo de vida de dados. A ideia integra processos e atividades de investigação com conceitos de curadoria, preservação de dados, publicação e partilha de dados.

Como o DDI é um padrão estruturado, este facilita ações como a acionabilidade e a interoperabilidade, e pode ser usado para acionar sistemas. Outro dos recursos do DDI, é o foco na reutilização de metadados, ou seja, o lema “enter once, use often”, refere-se ao facto de reutilizar os metadados ao longo do ciclo de vida dos dados de forma a evitar a duplicação de esforços (DDI Alliance 2019).

9 Disponível em: http://www.dcc.ac.uk/resources/metadata-standards/ddi-data-documentation- initiative, acedido em 28 de dezembro de 2019

Figura 3- Última versão do modelo do ciclo de vida do DDI.

Fonte: (DDI Alliance 2019)

Segundo a Figura 3, que representa a versão 3.1 do ciclo de vida dos dados do DDI Alliance, o modelo representa oito elementos a seguir, nomeadamente:

Concept - é a fase inicial do modelo, onde se estabelece todas as tarefas para dar início ao projeto de investigação, referindo-se à questão de partida, à metodologia adotada, e ao planeamento de processamento, da análise e do uso dos dados.

Collection - nesta fase do modelo, importa selecionar os métodos de recolha de dados. É fundamental saber distinguir dados primários de dados secundários, para uma recolha de dados mais efetiva.

Processing - após a fase anterior, é necessário proceder ao processamento dos dados recolhidos. Isto significa uma análise pormenorizada dos dados recolhidos, para produzir outputs que darão resposta à questão de partida formada na fase inicial do modelo.

Archiving - nesta fase é necessário recorrer a arquivos ou repositórios de forma a armazenar os dados, com o intuito de garantir o acesso a longo prazo. Esta fase é importante, pois o arquivo irá preservar os dados, e respetivos metadados, e agregar valor aos mesmo ao longo do tempo.

Distribution- nesta fase os dados são distribuídos para os utilizadores, com o auxílio do arquivo onde os dados foram armazenados na fase anterior do modelo.

Discovery- esta fase retrata a divulgação dos dados por meio de fontes de informação online, nomeadamente, livros, publicações em revistas científicas, artigos científicos.

Analysis- nesta fase os dados podem ser utilizados por terceiros conforme as restrições impostas pelos autores dos dados, e respeitando a conceptualização original dos dados. Repurposing- ao contrário da fase anterior, esta fase do modelo permite que se use os dados adotando uma estrutura conceitual diferente (por exemplo: combinação dos dados com outros

2.2.1. DCC Curation Lifecycle Model

Na figura abaixo, está representado o modelo do ciclo de vida de curadoria desenvolvido pelo DCC. Este modelo fornece uma visão geral dos estágios do ciclo de vida de um objeto digital necessários para uma curadoria e preservação dos dados bem-sucedida.

Figura 4- Modelo do ciclo de vida do DCC Curation.

Fonte: (Digital Curation Centre 2019)

É de salientar que a base do modelo apresentado são os dados, sendo que o DCC os define como qualquer informação em formato digital binário, o que inclui os objetos digitais e as bases de dados. Segundo o Digital Curation Centre (2019) este modelo apresenta as seguintes ações completas do ciclo de vida:

• Informação sobre descrição e representação: refere-se à criação, recolha, preservação e manutenção de metadados suficientes para permitir que os dados sejam usados e reutilizados pelo tempo que tiverem valor, de forma a justificar a curadoria contínua; • Planeamento de preservação: desenvolve estratégias, políticas e procedimentos para

todas as ações de curadoria;

• Vigilância e participação da comunidade: tem por base a observação da comunidade alvo dos dados, com o objetivo de rastrear alterações nos seus requisitos para os dados, e a participação no desenvolvimento de padrões, ferramentas e softwares relevantes

para os dados;

• Organizar e preservar: representa a execução das ações administrativas e de gestão planeadas, que dão suporte à curadoria.

Num outro nível do modelo de ciclo de vida retratado, estão as denominadas de ações sequenciais, o que inclui:

• Conceptualização: planear a criação de dados, incluindo os métodos de recolha e as opções de armazenamento;

• Criar ou receber: criar dados, incluindo todos os tipos de metadados (administrativos, descritivos, estruturais e técnicos), e receber dados de acordo com as políticas de recolha documentadas;

• Avaliação e seleção: avaliar e selecionar os dados para curadoria de longo prazo, seguindo um conjunto de orientações, políticas e/ou requisitos legais documentados; • Ingestão: transferir os dados para arquivos, repositórios ou bases de dados, seguindo

um conjunto de orientações, políticas e/ou requisitos legais documentados;

• Ação de preservação: ações que garantam a preservação a longo prazo, sem interferir com a veracidade da natureza dos dados, a autenticidade, a confiabilidade, a integridade e a utilização dos dados;

• Armazenamento: armazenar os dados de forma segura, seguindo os padrões mais relevantes;

• Acesso, uso e reutilização: garantir a usabilidade dos dados, ou seja, que estes estejam acessíveis tanto para os seus utilizadores e para serem reutilizados por terceiros; • Transformação: criar dados, através dos originais.

E por último, num nível mais alargado, o modelo apresenta as ações ocasionais, como descartar- descartar os dados que não forem preservados; Reavaliar- reavaliar os dados de retorno que falham nos procedimentos de validação para posterior avaliação e re-seleção; e migrar- migrar dados para um formato diferente.