• Nenhum resultado encontrado

Repositórios de dados e a gestão dos dados de investigação

1.5 Repositórios de dados

1.6.1 Repositórios de dados e a gestão dos dados de investigação

Na literatura corrente sobre repositórios e curadoria de dados é bastante comum a referência à gestão de dados de investigação. O conceito “research data management” emerge, também, associado aos vários projetos que têm aparecido neste domínio, alguns dos quais já referidos. Apesar da tendência para a adoção deste conceito, a sua aplicação prática não está consolidada, estando ainda numa fase exploratória, segmentada em diversas iniciativas.

Inerente a esta tendência está a adoção por parte da NSF de uma abordagem a nível de regulamentos e procedimentos para responder aos desafios que acompanham a proliferação de dados, de forma a ser evitada a perda, o excesso e a dispersão dos dados de investigação. Para contrariar as más práticas de 31 Data Information Specialists Committee. United Kingdom. Disponível em: http://www.disc-uk.org/datashare.html

gestão de dados a NSF promulgou que todas as propostas de financiamento a ela dirigidas devem prever um plano de gestão de dados digitais, com o intuito de os tornar - “routinely deposited in well- documented form, regularly and easily consulted and analysed by specialist and non-specialists alike, open accessible while suitably protected, and reliably preserved” (National Science Foundation, 2010)32. Como consequência desta medida o DataONE criou o Data Management Planning Tool (DPMTool)33, em finais de 2011, para ajudar os investigadores a elaborar um plano genérico em

conformidade com os requisitos da NSF.

A organização composta por profissionais do ensino superior no Reino Unido, formalizado através do DISK – UK, é uma das parcerias que se tem mostrado mais ativa no apoio concedido aos estudantes e restantes académicos na gestão dos seus dados. Um dos principais contributos desta parceria foi a apresentação numa conferência da IASSIST, em 2009, de um guião que fornece a outras instituições um método que orienta a tomada de decisão na aceitação de conjunto de dados em repositórios. A metodologia DAF (Data Audit Framework – fig. 4), desenvolvida pela comunidade DCC, surgiu em consequência das recomendações do JISC, expressas por Lyon (2007) - “a framework must be

conceived to enable all universities and colleges to carry out an audit of departamental data collections, awareness, policies and practice for data curation and preservation”. Assim, o DISK-UK

utiliza o DAF para identificar conjuntos de dados criados dentro das suas universidades, e para responder às preocupações sobre a partilha de dados num repositório de acesso livre (Rice e Haywood, 2011).

O DAF recomenda que as auditorias feitas aos dados de investigação sejam um processo assente em quatro etapas. Na fase de planeamento são definidos os propósitos da auditoria, sendo feito um levantamento preliminar junto dos investigadores. A segunda etapa serve para identificar e classificar os dados existentes. A classificação vai determinar o âmbito das atividades posteriores, isto porque os aspetos selecionados vão ser tratados com maior detalhe nas fases seguintes. O terceiro ponto vai permitir ao auditor recolher informação para detetar os pontos fracos na gestão dos dados de investigação, permitindo-lhe enumerar recomendações na fase final do processo. O conhecimento adquirido através da auditoria possibilitará às organizações planear melhorias na gestão dos dados de investigação34.

32 NSF. 2010. Scientist Seeking NSF Funding will soon be required to submit Data Management Plans. Disponível em: http://www.nsf.gov/news/news_summ.jsp?cntn_id=116928 Consultado a 25 de novembro de 2012

33 DataONE. Data Management Planning 2011.Disponível em: http://www.dataone.org/data-management-planning

Consultado a 02 de janeiro de 2013

34 The Digital Curation Center. Disponível em: http://www.data-audit.eu/methodology.html Consultado a 13 de novembro

Figura 4: Data Audit Framework

Em consequência da aplicação do DAF a casos de estudo tem vindo a ser demonstrada a necessidade

em melhorar a prática de gestão de dados. Os principais problemas apontados nestes estudos são a carência de espaço de armazenamento, a fraca perceção dos dados como um valor a reter a longo termo, as práticas de gestão ad-hoc, a inexistência de guias e padronização de procedimentos de gestão dos dados. Para além disso verifica-se pouco enriquecimento de metadados, sendo os esforços geralmente canalizados na busca de informação complementar em servidores externos (Rice e Haywood, 2011).

Atendendo à necessidade de incutir nos investigadores uma maior capacidade para lidar com os dados, foi lançada na Universidade de Edimburgo, Escócia, uma iniciativa entre os meses de agosto de 2010 e julho de 2011, que consistia na disponibilização de materiais e-learning que refletissem as melhores práticas de gestão de dados de investigação em domínios como as ciências sociais, psicologia clínica e geociência. O designado Research Data Mantra foi um programa de treino para jovens cientistas, que incluía entrevistas, gravadas em vídeo, a académicos experientes nos desafios que a gestão de dados de investigação acarreta (Rice e Haywood, 2011).

A Universidade de Oxford, perante tal problema criou uma solução de gestão de dados compatível com todas as etapas do ciclo de vida dos dados (fig.5), suficientemente genérica para poder ser adotada por instituições com diferentes estruturas.

Figura 5: Requisitos para uma infraestrutura de gestão de dados de investigação de U. de Oxford (Wilson et. al., 2011)

Segundo este framework a gestão dos dados de investigação pode ser concebida como uma sequência de passos, onde cada um deve ser completado de forma adequada para que os dados tenham condições de prosseguir para o próximo passo, de modo a terem o seu valor maximizado - “Se a infraestrutura não suportar um destes passos, ou os agentes envolvidos não entenderem o que se espera deles, então o valor potencial dos dados não pode ser atingido” (Wilson et al., 2011). Tendo em conta o framework proposto, o suporte concedido pela Universidade de Oxford aos projetos de investigação reside na disponibilização de uma equipa de acompanhamento a investigadores em regime de financiamento.

1.6.2 Gestão de dados de investigação: o caso do laboratório Bennet (U.