• Nenhum resultado encontrado

CRITERIA FOR APPRAISAL AND SELECTION OF SEARCH DATA IN THE CONTEXT OF DIGITAL CURATION

N/A
N/A
Protected

Academic year: 2018

Share "CRITERIA FOR APPRAISAL AND SELECTION OF SEARCH DATA IN THE CONTEXT OF DIGITAL CURATION"

Copied!
8
0
0

Texto

(1)

XVII Encontro Nacional de Pesquisa em Ciência da Informação (XVII ENANCIB)

GT 8 – Informação e Tecnologia

CRITÉRIOS PARA AVALIAÇÃO E SELEÇÃO DE DADOS DE PESQUISA NO CONTEXTO DA CURADORIA DIGITAL

CRITERIA FOR APPRAISAL AND SELECTION OF SEARCH DATA IN THE CONTEXT OF DIGITAL CURATION

Marcia Teixeira Cavalcanti1, Luana Farias Sales2, Luis Fernando Sayão3

Modalidade da apresentação: Pôster

Resumo: O presente trabalho se justifica perante o desafio de gerenciar grandes quantidades de dados científicos que são gerados diariamente nos laboratórios de pesquisa e que precisam ser preservados para recuperação, reuso e compartilhamento futuro. Neste sentido, algumas questões que se colocam são: como identificar os dados de pesquisas produzidos dentro de uma instituição de pesquisa científica? Como avaliar e selecionar estes dados para que sejam preservados em longo prazo? O trabalho objetiva descrever a metodologia empregada na área de Ciências Nucleares para a seleção dos dados que passarão pelo processo de curadoria digital, apresentando os critérios estabelecidos dentro desse contexto para orientar as etapas de avaliação e seleção de dados de pesquisa.

Palavras-chave: Curadoria Digital. Dados de pesquisa. Avaliação. Seleção.

Abstract: This work is justified to the challenge of managing large amounts of scientific data that is generated every day in research laboratories and need to be preserved for recovery, reuse and future sharing. In this sense, some questions that arise are: how to identify the research data produced inside a scientific research institution? How appraise and select the data to be preserved in the long term? The study aims to describe the methodology used in the field of

1 Universidade Santa Ursula/USU Faculdades Integradas Maria Thereza/FAMATH. 2 Instituto de Engenharia Nuclear/IEN.

(2)

Nuclear Sciences for the selection of data that pass through the digital curation process, with the criteria established in this context to guide the steps of appraisal and selection of research data. Keywords: Digital Curation. Research Data. Appraisal. Selection.

1 INTRODUÇÃO

O fenômeno do Big Data, bem como o novo paradigma cientifico denominado e-Science, nos coloca diante de um desafio já bastante discutido no domínio da Ciência da Informação: o aumento do volume de produção e acumulação de informação e a percepção da impossibilidade de se preservar e recuperar tudo. A ideia de que tudo deve ser preservado não só se mostra impraticável como também revela a necessidade de um sistema de avaliação adequado à capacidade de gestão e arquivamento existente.

No âmbito científico, dados de pesquisa podem ser encarados como documentos arquivísticos e classificados de acordo com os dois tipos de valores propostos por Schellenberg (1984): a) valor primário – relacionado à finalidade primeira para qual um documento público foi criado; b) valor secundário – o valor que persiste ao longo do tempo e que pode ser importante para usuários que não sejam os atuais (SCHELLENBERG, 1984, p.58). É perceptível como a teoria do valor de Schellemberg pode ser aplicada aos dados que são gerados pelas pesquisas científicas, visto que sua existência é intrínseca à pesquisa, estando aí seu valor primário, concomitantemente seu valor persistente ao longo do tempo os tornam importantes para os usuários de gerações futuras, estando aí seu valor secundário. Nos dias atuais, muitos dados produzidos em pesquisas mais antigas estão sendo revistos e reanalisados em pesquisas recentes, como o caso dos espécimes de plantas e animais coletados por exploradores que nada sabiam sobre DNA, sendo hoje essas amostras submetidas a esse tipo de investigação. De acordo com Poliakoff (2013), quando você coleta os seus dados reúne informações que, no futuro, poderão ser analisadas de formas muito diferentes. São coisas que terão um valor enorme para cientistas que nem nasceram.

(3)

mão-de-obra especializada, quais dados devem ser priorizados? Esta pesquisa se desenrola no intuito de apontar caminhos a essas indagações.

A área eleita para o estudo é a área de Ciências Nucleares, que, assim como diversas outras áreas, produz intensivamente uma diversidade de dados de pesquisa, indo desde resultados de experimentos até aqueles gerados a partir de simulações. Este fato vem sendo evidenciado no âmbito do Instituto de Engenharia Nuclear (IEN), uma das unidades de pesquisa pertencentes à Comissão Nacional de Energia Nuclear (CNEN). Apesar das especificidades da área Nuclear o problema de identificação, coleta e seleção dos dados de pesquisa é um desafio que se apresenta em qualquer área ou instituição que queira iniciar um projeto de curadoria de dados científicos, podendo o presente estudo ser útil para auxiliar projetos iniciais de curadoria digital de dados de pesquisa.

2 AVALIAÇÃO E SELEÇÃO NO CONTEXTO DA CURADORIA DIGITAL DE DADOS DE PESQUISA

A curadoria digital de dados de pesquisa tem como um de seus objetivos a preservação de dados científicos em formato digital, obedecendo ao ciclo de vida da pesquisa e garantindo o acesso a esses dados no futuro. A curadoria dos dados de pesquisa só será considerada bem sucedida se for possível conseguir manter essa informação disponível por tempo indeterminado, se sobrepondo até mesmo à obsolescência tecnológica (de software e hardware) e se sua semântica e estrutura também forem preservadas.

Por ser um termo recente ainda é possível encontrarmos algumas divergências para definir curadoria digital. Segundo o Digital Curation Centre/DCC4, a curadoria digital envolve “manter, preservar e adicionar valor ao conjunto de dados digitais de pesquisa através de seu ciclo de vida”

(tradução nossa).

Estabelecer o valor de um conjunto de dados de pesquisa é tão complexo quanto estabelecer o valor de um conjunto de documentos. Na página da U.S. National Archives and Records Administration encontramos publicada sua política de appraisal (avaliação), inserida no

campo denominado de “orientações estratégicas”. Segundo esta política, a avaliação não é um exercício rotineiro, exige conhecimento e sensibilidade para com os interesses dos pesquisadores e disposição para reconhecer e compreender comentários e sugestões diversos (U.S.

NATIONAL…, 2007)

(4)

Curadoria digital e preservação de dados são processos contínuos, que exigem considerável reflexão e o investimento de tempo e recursos adequados. Para a apropriada realização destes processos, o DCC lista ações sequenciais relacionadas ao modelo de ciclo de vida da curadoria digital de dados. Uma das etapas que fazem parte destas ações sequenciais é a de appraise and select (avaliar e selecionar), que visa avaliar os objetos digitais e selecionar aqueles que exigem curadoria de longo prazo e preservação, em concordância com as orientações, políticas e requisitos legais documentados (DIGITAL..., tradução nossa).

Por appraisal se entende “O processo que identifica se os materiais de arquivo possuem valor permanente” (PIERCE-MOSES, 2005, p.22). Já selection, no contexto de arquivo, se define

como “O processo de identificação de materiais a serem preservados por causa de seu valor

duradouro, especialmente os materiais a serem fisicamente transferidos para um arquivo”

(PIERCE-MOSES, 2005, p. 356).

Segundo Harvey (2007), as decisões que envolvem a seleção de materiais digitais têm pesadas implicações de recursos em curso, ao passo que a seleção de materiais que têm o papel como suporte pode ter os custos de manutenção suspensos por períodos de tempo sem que necessariamente causem grande efeito prejudicial. Por isso os critérios de appraisal e selection usados para materiais tradicionais não se aplicam aos dados sem sofrerem modificações, e três diferenças entre essas práticas para objetos em papel e objetos digitais (no caso, dados digitais de pesquisa) são elencadas por ele: ênfase na capacidade técnica para se preservar dados que exigem ações contínuas; o custo corrente na preservação de dados; tomada de decisão de preservação no início da existência dos dados para não se tornarem inacessíveis ou desaparecerem (HARVEY, 2007, p.10).

“Decisões de avaliação e seleção devem ser baseadas em uma compreensão clara dos

objetivos da organização que aceita a responsabilidade de preservação” (HARVEY, 2007, p.8

(5)

3 CRITÉRIOS PARA AVALIAÇÃO E SELEÇÃO DOS DADOS

Os eixos de atuação do IEN se pautam, além do ensino e pesquisa, na obtenção de patentes, na comunicação científica, no compartilhamento de dados e recursos entre os laboratórios do próprio IEN e também de outras unidades da CNEN. Como desdobramento de suas atividades acadêmicas e de pesquisa e desenvolvimento, o IEN produz intensamente informações e dados de pesquisa em formatos digitais, alguns sensíveis e/ou sigilosos. Esses recursos informacionais se manifestam na forma de relatórios, teses e dissertações, artigos, multimídia, apresentações, aulas, programas de computador, simulações, ambientes, virtuais e coleções de dados, que estão registrados nos mais diversos formatos e mídias.

Devido à inexistência de uma política mandatória para gestão de dados gerados pelas pesquisas no IEN, não houve uma tomada de decisão quanto a sua preservação no início de sua geração, tornando urgente a criação de critérios para avaliar e selecionar a enorme quantidade de dados de pesquisas, impedindo, assim, que estes se tornassem inacessíveis ou se perdessem.

A seguir são apresentados dois conjuntos de critérios: um primeiro conjunto denominado critérios gerais, que se aplica aos dados gerados por pesquisas de maneira geral; e um segundo que foi pensado especificamente para os dados gerados pelas pesquisas no IEN, o que não impede que seja aplicado a outras áreas.

3.1 Critérios gerais

Um critério fundamental está relacionado à capacidade dos dados serem reprodutíveis, assim, é possível classificar esses dados em: dados reprodutíveis - os que podem ser regerados a um custo aceitável; dados irreprodutíveis - aqueles que não podem ser reproduzidos jamais ou apenas reproduzidos a um custo muito alto. Nesse último patamar são incluídos os dados observacionais e os dados cujo custo de curadoria é muito inferior ao custo de regeração. Os dados computacionais, por sua vez, podem sempre ser regerados se estiverem bem documentados. Nesse contexto, os limites tecnológicos, financeiros e gerenciais são componentes importantes a serem considerados.

(6)

registra o histórico e vinculações dos dados (por exemplo, a vinculação de dados primários e secundários) e com os protocolos de qualidade na coleta e geração dos dados

Por fim, deve se considerar a suscetibilidade e a obsolescência tecnológica que afetam com mais contundência os objetos digitais mais complexos, isto é, formados por vários componentes, como arquivos, programas, conteúdos interativos etc.

3.2 Critérios Específicos

(7)

Os dados enquadrados nos dois últimos critérios (4 e 5) possuem processos de curadoria mais complexos e por isso são deixados por último. Além disso, no caso dos dados que se enquadram no critério 5, que são sigilosos por determinado período e que precisam ser embargados, são deixados em espera por um tempo a fim de que o período de embargo seja ultrapassado e eles finalmente possam ser compartilhados.

4 CONSIDERAÇÕES FINAIS

Este trabalho visou ser uma primeira contribuição a uma das etapas do processo de curadoria digital de dados de pesquisa, isto é, a etapa da seleção e da avaliação dos dados. Como o tema curadoria digital de dados de pesquisa ainda é incipiente no Brasil, acredita-se que muitas instituições que, neste momento, começam a lidar com o tema, enfrentarão essa mesma problemática. Outros trabalhos que abordem outras fases da curadoria digital de dados de pesquisa ainda precisam ser desenvolvidos e aplicados futuramente.

(8)

REFERÊNCIAS

DIGITAL Curation Centre (DCC). What is digital curation? Disponível em:

<http://www.dcc.ac.uk/digital-curation/what-digital-curation> Acesso em: 10 mar 2016.

HARVEY, Ross. Selection and Appraisal. In: ROSS, S.; DAY, M. (ed.). DCC Digital Curation Manual, 2007. Disponível em: <

http://www.dcc.ac.uk/resource/curation-manual/chapters/appraisal-and-selection> Acesso em: 10 mar 2016.

PIERCE-MOSES, Richard. A Glossary of Archival and Records Terminology. Chicago: Society of American Archivists, 2005.

POLIAKOFF, Martyn. [Depoimento]. In: Jones F. Editor-chefe da Nature fala sobre a abertura da ciência. Agência FAPESP, São Paulo, 06 mar. 2013. Disponível em: <http://agencia.fapesp.br/editorchefe_da_nature_fala_sobre_a_abertura_da_ciencia/16919/>. Acesso em: 30 mar 2016.

SCHELLENBERG, T. The Appraisal of Modern Public Records, Modern Archives Reader: Basic Readings on Archival Theory and Practice. National Archives and Records Service, 1984.

Referências

Documentos relacionados

In this work, TiO2 nanoparticles were dispersed and stabilized in water using a novel type of dispersant based on tailor-made amphiphilic block copolymers of

The Guideline on the chemistry of active substances has set out the type of information required for the manufacture that should be included in an application with a view to

Agreement among measurements of the same quantity is fundamental for validity studies, randomised controlled trials and to ensure efficient delivery of health care. As it

Neste tipo de situações, os valores da propriedade cuisine da classe Restaurant deixam de ser apenas “valores” sem semântica a apresentar (possivelmente) numa caixa

Para além da quantificação da captação de formaldeído do ar interior, todas as tintas foram sujeitas a testes e ensaios de caracterização simplificados e nas tintas

Os controlos à importação de géneros alimentícios de origem não animal abrangem vários aspetos da legislação em matéria de géneros alimentícios, nomeadamente