• Nenhum resultado encontrado

Curadoria digital : o conceito no período de 2000 a 2013

N/A
N/A
Protected

Academic year: 2021

Share "Curadoria digital : o conceito no período de 2000 a 2013"

Copied!
166
0
0

Texto

(1)

UNIVERSIDADE DE BRASÍLIA - UnB FACULDADE DE CIÊNCIA DA INFORMAÇÃO - FCI

Programa de Pós-Graduação em Ciência da Informação – PPGCINF

THAYSE NATÁLIA CANTANHEDE SANTOS

CURADORIA DIGITAL:

o conceito no período de 2000 a 2013

Brasília 2014

(2)

THAYSE NATÁLIA CANTANHEDE SANTOS

CURADORIA DIGITAL:

o conceito no período de 2000 a 2013

Dissertação apresentada à banca examinadora como requisito parcial à obtenção do Título de Mestre em Ciência da Informação pelo Programa de Pós-Graduação em Ciência da Informação da Faculdade de Ciência da Informação da Universidade de Brasília.

Orientador: PROF. DR. MURILO BASTOS

DA CUNHA

Brasília 2014

(3)
(4)
(5)

AGRADECIMENTOS / ACKNOWLEDGMENTS

Youth: it’s painful. I have faced my darkest hours many times throughout working on this research. I fell sick, I saw my dearest ones get sick and eventually recover. I got heartbroken and broke someone’s heart. I doubted my capacity, my intelligence. I’ve been challenged in many ways just to found out that success depends much more to my own capacity to give it all without expecting anything back. It is the first rule of my life now.

However, it is good to see I could overcome most of the hassles that have turned up on the way out to becoming a grown up woman. It hasn’t been easy.

I want to specially thank my mother, my everyday heroin for the ongoing efforts to keep me strong and productive. My sister, Nália Cantanhede is the joy itself and kept me up with her positiveness. Cheers for that. To my younger sister, Nádja Cantanhede whom is beginning her journey into the academia and in life, I wish her all the happiness.

I’m also thankful for my cherished friends Joanita Pereira Basto, Angélica Gasparotto de Oliveira and Priscila de Melo Silva.

Joanita for her unselfish friendship, her constant care and dedication. Angélica for being an example of courage and perseverance in face of the adverse. Nobody can against her indomitable will. Nobody. I’m deeply grateful for Priscila de Melo Silva presence in my life. She might not be always here with me, but always there for me. Many thanks to Tanívia Pinheiro Timbó, Fabiana Camargo, Mariana Giubertti Guedes Greenhalgh and Elna Araújo Silva. Four different great gals, all of them lovely and unique., all of them friends I could count with in many moments of my life.

A special thank you to José Antonio Machado do Nascimento for being such a great professional role model to me and for being my friend, I‘ve grown wiser with your advice and thoughtfulness towards me during all these years.

(6)

Also to my distant friend David Holmgren from Sweden.

To the dearly loved James Bullock, for the adventure so far. As well for the endless patience and love for his hard-time-giver girlfriend…

Many thanks to Professor Leonardo Lazarte for the calmness, time and help offered. I’d like to also thank my colleagues at the Central Library of the University of Brasília. Working with them enriched me as a professional and as a person.

My consideration to all my colleagues at the Graduate Program in Information Science (PPGCInf) of the Faculty of Information Science (FCI) in the University of Brasilia (UnB). Special regards to Sérgio Peçanha Coletto, probably the coolest entrepreneuer of Brasília and my friend as well.

I’d like to express my admiration for the many professors I’ve had as guides in the many classes I was enrolled in. Professor Dulce Maria for being the perfect archetype of the academic eruditism balanced with kindness and humanity. I couldn’t avoid thanking Professor Jayme Leiro for the second chance given when I need one, it was priceless.

Thank you to Miguel Márdero Arellano, Professor Fernando William and Professor Ivette Kafure for kindly appreciate my work and contribute to my growth with your considerations and opinions as members of this masters defense board.

At last but not at least, to my advisor, Murilo Bastos da Cunha, whose chivalry, patience and understanding made me go further and further.

To the Coordination for the Improvement of Higher Level Personnel (CAPES) for the financial support.

My wholehearted thanks for the support of all that somehow contributed to this research.

(7)

“Exige muito de ti e espera pouco dos outros. Assim, evitarás muitos aborrecimentos”. Confúcio "La vraie générosité envers l'avenir consiste à tout donner au présent..." Albert Camus

(8)

RESUMO

A presente pesquisa pretende apresentar um breve panorama do conceito de curadoria digital. Para tanto, foi realizada revisão de literatura, além de pesquisa em bases de dados especializadas em Ciência da Informação, com o intuito de investigar a produção sobre o tema, de 2000 a novembro de 2013 e posterior análise da bibliométrica e substantiva dos documentos. É realizada revisão bibliográfica nas áreas de bibliotecas digitais, preservação digital e em curadoria digital a fim de identificar um caminho teórico percorrido até a emergência do conceito de curadoria digital a partir da preservação digital e das bibliotecas digitais. Com base na amostra representativa da produção bibliográfica sobre o tema, fez-se análise de características relativas à forma dos documentos como autoria, afiliação dos autores, ano de publicação, tipo de documento, idioma e palavras-chave atribuídas. Quanto à apreciação da parte textual dos registros levantados, o foco da investigação foi voltado para busca do que é entendido como curadoria pelos autores no intuito de clarificar e consolidar a definição do termo curadoria digital e sua importância para a preservação da informação digital. Conclui-se que a curadoria digital está em franco desenvolvimento e constitui termo guarda-chuva, que abarca definições correlatas voltadas à seleção, enriquecimento, tratamento e preservação da informação para o acesso e uso futuro.

Palavras-chave: Biblioteca Digital. Curadoria digital. Preservação digital.

(9)

ABSTRACT

This research aims to provide a brief overview of the concept of digital curation. To this end, a literature review was performed, in addition to a thorough search in Information Science specialized databases, in order to investigate the writings on the topic from 2000 to November 2013, which were subsequently analyzed bibliometrically and substantively. The literature review is conducted in the areas of digital libraries, digital preservation and digital curation to identify a theoretical path toward the emergence of the concept of digital curation from digital preservation and digital libraries. A representative sample of the research output is analyzed in terms of characteristics concerning the form of the documents, such as authorship, authors’ affiliations, publication year, document type, language and keywords assigned. On the assessment of the textual part of the records collected, the research aimed to determine what is understood as curation by the authors in order to clarify and consolidate the definition of digital curation and its importance for the preservation of digital information. We conclude that digital curation is developing rapidly as an umbrella term that encompasses related settings focused on selection, enrichment, processing and preservation of information for future use and access.

Keywords: Digital Curation. Digital Library. Digital preservation. Preservation of

(10)

RESUMEN

Esta investigación tiene como objetivo proporcionar una breve visión general del concepto de la curaduría digital. Para ello una revisión de la literatura se llevó a cabo, y la investigación en bases de datos especializadas en Ciencias de la Información, con el propósito de investigar la literatura sobre el tema desde 2000 a noviembre de 2013 y posteriormente el análisis bibliométrico y sustantivo de los documentos. Revisión de la literatura se llevó a cabo en las áreas de las bibliotecas digitales, preservación digital y la preservación digital para identificar un camino teórico recorrido hasta la emergencia del concepto de curaduría digital a partir de la preservación digital y las bibliotecas digitales. Basado en una muestra representativa de la erudición sobre el tema, hizo el análisis de las características relativas a la forma de documentos, tales como la autoría, filiación del autor, año de publicación, tipo de documento, idioma y palabras clave asignadas. En cuando a la evaluación de la parte textual de los registros recopilados, el foco de la investigación se ha centrado en la búsqueda de lo que se entiende como curaduría por los autores a fin de aclarar y consolidar la definición de curaduría digital y su importancia para la preservación de la información digital. Llegamos a la conclusión de que curaduría digital se está desarrollando rápidamente y es un término general que abarca definiciones relacionadas, centradas en la selección, el enriquecimiento, el procesamiento y la preservación de la información para uso futuro y el acceso.

Palavras-clave: Curaduría Digital. Biblioteca Digital. Preservación digital.

(11)

RESUMÉ

Cette recherche propose la présentation d’un brève panorama du concept de la Curation Digitale. Pour déveloper ce travaill on a fait une Revision Literaire et recherches en bases des donnés spécialisées en sciences d’information. Le principal but c’est d’explorer la production sur ce sujet de 2000 à novembre de 2013 et avant l’analyse bibliometrique et substantive des documents. Il est réalisé la révision bibliographique sur les bibliothèques numériques, la préservation numérique et la curation digitale afin d’identifiquer un chemin théorique parcouru jusqu’à l’emergence du concept de la Curation Digitale à partir de la concervation numérique et des bibliothèques numériques. Basé dans un échantillon des relatifs à la forme des documents comme la paternité, les aflitions des auteurs, date de la publication, type de document, langue et mots-clés attribuées. Par rapport à l’appréciation de la partie textuelle des registres recueillies, la mise au point de l’investigation est le concept de Curation Digitale pour les auteurs avec le but de clarifier et consolider le thèrme Curation Digitale et son importance pour la préservation de l’information numérique. Pour conclure la curation digitale est en developpment et forme le thèrme para-pluie, qui comprend les definitions qui sont tounées à la sélection, enrichissement, traitement et préservation de l’information pour l’accès et l’usage future.

Mots-Clés: Bibliothèque Numerique, Curation Digitale, Préservation Numérique.

(12)

LISTA DE ILUSTRAÇÕES

Figura 1 - Definições de Biblioteca Digital ________________________________________________ 44 Figura 2 - Esquema conceitual OAIS ______________________________________________________ 58 Figura 3 - Modelo simplificado do JISC para ambiente da informação _________________ 60 Figura 4 - Digital NZ Model ________________________________________________________________ 62 Figura 5 - Modelo CASPAR para preservação digital_____________________________________ 63 Figura 6 - Principais operações do ciclo documentário _________________________________ 64 Figura 7 - Ações completas de ciclo de vida ______________________________________________ 65 Figura 8 - Ações sequenciais e ocasionais ________________________________________________ 66 Figura 9 - Modelo de Curadoria do DCC ___________________________________________________ 67 Figura 10 - Desenho da Pesquisa __________________________________________________________ 72 Figura 11 - Países que produziram sobre o tema entre 2000 e 2013 __________________ 99 Figura 12 - Acepções de curadoria _______________________________________________________ 132

(13)

LISTA DE QUADROS

Quadro 1 - Métodos de preservação digital ... 51 Quadro 2 - Comparação entre o DCC Life Cycle Model, o Ciclo Documentário e o Modelo de Referência do OAIS ... 68

(14)

LISTA DE TABELAS

Tabela 1 - Desenho do instrumento de pesquisa _________________________________________ 79 Tabela 2 - Número de registros das bases de dados pesquisadas ______________________ 86 Tabela 3 - Amostra representativa da pesquisa __________________________________________ 89 Tabela 4- Periódicos mais produtivos ____________________________________________________ 92 Tabela 5 - Produtividade dos autores _____________________________________________________ 96 Tabela 6 - Instituições que mais produzem sobre o tema _______________________________ 97 Tabela 7 - Países com maior número de publicações sobre o tema ____________________ 98 Tabela 8 - Incidência de Palavras-chave _________________________________________________ 100 Tabela 9- Palavras-chave com o termo Information ____________________________________ 101 Tabela 10 - Palavras-chave com o termo Digital ________________________________________ 102

(15)

LISTA DE SIGLAS E ABREVIATURAS

ACLS American Council of Learned Societies AHDS Art and Humanities Data Service

ARPANet Advanced Research Projects Agency Network ASLAPR State Library, Archives and Public Records

BRAPCI Base de Dados Referenciais de Artigos de Periódicos em Ciência da Informação

CASPAR Cultural, Artistic and Scientific knowledge for Preservation, Access and Retrieval

CBU Controle Bibliográfico Universal

CCLRC Council for the Central Laboratory of Research Councils CDU Classificação Decimal Universal

CERN European Organization for Nuclear Research CLIR Council on Library and Information Resources

DCC Digital Curation Center

DRM Digital Rights Management

EPSRC Engineering and Physical Sciences Research Council

FID Federação Internacional de Informação e Documentação

HATII Humanities Advanced Technology and Information Institute

HTTP HyperText Transfer Protocol

IBGE Instituto Brasileiro de Geografia e Estatística

ICCC International Conference on Computer Communications

IFLA International Federation of Library Associations and Institutions IMLS Institute for Museum and Library Services

(16)

iRODS Rule Oriented Data management System

ITU International Telecommunication Union

JCSR Joint Information Systems Committee’s Committee for the Support of Research

JISC Joint Information Systems Committee

LISA Library and Information Science Abstracts

LISTA Library, Information Science & Technology Abstracts LOCKSS Lots of Copies Keep Stuff Safe

NATIS National Documentation, Library and Archives Infrastructures NESC National e-Science Centre

NSFNET National Science Foundation Network

OAIORE Open Archives Initiative Object Reuse and Exchange OAIS Open Archival Information Systems Reference Model PNAD Pesquisa Nacional por Amostra de Domicílios STFC Science and Technology Facilities Councils

UKOLN The United Kingdom Office for Library and Information Networking UNC-SILS University of North Carolina at Chapel Hill School of Information and

Library Science

UIUC-GSLIS University of Illinois at Urbana-Champagn

(17)

SUMÁRIO

1 INTRODUÇÃO ______________________________________________________________________________19

1.1 A pesquisa ______________________________________________________________________________ 20 1.2 Antecendentes da curadoria digital ___________________________________________________ 21 1.2.1 A Internet como espaço para a ciência ________________________________________________ 22 1.2.2 Organização para preservação ________________________________________________________ 25 1.3 Problema ________________________________________________________________________________ 31 1.4 Objetivos ________________________________________________________________________________ 37 1.5 Justificativa _____________________________________________________________________________ 37

2 REVISÃO DE LITERATURA _______________________________________________________________42

2.1 Considerações sobre a Revisão de Literatura ________________________________________ 43 2.2 Bibliotecas digitais _____________________________________________________________________ 43 2.3 Objetos digitais _________________________________________________________________________ 47 2.4 Repositório institucional ______________________________________________________________ 48 2.5 Preservação digital _____________________________________________________________________ 49 2.6 A preservação em bibliotecas digitais ________________________________________________ 53 2.7 Preservação digital em repositórios institucionais __________________________________ 56 2.8 Modelos de ciclo de vida _______________________________________________________________ 59 2.8.1 O modelo de ciclo de vida do JISC ______________________________________________________ 60 2.8.2 O modelo da DigitalNZ _________________________________________________________________ 61 2.8.3 O modelo de ciclo de vida do CASPAR _________________________________________________ 62 2.9 O modelo de curadoria do DCC e o ciclo documentário _____________________________ 64

(18)

3 PROCEDIMENTOS METODOLÓGICOS __________________________________________________70

3.1 Procedimentos metodológicos ________________________________________________________ 71 3.2 Coleta de dados _________________________________________________________________________ 72 3.3 Levantamento e estudo bibliométrico ________________________________________________ 73 3.4 O termo da busca bibliográfica ________________________________________________________ 76 3.5 Instrumento de coleta de dados _______________________________________________________ 77 3.6 Análise de documentos ________________________________________________________________ 80 3.7 Definições operacionais _______________________________________________________________ 83

4 ANÁLISE DE DADOS _______________________________________________________________________85

4.1 Definição do universo da pesquisa ____________________________________________________ 86 4.2 Análise dos resultados encontrados nas bases de dados ___________________________ 87 4.2.1 Resenhas ________________________________________________________________________________ 87 4.2.2 Notícias e relatos de evento ____________________________________________________________ 88 4.2.3 Pôsteres e apresentações ______________________________________________________________ 88 4.2.4 Documentos em língua estrangeira ___________________________________________________ 88 4.3 Análise e interpretação dos dados ____________________________________________________ 89 4.4 Aspectos externos dos documentos __________________________________________________ 90 4.4.1 Tipos de Publicação ____________________________________________________________________ 92 4.4.2 Idioma __________________________________________________________________________________ 94 4.4.3 Autoria __________________________________________________________________________________ 95 4.4.4 Instituições _____________________________________________________________________________ 97 4.4.5 Produção por país ______________________________________________________________________ 98 4.4.6 Palavras-chave _______________________________________________________________________ 100 4.5 Aspectos intrínsecos dos documentos ______________________________________________ 102

(19)

4.5.1 Curadoria de arte ____________________________________________________________________ 103 4.5.2 Curadoria de conteúdo _______________________________________________________________ 104 4.5.3 Curadoria de dados __________________________________________________________________ 105 4.6 Do conceito de “curadoria digital” __________________________________________________ 105 4.6.1 Desenvolvimento acadêmico da curadoria no contexto americano _______________ 126 4.6.2 Observações sobre os conceitos de curadoria digital encontrados ________________ 129

5 CONCLUSÕES _____________________________________________________________________________ 133 REFERÊNCIAS _______________________________________________________________________________ 138

APÊNDICES 154

Apêndice A – Instrumento de pesquisa - Formulário de entrada de dados _____________ 155 Apêndice B – Tabelas com registros retirados da análise bibliométrica ________________ 156 Apêndice C - Cursos de curadoria digital nos Estados Unidos, Reino Unido e Europa _ 162

(20)
(21)

20 1.1 A pesquisa

A dinamicidade da informação digital criada em diferentes meios, com distintos propósitos atrai a atenção de vários campos do conhecimento pelos desafios impostos pela sua preservação. A riqueza das origens e finalidades da informação digital amplia os atuais desafios da preservação digital1.

Este trabalho insere-se nesse contexto, ao abordar como tema central o conceito de curadoria digital, concepção emergente para preservação e manutenção da informação digital ao longo do tempo para uso e acesso futuros.

Como área do conhecimento em florescimento e pela carência de documentos na língua portuguesa, foi necessário dialogar com o referencial teórico em objetos digitais, bibliotecas digitais, preservação digital e modelos de preservação em ciclo de vida e apresentar algumas acepções de curadoria digital para fundamentação teórica básica para entendimento maior do conceito em estudo.

Na tentativa de apontar as acepções2 de curadoria digital encontrados na literatura foram pesquisadas bases de dados específicas em Ciência da Informação e áreas correlatas.

O trabalho está estruturado do seguinte modo: no primeiro capítulo- 1.1 A pesquisa, apresenta a visão geral da pesquisa; 1.2 Antecedentes da curadoria digital apresenta o contexto inicial da emergência do conceito; 1.3 a definição do problema; na seção 1.4 os objetivos da pesquisa e na seção 1.5 a justificativa do trabalho.

No Capítulo 2, a revisão da literatura, a seção 2.1 considera algumas definições de biblioteca digital. A Seção 2.2 apresenta a definição de objetos digitais.

1

Segundo Ferreira (2006, p. 20) A preservação digital consiste na capacidade de garantir que a informação digital permaneçe acessível e com qualidades de autenticidade suficientes para que possa ser interpretada no futuro recorrendo a uma plataforma tecnológica diferente da utilizada no momento da sua criação.

2

Acepção pode ser entendida como o sentido em que se toma uma palavra; significação, significado, sentido, interpretação, entendimento. O dicionário Houaiss (p. 50, 2011) a define como: cada um dos vários sentidos que palavras ou frases apresentam de acordo com cada contexto; ação de receber, compreensão de uma palavra ou sentido que lhe dá a quem ouve.

(22)

As seções 2.3, 2.4, 2.5 e 2.6 apresentam, respectivamente os conceitos de preservação digital, preservação em repositórios e os modelos de ciclo de vida.

O capítulo 3 descreve os procedimentos metodológicos adotados a pesquisa, pormenorizados nas seções 3.1 à 3.7.

O capítulo 4 registra a análise dos dados, na Seção 4.1 a definição do universo da pesquisa; na Seção 4.2 a análise dos resultados encontrados nas bases de dados; na Seção 4.3 é feita a análise e interpretação dos resultados; na Seção 4.4, a análise dos aspectos extrínsecos dos documentos levantados e, na Seção 4.5, considerações sobre a parte substantiva dos documentos.

No capítulo 5 são apresentadas as conclusões finais e sugestões de trabalhos futuros.

1.2 Antecendentes da curadoria digital

A ciência eletrônica utiliza redes computacionais para permitir o avanço da ciência. Segundo Márdero Arellano (2008, p. 33) “as atividades relacionadas com a ciência eletrônica requerem um gerenciamento digital de entrada e saída de dados via simulação de testes e grande volume de informações sendo distribuídas e usadas massivamente”. Contudo, uso das redes não se limita a esse aspecto: a rede é o canal para disponibilização de resultados da pesquisa científica. A necessidade disponibilizar tais informações impeliu a criação de iniciativas de arquivamento, uma vez que a investigação científica é financiada em grande parte pelo setor público.

Nesse cenário, o da premência da construção de espaços arquivamento distribuído de dados, os serviços de curadoria emergiriam como essenciais para criação desses espaços, onde a informação ali armazenada seria íntegra, confiável e enriquecida.

A definição do dicionário para curadoria é “ato ou efeito de curar, função, atributo, cargo, poder de curador, curatela” (HOUAISS; VILLAR, p. 892, 2007).

(23)

22

Contudo, o termo “curadoria” foi transposto de museus e bibliotecas às mídias interativas (a Web e seus novos canais de comunicação).

Apesar do entendimento habitual da palavra, a emergência do termo ‘curadoria digital’ é recente e assim como termos relacionados tais como preservação digital e arquivamento digital, e ainda está em desenvolvimento. A adoção do termo por alguns especialistas incorpora aspectos dos conceitos de ‘curadoria de dados’ e preservação digital usadas primariamente pelas comunidades científica e de bibliotecas digitais respectivamente. Assim que, o que muitos autores tem tentado comunicar com o aparecimento desse termo é que há a necessidade de uma nova abordagem para a criação e gerenciamento de ativos digitais. (BEAGRIE, p. 4, 2006).

1.2.1 A Internet como espaço para a ciência

A profecia da criação da Internet foi abordada em 1992, no romance Mirror worlds, or, the day software puts the universe in a shoeboxde David Gelertner, cientista da computação e professor da Universidade de Yale. Contudo, a criação da rede mundial de computadores remonta à época de um mundo bipolar e em constante tensão bélica.

Todavia, o grande avanço no desenvolvimento tecnológico das mídias, com as enxergamos hoje, ocorreu em 1969 quando começaram as primeiras tentativas conducentes ao estabelecimento, em 1972, da Advanced Research Projects Agency Network (ARPANet). Em 1986, a National Science Foundation Network (NSFNET) consolidou o estabelecimento da rede com a sua melhoria estrutural, fato que provocou a explosão de conexões, principalmente nas universidades. No ano seguinte, o número de servidores passa dos 10 mil, espalhados pelo mundo. Em 1989, esse volume de servidores era 10 vezes maior.

Nas palavras de Castells:

a rápida difusão de protocolos de comunicação entre computadores não teria ocorrido sem a distribuição aberta, gratuita de software e o uso cooperativo de recursos que se tornou o código de conduta dos hackers.[...]

(24)

O advento do PC ajudou consideravelmente a difusão de redes de computadores. [...] A maioria das redes, contudo exigia um backbone ancorado em máquinas mais potentes, e isso só foi possível graças ao contato entre redes baseadas em ciência e comunidades de hackers nas universidades. (CASTELLS, 2003, p. 25)

As redes exclusivas da Big Science, uma vez abertas à comunidade acadêmica (“redes contraculturais”, segundo Castells) se converterão em espaços para circulação da inovação e do conhecimento.

De modo concomitante ao desenvolvimento da base estrutural para distribuição da rede estabelecida, padrões e protocolos para transmissão de dados também já desenvolvidos e ao crescimento da rede para fora do contexto puramente acadêmico/científico, a hipertextualidade apresenta-se como imperativo da rede mundial que se formaria nos anos seguintes.

O cientista Tim Berners Lee, do CERN, antiga sigla do Conseil Européen pour la Recherche Nucléaire hoje designado European Organization for Nuclear Research, esboçou a ideia3 da World Wide Web já em 1989. Criada por ele em 1992, Lee especulou sobre um ambiente onde se acessa tudo de todos os lugares com a seguinte máxima. A rede seria um espaço livre, aberto e sem proprietários e no hipertexto se refere ao texto digital que agrega conjuntos de informação acessíveis por meio de hiperlinks.

Coaduna-se à ideia do cientista inglês a tão conhecida proposição de Vannevar Bush no artigo “As we may think”. De 1945, o escrito parece preconizar, com o Memex, o que seria definido mais tarde como hipertexto. Barret (1989, p. 12) chama o Memex de um “sistema hipertextual prototípico” projetado sob um princípio “associacionista”, que trabalha da mesma maneira que a mente humana.

A rede como espaço de intervenção social livre é resultado da aceleração do processo de inovação tecnológica e na consolidação da rede, primeiro em meio

3

Em 12 de novembro de 1990, Berners-Lee e um colega, Robert Cailliau, voltaram-se para a ideia do documento de 1989 com uma proposta mais substancial que cunhou o nome "WorldWideWeb". BERNERS-LEE, Tim; CAILLIAU, R. WorldWide Web: Proposal for a HyperText Project. Disponível em: <http://www.w3.org/Proposal.html>. Acesso em: 25 abr. 2014.

(25)

24

acadêmico e, em um segundo momento, como espaço aberto ao comércio e às transações financeiras. Nas palavras de Cocco, Galvão e Silva (2003, p. 11):

Nas mudanças econômicas, tecnológicas, sociais e culturais que acompanham a emergência e a ampla difusão das novas tecnologias de informação e comunicação (NTIC) e a dimensão cognitiva da economia, a produção constante e intermitente do “novo” impõe-se como um elemento comum, evidenciando deslocamentos paradigmáticos com profundas implicações na própria relação entre trabalho e vida. A produção do novo aparece como questão essencial para a ciência econômica na medida em que implica a inserção do aleatório, da incerteza e do desequilíbrio no cerne da atividade produtiva. A invenção e a inovação ascendem à posição de elementos fundamentais para o sucesso econômico de empresas, sistemas produtivos, regiões e países, implicando novas demandas para as políticas públicas.

A resultante dessa série de fatores foi a popularização da Internet a nível mundial. Segundo a International Telecommunication Union (ITU), em 2013, mais de 2,7 bilhões de pessoas usavam a Internet, o que correspondia a 39% da população conectada.

No Brasil, em números absolutos, 77,7 milhões de pessoas usavam Internet em 2011, ante 67,7 milhões em 2011. De acordo com pesquisa “Acesso à Internet e Posse de Telefone Móvel Celular para Uso Pessoal”, realizada pelo Instituto Brasileiro de Geografia e Estatística (IBGE) com base na Pesquisa Nacional por Amostra de Domicílios (PNAD).

O Brasil passou dos cem milhões de pessoas com acesso à Internet durante o primeiro trimestre de 2013, segundo relatório divulgado pelo Ibope Media em julho do mesmo ano (IBOPE4, 2013).

Os indivíduos buscam, cada vez mais, uma constante atualização de informações na Web, estabelecendo redes de conhecimento resultantes de conexões e da interação entre os atores, uma troca intensa de informações geralmente convertidas em conhecimento.

4

UOL NOTÍCIAS TECNOLOGIA. Número de internautas no Brasil ultrapassa 100 milhões, segundo Ibope. Disponível em: <http://tecnologia.uol.com.br/noticias/redacao/

2013/07/10/numerodeinternautasnobrasilultrapassa100milhoessegundoibope.htm>. Acesso em: 25 set. 2013.

(26)

Uma das considerações contemporâneas desse espaço de intervenção social coletivo concerne à organização desse caos invisível cujo crescimento é exponencial. É necessário atentar para a Internet invisível (invisible web) ou web profunda (deep Web) – informações que não usam o protocolo HTTP, da Web. Ou seja: apenas o seu navegador de Internet não é suficiente para ver esses sites. A deep Web é composta de grandes quantidades de informação que têm sido postadas online e, que por razões técnicas de permissão e de acesso, não foram catalogadas ou atualizadas pelos motores de busca.

Nesse contexto de Webs visíveis e invisíveis, ambas construídas de modo coletivo e orientado a interesses variados, vem à mente o ideal de organização universal do conhecimento preconizado por Paul Otlet e Henri La Fontaine (Rayward, 1994). Criadores da antiga Federação Internacional de Informação e Documentação (FID), desenvolvedores da Classificação Decimal Universal (CDU), internacionalistas, teóricos da Documentação e da Ciência da Informação. Eles propuseram o projeto da reunião e descrição do todos os livros do mundo, em 1895, que partiu do Instituto Internacional de Bibliografia em Bruxelas. Este projeto intencionava reunir a produção bibliográfica mundial em forma de catálogo em fichas, onde era indicada também a localização física da obra. O Répertoire Bibliographique Universal, foi como ficou conhecido este catálogo que chegou a ter 20 milhões de fichas (RAYWARD, 1997).

1.2.2 Organização para preservação

Em 1973, na conferência da International Federation of Library Associations and Institutions (IFLA) em Grenoble, foi ativado um programa Controle Bibliográfico Universal (CBU), “cujo objetivo era reunir e tornar disponíveis os registros da produção bibliográfica de todos os países, concretizando assim o ideal do acesso de todos os cidadãos ao conjunto do conhecimento universal” (CAMPELLO, 2006, p. 12).

O Escritório Internacional da IFLA foi criado no ano seguinte, por decisão do Comitê Executivo da mesma instituição. Em setembro de 1974, a Conferência

(27)

26

Internacional da Unesco estabeleceu os objetivos do CBU e um programa de ação para sua implantação. Também coube à UNESCO assistir o programa através de suas próprias atividades e custear o Escritório do CBU de acordo com os catorze objetivos da proposta do programa National Documentation, Library and Archives Infrastructutres (NATIS). Em 1977, a UNESCO, juntamente com a IFLA propõem diretrizes para o programa. Nas palavras de Anderson (1977, p. 295) "Controle Bibliográfico Universal será promovido pela UNESCO em cooperação com a IFLA, com o objetivo maior de criar um sistema mundial para o controle e troca de informação".

Esse foi o ideal de organização que, apesar de notável, não conseguiu “catalogar” toda a produção intelectual do planeta. Ainda assim, o CBU serviu como orientador para a alarmante situação do universo digital, construído de modo coletivo e desorganizado. A produção em meio digital não tem uma cara definida, tampouco atenta para normas e padrões; isso torna a organização para o fomento do conhecimento na virtualidade um dos desafios maiores da Ciência da Informação contemporânea.

A Ciência da Informação define o controle ideal do conhecimento com conceito de controle bibliográfico. Este pode ser entendido como "um domínio completo sobre os materiais que registram o conhecimento, objetivando sua identificação, localização e obtenção" (CAMPELLO; MAGALHÃES, 1997, p. 7).

Shera (1975) aprofunda o detalhamento sobre os níveis do controle bibliográfico. São eles:

 nível geral – controle dos registros que interessam à nação, de responsabilidade governamental;

 nível particular – controle dos registros que interessam a um determinado grupo de indivíduos/ instituições com interesses específicos comuns, como as bibliografias especializadas;

(28)

 nível interno – controle dos registros que interessam aos usuários em particular ou de determinadas instituições. Papel desempenhado pelas bibliotecas ou agências de informação.

Não seria o controle bibliográfico uma saída também para o que é virtual e que precisa ser organizado? Pode ser que sim, pois abarca a sociedade da informação nas suas esferas de penetração: a social (o Estado e as suas organizações, empresas, instituições de ensino e pesquisa, iniciativa privada) e a individual.

O advento da era digital trouxe consigo a promessa da memória ilimitada. De início, se supunha que o poder da computação combinado com crescimento exponencial dos espaços em disco e os custos decrescentes para a aquisição dos componentes pudessem tornar possível o armazenamento eterno de qualquer objeto de natureza digital.

Um dos problemas mais óbvios relacionados à preservação em meio digital é o da decadência e obsolescência de hardware. Isso é solucionado com a substituição de sistemas de armazenamento de dados, uma vez que discos rígidos estão baratos e confiáveis. A ameaça de perda de dados nesses sistemas é mitigada com várias cópias distribuídas em diferentes lugares (princípio que orienta iniciativas como LOCKSS (Lots of Copies Keep Stuff Safe – projeto sob os auspícios da Universidade de Stanford).5

Essa solução funciona quando a fonte dos documentos não é a Internet. A coleta de material digital é muito mais complicada, particularmente se online. Todo conteúdo que exija qualquer tipo de dado de identificação dos usuários permanece assim fora do alcance para as instituições preservadoras, uma vez que estas não são tem autorização para acessar esses dados.

As mudanças de software e o uso/desuso de novos formatos criam novos obstáculos. Muitos dos objetos digitais produzidos apenas são executáveis nos

5

(29)

28

softwares que os geraram. Para tanto, o processo de emulação de software – basicamente “enganar” um programa por modificações de software ou hardware permitem ao sistema aceitar tais dados, imitando os mesmos dados, para assim executar os mesmos programas e alcançar os mesmos resultados que o sistema imitado alcançaria.

Convém também ressaltar as questões que marcos regulatórios como o do direito autoral suscitam (de uso e exploração pecuniária das obras, tempo de embargo, etc), e estas são ainda mais difíceis de superar do que os aspectos técnicos. Arquivistas, bibliotecários, museólogos, cientistas da computação etc. que tentem, por exemplo, contornar o Digital Rights Management (DRM) software para protegê-los contra pirataria embutido em programas, livros, músicas e jogos na tentativa de disponibilizar conteúdo a todo custo, acabam por infringir a lei.

As restrições se tornarão ainda mais fortes com a evolução dos sistemas. Ao contrário da Internet, o ambiente móvel (mobile), formado pelos smartphones e tablets, é muito menos aberto e passível de cópias. A proteção feroz dos produtos feitos pelas empresas põe em risco a preservação dos artefatos digitais contemporâneos, ou seja, eles podem nunca ser arquivados. É o caso dos aplicativos de celulares.

Apesar dos pesares, as bibliotecas nacionais do mundo todo têm tentado conservar alguns aspectos da herança nacional digital. A Biblioteca do Congresso começou o seu programa no ano 2000 e arquiva Websites de domínio governamental6 – isentos de direitos autorais. Não se pode dizer o mesmo de sites privados.

A iniciativa mais conhecida vai pelo caminho oposto ao escolhido pelas Bibliotecas Nacionais. Criado em 1996 por Brewster Kahle, o Internet Archive7 é organização sem fins lucrativos fundada para construir uma biblioteca digital da

6

Web Archiving. URL: http://www.loc.gov/Webarchiving/

7

(30)

Internet, isso segundo palavras do seu próprio site, bem como lar do Wayback Machine8 que armazena as versões de bilhões de sites em datas passadas.

Os conceitos de "curadoria" digital começaram a aparecer depois que a preservação digital e os seus desafios e limitações eram conhecidas e a Internet como meio global para comunicação e divulgação da informação (inclusive a científica) já estava consolidada.

A curadoria digital evoluiu das noções de preservação digital e da necessidade da informação ser divulgada em meio aberto, principalmente a informação científica produzida em rede e de forma distribuída.

A necessidade de disponibilizar os resultados de pesquisa científicas na Web acabou por levar a iniciativas de arquivamento financiadas por governos (NATIONAL SCIENCE FOUNDATION, 2003). Assim, os serviços de curadoria seriam a resultante da criação dessas iniciativas de arquivamento, uma vez que com a adesão a esse tipo de iniciativa, pudesse de construir a base de um sistema distribuído de arquivamento e preservação de dados.

De acordo com Márdero Arellano (2008, p. 33)

a principal meta de quem deseja fazer com que os documentos da ciência consigam permanecer no tempo é colocar os conteúdos com lugares de algum tipo de garantia de acesso a longo prazo. Essa premissa é mais urgente no caso das versões eletrônicas da chamada ciência eletrônica (e-science).

Segundo Márdero Arellano (2008, p. 33) a e-science9 “tem como meta aproveitar a rapidez das redes computacionais permitindo o uso de laboratórios

8

Wayback machine. URL: http://Web.archive.org/

9

Primeiramente cunhado em 2000 por John Taylor, então diretor geral do Conselho do National e-science Center, o conceito de E-Science está em franco desenvolvimento. Isso pode ser indicado pela diversidade dos termos e significados encontrados para designá-la defini-la. Os termos E-Ciência, ciência eletrônica, ciência digital e ciência orientada a dados, ciberinfraestrutura, computação fortemente orientada a dados, quarto paradigma, ciência orientada por dados, web

Science etc. Todas essas expressões foram utilizadas para designar o fazer científico reordenado

pela intensificação do uso de redes e de computadores e pelo uso sem precedentes de conjuntos de dados distribuídos tendo como premissa básica a colaboração global entre áreas fundamentais

(31)

30

virtuais, novos métodos de trabalho colaborativo em rede para permitir o avanço da ciência. As atividades relacionadas com a ciência eletrônica requerem um gerenciamento digital de entrada e saída de dados via simulação de testes e grande volume de informações sendo distribuídas e usadas massivamente”.

Na realidade da ciência in silico10, a questão da preservação de dados é ainda mais sensível já que a sua perda significa que seu uso e reuso pela comunidade científica é impedido.

Em 2000, Chilvers (2000, p. 294) apontava para a necessidade urgente de reavaliar as práticas de gestão em curso para desenvolver uma abordagem consistente para a preservação a longo prazo de dados digitais.

"Curadoria" tem uma abordagem "vida inteira" para materiais digitais para abordar a seleção, manutenção, coleta e o arquivamento de ativos digitais, além de sua preservação. É um conceito útil para descrever a visão evolutiva de todo o ciclo de vida da preservação digital, mas concentra-se em atividades que alicerçam a construção e gestão de coleções de ativos digitais. Assim, a curadoria digital de sucesso virá atenuar a obsolescência digital, mantendo a informação confiável, acessível aos usuários por tempo indeterminado.

Neste contexto, considerando as condições impostas pela criação da Internet como fenômeno orientador do comportamento humano na produção, disseminação e preservação do conhecimento para o acesso futuro. Considerando também o volume e a riqueza de formatos resultantes da diversidade da produção científica que exigem bastantes esforços para contemplar os recursos multimídia resultantes e também as limitações apresentadas na preservação digital, a presente pesquisa pretendeu trazer uma perspectiva sobre a curadoria digital como prática para preservação de objetos

da ciência, permitindo a geração, análise, compartilhamento e discussões de insights e resultados

obtidos em experimentos.

10 Expressão usada no âmbito da simulação computacional e áreas correlatas para indicar algo ocorrido "em ou através de uma simulação computacional". A frase foi cunhada em 1989, como uma analogia com as frases latinas in vivo, in vitro, e in situ, comumente usados na Biologia.

(32)

digitais que contemplem seus ciclos de vida, intencionando garantia de acesso futuro para esses ativos digitais.

1.3 Problema

A informação11 é matéria-prima durante todo o ciclo de geração de novas informações (criação, disseminação, preservação, recuperação) tendo em vista as pessoas que farão uso ou darão aplicabilidade à informação ela assume uma característica sócio-científica muito particular. Talvez porque a informação seja a única commodity12 que, quando compartilhada em ambientes propícios, se multiplica. Contudo, ao se voltar o foco para o futuro do compartilhamento, fica claro que informação alicerça o conhecimento, desde o seu ciclo de criação até à disseminação.

A informação, entretanto, apenas torna-se conhecimento13 quando as pessoas c, seja solucionando questões científicas mais elaboradas. Manter as características únicas das informações no momento de sua criação ao longo do tempo,

11 Para Le Coadic (p. 4, 2004) “a informação é um conhecimento inscrito (registrado em forma

inscrita (impressa ou digital), oral ou audiovisual, em um suporte”. O termo informação é utilizado nesta pesquisa, pois o interesse da curadoria e da preservação é a manutenção da informação registrada.

12

Commodities são mercadorias em estado bruto ou produtos primários, básicos, com grande importância comercial. No século XX, a informação passou a ser considerada um recurso econômico assim como o trabalho e ou o capital, uma vez que a posse, manipulação e o uso da informação podem aumentar o custo-efetividade de muitos processos físicos e cognitivos. Como recurso individual e social, a informação tem algumas características interessantes que a separam da noção tradicional de recursos econômicos. Ao contrário de outros recursos, a informação é expansiva, com limite aparentemente imposto apenas pelo tempo e pela capacidade cognitiva humana. Sua expansividade é atribuível ao seguinte: (1) ela é naturalmente difusa; (2) se reproduz em vez de ser consumida pelo uso; (3) pode ser apenas compartilhada, não consumida nas transações. Entendida como bem econômico para o setor de serviços de informação, aproveitando suas propriedades e com base na percepção de sua utilidade e seu valor individual e social, este setor fornece uma ampla gama de produtos e serviço de informação (ENCYCLOPAEDIA BRITANNICA, 2014).

13 A definição de Setzer (1999) de que “conhecimento é uma abstração interior, pessoal, de alguma

coisa que foi experimentada por alguém [...] não pode nem ser inserido em um computador por meio de uma representação, pois senão foi reduzido a uma informação [...]Associamos informação à semântica. Conhecimento está associado com pragmática, isto é, relaciona-se com alguma coisa existente no "mundo real" do qual temos uma experiência direta. (De novo, assumimos aqui um entendimento intuitivo do termo ‘mundo real’)” vem ao encontro da ideia de que conhecimento é experiência individual baseada na validação que a informação oferece, e portanto, se apresenta quando aplicada à atividades práticas como a solução de problemas.

(33)

32

lhes a confiabilidade, integridade e originalidade e acesso constitui o desafio maior da preservação digital.

A desorganização na guarda de ativos digitais, interfere negativamente na permanência dos objetos digitais através do tempo, pois há o perigo da destruição inadvertida de dados. Em caminho contrário ao dos textos impressos, o texto eletrônico está sujeito à “destruição tanto do meio físico nos quais existem e o conteúdo intelectual de suas informações” (LAZINGER; TIBBO, 2001, p. 6).

A maleabilidade da informação em meio eletrônico se opõe à rigidez da informação impressa e impõe a necessidade de documentar a pesquisa científica de modo confiável. Neil Beagrie e Daniel Greenstein, já em 1998, enfatizaram que o meio é um risco inerente da informação digital comparado com a mídia impressa tradicional. Outro ponto importante que justifica a preservação digital como prioritária é que parte da herança científica e cultural pode se desintegrar com a obsolescência dos suportes e dos formatos.

Há que se considerar a corrupção não autorizada e intencional dos dados. A informação tem que ser isenta de manipulação leviana para alcançar interesses próprios. Prevenir a modificação da informação para atender conveniências particulares é preocupação da preservação digital, uma vez que a “sociedade e os autores de documentos eletrônicos precisam de proteção contra tais práticas” (LAZINGER; TIBBO, 2001, p. 7).

Os produtos nascidos digitais não podem ser apenas copiados ad infinitum. Além disso, alguns são protegidos contra a cópia. Os ativos informacionais podem ser criptografados e isso implica em softwares autenticadores das licenças de uso. Se o software autenticador por qualquer motivo passar a não estar disponível consequentemente o arquivo se torna inútil. Seria o mesmo que queimar todos os livros nas bibliotecas de editoras que faliram como Crawford (1999, p. 49) quer demonstrar com a pergunta retórica:

(34)

Existe alguma grande biblioteca que não tenha livros em suas prateleiras de editoras que saíram dos negócios? Você já foi obrigado a destruir livros porque a editora faliu? É assim que funciona com criptografia: sem Editor/distribuidor, sem conteúdo. (tradução nossa)

Nesses casos não se aplica a máxima de apenas transferir os documentos para formatos mais recentes ou mídias mais atuais, mantendo os softwares que interpretam esses bits e o hardware que suporte os softwares necessários à decodificação desses objetos na tela do computador.

Na realidade dinâmica dos ativos digitais produzidos em massa vale ressaltar a necessidade de reflexão sobre a sua disponibilidade e acessibilidade no futuro. A multimídia é o campo preocupado com a integração controlada por computador de textos, gráficos, desenhos, imagens fixas e em movimento (vídeo), animação, áudio. Os recursos multimídia são compostos por texto, gráfico, vídeo, áudio e animação (elementos estáticos e dinâmicos) e quaisquer outros meios de comunicação onde cada tipo de informação pode ser representado, armazenado, transmitido e processado digitalmente. De modo conciso, os objetos multimídia representam em si a convergência de texto, imagens, vídeo e som em um formato único. A interatividade (linear e não linear) é uma das características chave de multimídia. O poder de multimídia e da Internet reside na maneira pela qual a informação é vinculada de várias maneiras em uma mesma “peça” de informação apresentada em meio eletrônico.

A dificuldade fundamental da preservação digital advém da natureza dos próprios objetos que busca preservar (THOMAZ; SOARES, 2004). Os objetos digitais são acessíveis somente por meio de combinações específicas de componentes de hardware, software, mídia e recursos humanos qualificados. Suporte, conteúdo e forma são indissoluvelmente ligados. Rápida obsolescência de grandes volumes de dados digitais é comumente referida como o problema da preservação digital (FLOURIS; MEGHINI, 2007, n. p.)

Considerando que as características singulares da informação em meio digital suscitam a necessidade de observação dos métodos utilizados em sua preservação. O

(35)

34

que motivou esta pesquisa foi aclarar o conceito de curadoria digital como abordagem para gestão da informação digital considerando a sua natureza multidimensional e a sua preservação a longo prazo para o acesso futuro.

A curadoria digital figura como tema de análise e reflexão deste projeto, uma vez que ela se apresenta como uma abordagem mais ampla para a gestão e preservação de ativos digitais.

A curadoria digital envolve a manutenção, preservação e agregação de valor aos dados de pesquisa digital em todo o seu ciclo de vida. Beagrie (2006) em artigo inaugural do Journal of Digital Curation, intitulado Digital curation for science, digital libraries, and individuals, apresenta uma definição e breve histórico da criação do termo e conceitos relacionados.

Todavia, as noções vindouras do Digital Data Curation Task Force Report of the Task Force Strategy Discussion Day14, tais definições precedem a de Curadoria digital em si, o foco desse relatório é a noção de “curadoria” antes de tudo. É importante ressaltar também que ele seria um dos recursos fundadores do que viria a ser o Digital Curation Centre, em março de 2004. Giaretta (agosto 2004) no white paper15 DCC Approach to Digital Curation, apresenta uma abordagem ampla do que seria a curadoria. Em suas próprias palavras:

curadoria digital: cuidar e de alguma forma ‘agregar valor’ aos dados digitais. Isso provavelmente implica a criação de novos dados a partir dos existentes, a fim de torná-los mais úteis e adequados à finalidade (GIARETTA, 2004, não paginado, tradução nossa)

14

Evento ocorrido em Londres, em 26 de novembro de 2002, no Centre Point, London WC1. O relatório foi preparado por Alison Macdonald e Philip Lord. A força-tarefa de iniciativa do Professor Tony Hey, presidente do JCSR (the Joint Information Systems Committee’s Committee for the Support of Research) visava “trabalhar” na definição e estruturação de uma estratégia para a "Curadoria" de dados primários de pesquisa no Reino Unido.

15

White paper: um relatório oficial ou guia que ajuda os leitores a entender um problema, resolver

um problema ou tomar uma decisão. White papers são usados em duas esferas principais: Governo e marketing B2B (Business to Business).

(36)

Segundo o Digital Curation Centre (2012), em definição apresentada em sua homepage, a curadoria é importante, pois:

A gestão ativa de dados de pesquisa reduz ameaças ao seu valor de pesquisa de longo prazo e reduz o risco de obsolescência digital. Enquanto isso, os dados de curadoria em repositórios digitais confiáveis podem ser compartilhados entre a comunidade de pesquisa do Reino Unido. Bem como reduzir a duplicação de esforços na criação de dados de pesquisa, a curadoria aumenta o valor de longo prazo dos dados existentes, tornando-a disponível ptornando-artornando-a pesquistornando-a de qutornando-alidtornando-ade mtornando-ais tornando-alttornando-a. (DIGITAL CURATION CENTRE, 2012, tradução nossa)

Abbott (2008) afirma que “curadoria digital é a gestão e preservação dos dados digitais a longo prazo”. Todavia, as atividades pertinentes desde o planejamento de criação, práticas de digitalização e documentação asseguram a sua disponibilidade e adequação para a descoberta e reutilização no futuro, constituindo assim parte da curadoria digital. Assim, digitalizadores, criadores de metadados, financiadores, políticos e gestores de bibliotecas digitais para citar alguns exemplos são todos os profissionais da informação envolvidos no ciclo de vida de documentos do seu início ao fim, tendo, portanto espaço de trabalho.

Ross Harvey (2010, p. 8) no seu livro introdutório sobre o tema. Harvey entende que a curadoria digital “aborda toda a gama de processos aplicados a objetos digitais ao longo do seu ciclo de vida”. Por conseguinte, a nosso ver, essa acepção se trata de conceito mais inclusivo do que o arquivamento digital e a preservação digital. O trabalho começa com o estabelecimento de padrões para conjuntos de dados (planejamento prévio ao estabelecimento dos objetos digitais), adição de valor (descrição e representação do conteúdo por metadados ou anotações), gestão de risco e boas práticas em gestão de dados digitais. Harvey (2010, p. 8) define o conceito com maior completude uma vez que engloba a curadoria voltada para além dos dados de pesquisa e engloba dados de natureza variada e com propósitos distintos, diferente da definição do DCC:

A curadoria digital diz respeito à gestão ativa de dados durante o tempo que ele continua a ser acadêmico, científico, de pesquisa, de administração e/ ou de interesse pessoal com os objetivos de apoiar sua reprodutibilidade, reutilização e agregando valor a esses dados, gerenciando-os do momento de

(37)

36

sua criação até que eles sejam determinados como não úteis e garantindo a sua acessibilidade a longo prazo, assim como a sua preservação, autenticidade e integridade. (HARVEY, 2010, p. 8, tradução nossa)

Para o desenvolvimento desta pesquisa, algumas definições se fazem necessárias. De início, tomamos de empréstimo concepção popperiana16 de que o estado da ciência é sempre variável, assim como a verdade é inalcançável; ela é apenas uma aproximação feita pelas ciências por meio das teorias (refutáveis por observações negativas).

Conhecer as possíveis acepções de um conceito ajudar a desobstruir os avanços necessários à sua consolidação como abordagem, modelo ou teoria. Assim que, a partir do que foi apresentado como preservação e das definições até então encontradas do que seria curadoria digital, o problema da pesquisa é:

É perceptível que as definições de curadoria digital estão em desenvolvimento e que há certo consenso em torno de sua acepção. Contudo, é possível afirmar que o conceito de curadoria digital limita-se à gestão para preservação da informação ao longo do seu ciclo de vida sem conhecer que outras acepções o termo possa ter?

Este trabalho valeu-se do modelo descritivo para esboçar um quadro conceitual do estado atual da produção bibliográfica sobre curadoria digital. Trata-se, portanto, da observação orientada e seletiva para criação de um enriquecido quadro de referências conceituais sobre o tema a partir do levantamento da produção intelectual do tema para, no fim, apresentar uma definição mais completa do conceito.

16

Karl Popper (1902-1994) desenvolveu trabalhos em filosofia da ciência, especialmente sobre a falseabilidade de teorias (possibilidade de refutação constante). Contudo, já se sabe que a teoria proposta por este filósofo trata dos graus de confiança ao objeto passível do crivo científico. Esse ceticismo epistemológico sugere a constante vigilância sobre a validade do que é proposto como indubitavelmente correto pelo método científico por meio do constante questionamento dos fatos e dos resultados que tais fatos conjugam.

(38)

Para tanto, o marco temporal para análise do tema proposto, o estado atual da produção intelectual sobre curadoria digital pode ser definido como o status ou condição hodierna do que é produzido sobre o tema.

Observa-se, pela recente emergência do tema como tema de pesquisa na área da Ciência da Informação, a dificuldade de consolidar uma base teórica comum que apoie o entendimento do assunto, o que leva à proposição da questão de pesquisa que orienta este trabalho..

1.4 Objetivos

O Objetivo geral (OG) é:

Identificar o estado atual do conceito de curadoria digital. Os Objetivos específicos (OE) são:

OE1: Delinear a produção bibliográfica sobre Curadoria digital nos últimos treze anos (2000-2013);

OE2: Identificar as definições da curadoria digital;

1.5 Justificativa

O cientista da informação se depara atualmente com os materiais denominados nascidos digitais (born digital), como apontado no artigo Preserving the memory of the world in perpetuity (IFLA, 2002). A atual situação do que é produzido em formato digital ou eletrônico provoca preocupação quanto à sua preservação antes de tudo pelo esforço que demanda preservá-lo, mantendo-o fidedigno às suas características quando do momento da sua criação, seja pelo formato, tipo ou pela matéria substantiva que o singulariza como produto da experiência humana.

A preservação da informação tem muito a ver com o desenvolvimento da linguagem gráfica, apesar de sua criação estar relacionada de modo mais intenso à

(39)

38

necessidade humana de se comunicar. Criada de modo simultâneo em várias partes do mundo, a escrita ou grafia foi desenvolvida dentro da sociedade humana a fim de registrar dados em um suporte. Na busca da representação exata da linguagem falada, sinais gráficos foram estabelecidos para transmitir através do tempo e espaço, transmitindo mensagens que se manteriam inalteradas. Contudo, para que tal missão fosse bem sucedida, o suporte era e é necessário. O material onde os signos seriam registrados, portanto, tem função assaz importante dentro do processo de comunicação da história da humanidade através do tempo.

Outro ponto relevante para a preservação de documentos relaciona-se com a transmissão e preservação da memória coletiva. Pollak (1992, p. 211) define memória como fenômeno individual, construído coletivamente e sujeito a mudanças constantes, consolidando-se no espaço, no objeto, na imagem, no suporte. Segundo Barros e Neves (2009, p. 58) “a memória se apresenta como uma questão necessária na sociedade da informação, visto que atua como representação de fragmentos que mantêm uma coletividade e que permitem a edificação e a legitimação de uma identidade social”.

Ainda sob a perspectiva de Barros e Neves (2009), se pode afirmar também que a memória consubstancia-se nas informações que não foram afetadas pelo lapso de tempo que sofreram, desde sua criação até a sua descoberta, e que podem ser referenciadas. A referenciação das informações é feita através dos espaços que habitam e das relações construídas nesses lugares, denominados lugares de memória. Os lugares de memória são de interesse no caso dos documentos preservados e dos lugares onde eles estão contidos.

A agonia pelo futuro está ainda em voga, voltada para a necessidade de preservar as peças de informação para que os elos de memória possam ser estabelecidos em momentos vindouros, sem que a reconstrução do passado representado seja distorcida. A preservação como missão central de lugares de memória como bibliotecas, arquivos e museus atende a uma necessidade social e atenta também para a manutenção da memória coletiva, ademais expressa a consciência do perigo de se interpretar o passado sem prova documental.

(40)

As bibliotecas e arquivo têm a função reconhecida de preservação da memória social; assim essas instituições devem ser apontadas como razões significativa para se garantir que a informação esteja disponível para uso e reuso futuro, uma vez que a memória social está mais e mais em forma digital.

No passado, placas de argila, pergaminhos, papiros, iluminuras, pinturas, filmes, discos, partituras, livros, periódicos, microfichas, disquetes, CD-ROM etc. eram os principais testemunhos materiais da produção intelectual humana. A materialidade de todos esses suportes oferecia certa segurança sobre sua preservação e, portanto, sobre seu acesso e uso futuro. Nos dias atuais, todavia, essa certeza não pode ser provada como factível.

O foco da preservação tradicional tem sido o suporte em que a informação está registrada. A realidade que se impõe contraria essa corrente e exige que o foco seja voltado à manutenção do conteúdo íntegro, original e, antes de tudo, acessível.

A expectativa de vida da mídia digital é muito pequena quando comparada com materiais impressos. Os recursos online se extinguem amiúde; o uso da informação digital requer equipamentos de reprodução compatíveis com o formato dos arquivos, mídia de gravação, hardware ou software de aplicação. Todos eles estão sempre sujeitos à obsolescência. É fácil falsificar a informação, entretanto é difícil assegurar cópias confiáveis e corretas.

Seria então a preservação digital uma bomba prestes a estourar? Ainda não é possível responder a esta pergunta, mas é fácil perceber que preservar envolve planejamento cauteloso e muitas vezes dispendioso. Hedstrom, parafraseando O’Toole, apresenta uma definição interessante do que seria preservação digital (HEDSTROM apud O’TOOLE17, 1998, p. 190, tradução nossa):

Eu defino preservação digital como o planejamento, alocação de recursos e aplicação de métodos de preservação e tecnologias necessárias para assegurar que a informação digital de valor contínuo permaneça acessível e utilizável. Eu uso intencionalmente o termo "contínuo" em vez de valor

(41)

40

"permanente" para evitar tanto o absolutismo e quanto o idealismo que o termo "permanente" implica. (tradução nossa)

A preservação digital é gestão ativa de informação digital através do tempo para assegurar sua acessibilidade. Ela pode ser definida como o armazenamento a longo prazo de informação com o intento de recuperação e interpretação por todo período em que ela seja requerida. Para tanto, custódia18, integridade do item original, descrição, disponibilização e acesso têm de ser contemplados quando do momento a criação de uma política de ação preservadora.

Eis que entra em voga, uma abordagem que vai para além da costumaz visão de preservação digital. A curadoria digital é derivada da evolução de termos já utilizados com acepção semelhante no jargão corrente de profissionais da informação e cientistas.

“Curadoria digital” é conceito relativamente novo e incorpora aspectos dos termos “curadoria de dados” e “preservação digital” usados respectivamente pela comunidade cientifica e de bibliotecas eletrônicas ou digitais.

Pennock (2007, p. 1) define “curadoria digital, amplamente interpretada, versa sobre a manutenção e agregação de valor a um corpo confiável de informações digitais para o uso corrente e futuro”. A autora também afirma que “em outras palavras, é a gestão ativa e avaliação da informação digital ao longo de todo seu ciclo de vida”.

Já o Digital Curation Centre (2012) define a curadoria digital como “a seleção, preservação, manutenção, coleção e arquivamento de conjuntos digitais”. Curadoria digital também é o processo de estabelecimento e desenvolvimento de repositórios de conjuntos digitais para referência corrente e futura para pesquisadores, cientistas, historiadores e estudiosos em geral.

18

Tomando como definição de custódia a oferecida pelo Dicionário Brasileiro de Terminologia

Arquivística; é a responsabilidade jurídica de guarda e proteção de arquivos, independentemente

de vínculo de propriedade (p. 62). Todavia, é necessário entender que os locais que custodia fisicamente documentos eletrônicos são servidores em unidades de informação em geral, o que transcende a custódia arquivística apresentada de início.

Imagem

Figura 1 - Definições de Biblioteca Digital ________________________________________________ 44 Figura 2 - Esquema conceitual OAIS  ______________________________________________________ 58 Figura 3 - Modelo simplificado do JISC para ambiente da informação
Tabela 1 - Desenho do instrumento de pesquisa _________________________________________ 79 Tabela 2 - Número de registros das bases de dados pesquisadas ______________________ 86 Tabela 3 - Amostra representativa da pesquisa _______________________________
Figura 2 - Esquema conceitual OAIS
Figura 3 - Modelo simplificado do JISC para ambiente da informação
+7

Referências

Documentos relacionados