• Nenhum resultado encontrado

2 A EVOLUÇÃO DOS DADOS NA CIÊNCIA

2.1 Dilúvio de dados e Big data

2.1.2 Ciclo de dados e gerenciamento de dados

Os elementos da ciência têm como pilares: a observação, o experimento, a teoria e a modelagem, sendo transformados pelo ciclo contínuo de geração, acesso e uso de alcance cada vez maiores de dados. Assim, um ciclo de dados determina: o nascimento, a agregação dos dados a serem substituídos com o crescimento, a análise durante sua reprodução e a exclusão dos dados, referente à sua inutilidade. O ciclo de dados representa

as fases de uso, gerenciamento e armazenamento desses dados levando em conta no primeiro processo, a criação dos dados - produção em diferentes tamanhos dependendo da aplicação e do propósito do dado - podendo compor grandes volumes de dados; o segundo processo refere-se à agregação dos dados relacionados com a semelhança ou correlação das coletas e armazenamentos, sendo distribuídos de forma centralizada; o terceiro processo é a análise dos dados gerados e agregados a fim de lidar com dois fatores: o volume e a complexidade dos tipos de dados existentes ou criados, conforme explica a Interagency

Working Group On Digital Data (2009)

Durante o ciclo de dados, vale destacar que o armazenamento e gerenciamento são fatores importante para a preservação, tendo como pilares elementares para o uso de dados: a observação, experiência, teoria e modelagem, sendo verificados as formas de acesso e uso, para um alcance e volume cada vez maior das informações disponíveis, levando em percurso que um bom gerenciamento e política desenvolvida, facilita na recuperação em caso de perda ou desconfiguração desses dados. Conforme Interagency

Working Group On Digital Data (2009), o gerenciamento efetivo de cada etapa do ciclo,

junto com coordenação entre as etapas é essencial para garantir que os dados sejam preservados e possam ter seu acesso e uso de forma confiável e eficiente. Para um bom uso de dados de pesquisa é fundamental elaborar um ciclo de vida de dados no seu processo criacional, no processo de análise de dados, bem como gerenciamento, levantando como pontos de vista as principais características para uso e desuso.

Nas palavras de Bertin, Visoli e Drucker (2017, p. 37), “[...] para alcançarem sustentabilidade e competitividade no sistema científico moderno, portanto, instituições e pesquisadores devem garantir o apropriado gerenciamento e preservação dos dados de pesquisa, de modo a possibilitar a verificação futura de resultados [...]” . Vale afirmar que os dados da pesquisa possuem tempo de vida maior que o projeto de pesquisa desenvolvido. Bertin, Visoli e Drucker (2017, p.43) afirmam que o ciclo de dados e seu gerenciamento são compostos em quatro etapas:

Implementação, Definição de parâmetros, Exploração de dados:

possibilidade de preservação de dados científicos, desenvolvimento de políticas de gerenciamentos de ciclo de dados para projetos e atividades relevantes; Ingestão de dados, Obtenção de dados: estratégias que preveem a preservação e o acesso a longo prazo e rentáveis à qualidade adequada, garantindo proteção de alta confiança e confidencialidade ;Tomada de decisão: aplicações para os requisitos legais e regulamentados para toda a gama de tipo de dados e Utilização

do modelo: recuperação dos dados de pesquisa, tendo em vista a sua

A Figura 3, a seguir, demonstra a vinculação dessas etapas, para assegurar a descrição, controle adequados dos dados a longo prazo, sendo necessários para sua coleta e preservação.

Figura 3 – Ciclo de vida dos dados

Fonte: adaptado de Bertin; Visoli e Drucker (2017), elaborado pelo autor (2019)

Amaral (2016) afirma que os dados são inseridos em processos, modelos e tecnologias desde o início da produção até o seu descarte. O sistema que permitirá que esses dados de pesquisa sejam prontamente descobertos, avaliados e usados devem estar devidamente baseados em um ciclo de dados em que estabelecem os princípios de gestão contínua e eficaz de novas tecnologias e métodos de identificação e adoção, sem pôr em

risco a preservação e o acesso. Conforme Bertin, Visoli e Drucker (2017, p. 39), a importância de se elaborar um ciclo de vida dos dados, envolvem aspectos de “planejamento, aquisição, organização, estruturação, definição de fluxos analíticos e ferramenta apropriada para o armazenamento de dados”. Além disso deve-se atentar também à questões relativas à preservação, à organização, ao compartilhamento e à proteção. Esses itens são necessários por representarem a estruturação e organização, afim de promover o uso e reuso dos dados, de forma segura e adequada.

Bugnion, Manivannan e Nicolas (2017) afirmam que o ciclo de dados facilita a boa gestão de dados quando disponibilizados em formatos como textos: MS Word; PDF; RTF, em formato numérico: Excel, em multimídia: JPEG, GIF, MPEG, etc.; em software; e quando disponibilizados em variedade de suportes: fitas, CDs, slides, modelos, mapas e arquivos de dados, etc.

O gerenciamento de dados e informações é um problema que vem sendo cada vez mais comum à medida que mais recursos computacionais são disponibilizados e mais dados são produzidos como parte de atividades colaborativas de grande escala. Uma das motivações para o gerenciamento de dados é baseada no fato de que, embora os recursos de computação são cada vez mais poderosos, eles não são, no entanto, baratos. Portanto, novas soluções para facilitar a execução de simulações devem ter dados de arquivamento, descoberta e capacidades de acesso construído desde o início (YANG; LIZHE; LASZEWSKY, 2010, p. 354, tradução nossa).

O ciclo de vida dos dados é uma ferramenta conceitual, que possibilita entender os diferentes passos que os dados seguem até o seu gerenciamento. O compartilhamento dos dados começa com uma prática de ciclo de vida dos dados e é promovido desde o planejamento até sua análise e publicação.

Portanto, ao elaborar um ciclo de vida de dados deve-se considerar a gama de informações e tipologias existentes para o desenvolvimento da pesquisa. Sendo assim, vale discutir o surgimento da ciência de dados pelos pesquisadores, que possibilitou ferramentas e técnicas para o gerenciamento de dados.

Com isso, a próxima seção apresenta uma breve história da ciência de dados e sua relação com a Ciência da Informação.

3 RELAÇÕES CONCEITUAIS ENTRE CIÊNCIA DE DADOS E CIÊNCIA DA

Documentos relacionados