• Nenhum resultado encontrado

Repositório de dados na U.Porto

N/A
N/A
Protected

Academic year: 2021

Share "Repositório de dados na U.Porto"

Copied!
21
0
0

Texto

(1)

Repositório  de  dados  na  U.Porto    

Um  fluxo  de  curadoria  suportado   numa  extensão  ao  DSpace    

Cris:na  Ribeiro   DEI-­‐  FEUP/  INESC  TEC   João  Rocha  da  Silva   FEUP  

Eugénia  Matos  Fernandes   Reitoria  da  Universidade  do  Porto   João  Correia  Lopes   DEI-­‐  FEUP/  INESC  TEC  

(2)

Conteúdo  

•  Obje:vos  

•  Auditoria  de  dados  na  U.Porto  

•  Desenho  de  um  workflow  de  gestão  de  dados   •  Construção  de  um  protó:po  de  repositório   •  Conclusões  e  trabalhos  futuros  

(3)

Obje:vos  

•  Determinar  as  necessidades  de  gestão  de   dados  dos  inves:gadores  da  U.Porto  

•  Desenhar  e  implementar  um  repositório  de   dados  para  sa:sfazer  estas  necessidades  

•  Procurar  uma  solução  que  não  esteja  limitada   às  necessidades  de  um  só  grupo  

(4)

Objetivo Status Quo

Sa:sfazer  

obje:vos  

 

•  Representar  dados   tabulares  em   formatos  próprios   para  preservação   –  XML   •  Interrogação  online   •  Reu:lização  de   descritores  nos   metadados  

(5)

Fase  1  :  Entrevistas  

Recolha  de  dados  e   de  casos  de  uso  

Especificação  do   workflow  

Construção  da   plataforma  

(6)

Auditoria  de  dados  

•  Entrevistas  com  inves:gadores  

– Engenharia,  ciências  sociais,  educação,  ciências  da   terra,  biologia,  economia,  …    

•  Recolha  de  amostras  de  dados   •  Recolha  de  casos  de  uso  

•  Relatório  e  resultados  subme:dos  a   aprovação  dos  inves:gadores  

(7)

Os  inves:gadores  dizem  

•  …  a  gestão  de  dados  é  complexa  

•  …  a  gestão  de  dados  não  deveria  distraí-­‐los  do   seu  trabalho  

•  …  precisam  de  apoio  profissional  na  gestão  de   dados  

•  …  “o  que  ganho  em  guardar  os  meus  dados   num  repositório?  Os  discos  externos  são  tão   baratos!”  

(8)

Os  inves:gadores  dizem  

•  …  já  perderam  dados  devido  a  formatos  que   foram  abandonados  

•  …  precisam  de  sí:o  para  par:lhar  dados  com   parceiros,  em  vez  de  usarem  o  email  

•  …  precisam  de  ferramentas  para  manipulação   de  dados  online  

(9)

Preocupações  e  necessidade  dos  

inves:gadores  

•  “Os  repositórios  não  podem  ser  cemitérios    de   dados”  

•  “O  principal  obje:vo  na  preservação  de  dados   é  a  par:lha/  reu:lização/  citação”  

•  “Os  dados  têm  de  ser  bem  anotados  ou  não   podem  ser  usados  para  validar  resultados    

(10)

Fase  2  :  Modificar  o  workflow  

Recolha  de  dados  e   de  casos  de  uso  

Especificação  do   workflow  

Construção  da   plataforma  

(11)

O  Papel  do  “Curador  de  Dados”  

Dados

Curador Investigador

(12)

Reunião  de  curadoria  

Reunião

Dados Curados

(13)

Anotação  de  dados  

Silva, João Rocha

Azores GPS Run 01-01-2011 License: CC ShareAlike dc:contributor.author dc:lastModified dc:title dc:rights 38.760267493 -27.084113746 488500.999190 38.760267489 -27.084113743 488499.999191 -27.084113739 488498.999192 38.760267506 488497.999193 38.760267485 -27.084113744 -27.084113730 488496.999194 38.760267507

time.gps_sow latitude longitude

Terceira Flores Table-level metadata Data Dimensions END_METADATA -107.391006 -93.994527 -80.584969 -67.168032 -53.750371 gravity.specific Elementos    do  XML   Schema    

do  domínio  como   descritores  

(14)

Depois  da  reunião  

Dados+Metadados  em  formato  Excel  

(15)

Dados  disponíveis  

•  Explorar,  filtrar  e  descarregar  só  o  necessário  

Investigador

(16)

Fase  3  :  Construir  ferramentas  de  

suporte  ao  workflow  

Recolha  de  dados  e   de  casos  de  uso  

Especificação  do   workflow  

Construção  da   plataforma  

(17)

Módulo de dados de investigação UPData Transformação XSLT Core DSpace Tabela Dinâmica Tabela Formatada Tradutor de Interrogações Interrogação XQuery FLWOR Ficheiro Original Folha Excel correctamente preenchida 5 4 3 Documento Traduzido (XML) Página de depósito Interrogação (JSON) XML Manager Resultados (Dados + Metadados) 1 Acesso a dados Leitor XLSX 2 Investigador Curador

(18)
(19)

Fase  4  :  Testar  ferramenta  com  dados  

reais  

Recolha  de  dados  e   de  casos  de  uso  

Especificação  do   workflow  

Construção  da   plataforma  

(20)

Conclusões  e  Trabalho  Futuro  

•  Recolhemos  requisitos  e  casos  de  uso  dos   inves:gadores  da  U.Porto  

•  Casos  de  uso  mais  importantes  foram  implementados   em  repositório  DSpace  

•  U:lizadores  podem  navegar  sobre  dados  online  no   repositório  e  descarregar  subconjuntos  selecionados   •  Futuro:    

–  Validação  de  ferramentas  com  u:lizadores  

–  Métodos  mais  simples  de  interação  entre  inves:gadores  e   repositório  

(21)

Contactos  e  ligações  

Cris:na  Ribeiro   mcr@fe.up.pt  

João  Rocha  da  Silva   joaorosilva@gmail.com    

Eugénia  Matos  Fernandes   efernand@reit.up.pt    

João  Correia  Lopes     jlopes@fe.up.pt    

Repositório:  hjp://sciencedata.up.pt/  

Referências

Documentos relacionados

In the present study we seek to understand the morphology changes associated with the presence of CD4 + and CD8 + T cells in popliteal lymph node and liver and

Estes resultados apontam para melhor capacidade de estabelecimento inicial do siratro, apresentando maior velocidade de emergência e percentual de cobertura do solo até os 60

Entendendo, então, como posto acima, propõe-se, com este trabalho, primeiramente estudar a Lei de Busca e Apreensão para dá-la a conhecer da melhor forma, fazendo o mesmo com o

A variação do pH da fase móvel, utilizando uma coluna C8 e o fluxo de 1,2 mL/min, permitiu o ajuste do tempo de retenção do lupeol em aproximadamente 6,2 minutos contribuindo para

Este presente artigo é o resultado de um estudo de caso que buscou apresentar o surgimento da atividade turística dentro da favela de Paraisópolis, uma

Changes in the gut microbiota appears to be a key element in the pathogenesis of hepatic and gastrointestinal disorders, including non-alcoholic fatty liver disease, alcoholic

As principais indicações para a realização foram a suspeita de tuberculose (458 pacientes) e uso de imunobiológicos (380 pacientes).. A maior prevalência de resultado positivo

Segundo Éric Laurent, a psicose ordinária se caracteriza pela não resposta aos significantes-mestres tradicionais, manifestando o fim do poder do Nome-do-Pai como