• Nenhum resultado encontrado

Réaliser un plan de gestion de données “ FAIR ” : modèle

N/A
N/A
Protected

Academic year: 2024

Share "Réaliser un plan de gestion de données “ FAIR ” : modèle"

Copied!
34
0
0

Texto

Les données de recherche sont des informations, des échantillons et des matériaux produits, collectés et documentés. Principes et lignes directrices de l'OCDE pour l'accès aux données de recherche financées par des fonds publics (2007). Les bénéficiaires s'engagent ainsi à respecter l'article « 29.2-Libre accès aux publications scientifiques » de la convention de subvention12.

Le schéma ci-dessous montre le libre accès aux publications et aux données de recherche dans le cadre de la diffusion et de l’exploitation des résultats24.

Contexte, acteurs et ressources

Qui est responsable du traitement des données et de la mise à jour du DMP pendant le projet. Nécessite une gestion des données pendant le projet (de la production à la distribution) l'acquisition ou l'installation de matériel spécifique (serveurs, machines virtuelles, infrastructures, etc.). La gestion des données pendant le projet (de la production à la distribution) nécessite-t-elle du recrutement ou des actions de formation ciblées ?

Quels sont les méthodes et processus de production de données utilisés au cours du projet. Comment la propriété des données produites et collectées au cours du projet est-elle déterminée entre les différents partenaires ? Préciser le type et la nature des données à produire au cours du projet.

Quels seront les emplacements et les méthodes de stockage et d’hébergement des données du projet. Comment l’accès et l’échange de données entre partenaires seront-ils gérés pendant le projet ? Quelles sont les méthodes de distribution prévues pour diffuser les données et les ensembles de données ?

Description du projet

Acteurs du projet

Ressources nécessaires

Stockage, partage, protection et diffusion au cours du projet

Quels seront les principaux formats de production, de traitement ou de conversion des données utilisés au cours du projet et les outils et logiciels de lecture associés ? Préciser les règles de dénomination et de classification des informations et données produites dans les espaces de partage de projets. Quelles modalités d'archivage et garanties sont prévues pour vos données en fin de projet (plateformes, partenaires, durée de conservation, etc.).

Indiquez les raisons pour lesquelles certains ensembles de données (précisez lesquels) pourraient ne pas être divulgués. Titre du jeu de données - ID du jeu de données - Auteurs et contributeurs - Éditeur (institution). Nature ou type des données - Format et aides à la lecture associées - Normes et formats des métadonnées.

Veuillez indiquer ici le nombre de personnes (temps plein) et le type de compétences dédiées (archives, informatique, matériel documentaire, gestion des données, etc.) et/ou le type de formation souhaité. Le coût du stockage et du traitement des données doit également être pris en compte dans cette évaluation. Il faut penser non seulement au stockage, mais aussi aux services associés (entrée et sortie des données, maintenance, fréquence d'accès, sécurité, etc.), qui peuvent représenter des coûts cachés importants.

La publication et la diffusion des données peuvent avoir un coût : maintenance d'une base de données, création d'un site internet, frais de publication (ou frais de traitement des articles - APC) pour les documents de données, frais de données supplémentaires pour un article, etc. Couverture des besoins financiers En fonction du bailleur de fonds ou programme de financement, les coûts associés à l’ouverture des données peuvent être éligibles dans les conditions précisées dans l’accord de financement.

Informations générales sur les données

Toutes les données et tous les formats n’ont pas vocation à être stockés (tout dépend de la nature et de la valeur des données en termes de validation des résultats), mais il est important de pouvoir retracer leur parcours. Afin d'assurer la disponibilité et la réutilisation des données dans la durée et par le plus grand nombre, il est fortement recommandé de privilégier les formats et logiciels libres de droits (open source), notamment pour la diffusion ou l'archivage des données. données. A défaut, le recours à des formats standards ou largement documentés et à des outils partagés au sein de la communauté faciliteront le partage et la réutilisation des données entre chercheurs du domaine.

Liens et outils : pour que les données puissent être réutilisées dans la durée, choisissez des formats durables : https://www.cines.fr/archivage/des-expertises/les-formats-de-fichier/ ; Pensez également à assurer la pérennité des logiciels utilisés pour produire les données, notamment pour les recherches menées sur le long terme. Il existe des plans de gestion de logiciels pour vous aider : https://www.software.ac.uk/resources/guides/software-management-plans Un exemple de projet de recherche sur le sujet : https://succes2017.sciencesconf.org/ data/poster_SUCCES2017_PRESOFT .pdf. Pour assurer l’interopérabilité et la réutilisation des données, il est important de documenter soigneusement les données produites tout au long de leur cycle de vie (métadonnées descriptives, métadonnées de gestion, métadonnées d’archivage, etc.).

Il existe des formats de métadonnées très génériques pour qualifier les objets numériques (Dublin Core, DataCite Metadata Schema), mais de nombreuses disciplines ont progressivement développé leurs propres standards de métadonnées qui répondent mieux aux besoins spécifiques de leurs communautés en termes de partage d'informations : Climat et métadonnées de prévision pour le climat données, Ecological Metadata Language (EML) en écologie, DICOM pour l’imagerie médicale ou encore International Standard Bibliographic Description (ISBD) pour les données bibliographiques. Une norme de métadonnées peut ensuite être traduite en un ou plusieurs formats de données. Liens et outils : référentiel de métadonnées disciplinaires du UK Digital Curation Centre : http://www.dcc.ac.uk/resources/metadata-standards ; Répertoire des normes de métadonnées des sciences de la vie BioSharing : https://biosharing.org/standards/exchange_format.

Stockage et partage des données au cours du projet

Dans les projets collaboratifs, il est souvent nécessaire de mettre en place des espaces de partage de données ou de fichiers. En l’absence d’application de gestion électronique de documents (GED) ou de base de données structurée et administrée, il est recommandé d’adopter des conventions de dénomination communes pour un partage compréhensible des fichiers entre partenaires. Des métadonnées supplémentaires peuvent également enrichir les propriétés du document en plus des règles de dénomination.

Risques, sécurité et éthique des données

L'application de mesures de sécurité spécifiques peut concerner un large éventail de données considérées comme sensibles en termes de protection de la vie privée, d'intérêts commerciaux ou encore d'éléments liés aux activités militaires ou de défense. Ce champ vise à détailler la manière dont la protection des données sera mise en œuvre. Il doit indiquer les mesures envisagées pour assurer la sécurité des données compte tenu des risques identifiés.

En termes de disponibilité des données : garantir le fonctionnement des outils de continuité d’accès des équipes. En termes d’intégrité des données : rendre disponibles des données de qualité dans les délais et espaces programmés. En termes de confidentialité : assurer un niveau satisfaisant d’accès et de stockage des données sensibles.

Selon la norme ISO 7498-2 (ISO90), la confidentialité est la propriété d'informations qui ne sont pas disponibles ou divulguées à des personnes, entités ou processus non autorisés. En vertu du droit européen, tous les responsables du traitement ou sous-traitants doivent veiller au maintien de la confidentialité des données.

Dissémination et archivage des données

Dissémination et archivage à l’issue du projet

Ce guide est destiné à vous accompagner dans la rédaction de cette sortie et constitue un « pense-bête » sur tous les aspects de la gestion de vos données, de leur production à leur archivage. Liens et outils : European IPR Helpdesk : Projet de la Commission européenne visant à conseiller les projets financés dans le cadre d'Horizon 2020, ce site contient de nombreuses ressources sur les questions de propriété intellectuelle (documentation, formation, services d'assistance) : https://www.iprhelpdesk.eu/ ; Lignes directrices pour la rédaction d'un accord de consortium : ce document contient des lignes directrices pour la rédaction d'un accord de consortium ; Modèle d'accord de consortium DESCA 2020 : Ce site Web fournit un modèle pour la préparation d'un accord de consortium : http://www.desca-2020.eu/. Ce champ précise les types de données qui seront produites ou utilisées dans le cadre du projet : données d'enquête, échantillons, code de programme, corpus de textes, photographies, etc.

Cela permet également d’envisager la recherche d’autres types de données similaires susceptibles d’être utilisées comme matériaux complémentaires dans le projet.

Identification des jeux de données

L'archivage doit être prévu dès le début du projet : la stabilité des formats sélectionnés, l'ordre des données, la plateforme d'archivage choisie. Pour en savoir plus sur la notion d'archivage permanent : https://www.cines.fr/archivage/un-concept-des-problematiques/le-concept-darchivage-numerique-perenne/.

Protection – exception de diffusion

Le format des données est souvent un paramètre déterminant lors du choix de la plateforme de distribution et de la licence associée. Le format et les outils de lecture associés sont également des informations nécessaires dans le cadre de l'archivage et de la réutilisation des données pour assurer la capacité de lecture des futurs utilisateurs et la préservation des données dans le temps (anticipation de l'obsolescence des formats). Si le choix de répartition des jeux de données ne prend pas en compte le cycle de vie des données (données brutes, données dérivées, données publiées), il est important de préciser les formats et les outils de production et de lecture qui seront utilisés avec chaque donnée du projet dans la production. phase d’appartenance.

En l'absence de norme disciplinaire identifiée pour la gestion et la description des données ou pour la diffusion des jeux de données, il reste possible : 1/ d'utiliser des formats de métadonnées génériques utilisés pour la description des objets numériques : DublinCore, METS, DataCite Metadata Schema, etc. . . Précisez ce qui a été réellement réalisé par rapport à ce qui était prévu dans le champ « Modalités de diffusion envisagée des données » du chapitre 6 : dans quel entrepôt les données ont été stockées. L'embargo est une protection temporaire qui permet de reporter à une date ultérieure la distribution gratuite ou la réutilisation des données.

La présence de données sensibles ou la volonté de publier ou de retarder les résultats n'exclut pas nécessairement toute diffusion des données. L’embargo est plutôt présenté comme un compromis permettant de signaler l’existence des données (questions d’impact) sans mettre en péril leur exclusivité d’exploitation. La licence précise les conditions de partage et de réutilisation des données diffusées dans le cadre du projet, ainsi que toute rémunération intellectuelle ou économique qui y est associée.

Tri et archivage des données

Pour garantir l’accès, l’interopérabilité et la réutilisation la plus large possible des données, il est recommandé de privilégier les licences libres largement partagées et documentées.

Referências

Documentos relacionados