Plan de gestion des données (PGD)

Photo by Kelly Sikkema on Unsplash

A quoi sert un plan de gestion des données

Le plan de gestion des données de la recherche (PGD) ou Data Management Plan (DMP) est un document unique qui décrit, pendant et à l’issue du projet de recherche, les étapes de production, de traitement, de description, de diffusion ou protection et d’archivage (conservation) des données. Il est demandé par tous les financeurs de la recherche. Le chercheur qui coordonne le projet est généralement le rédacteur du PGD, mais il ne l’écrit pas seul : il peut solliciter les services d’appui à la recherche pour l’aider.*

Où trouver des modèles de plans de gestion des données

Le site DMP.OPIDoR mis en ligne par l’Inist permet de faire en ligne son DMP. Le chercheur peut choisir un modèle de DMP parmi tous les modèles proposés par les établissements de recherche, les financeurs. Il est également possible de télécharger le modèle en PDF ou en docx. Un des avantages de DMP OPIDoR est de permettre le travail collaboratif sur le DMP. Voir un exemple de plan de gestion de données rédigé : le projet Hospitam.*

Par quoi commencer ?

Avant de rédiger un DMP, il faut se poser quelques questions élémentaires :

  • CONSERVATION : Quelles données générées dans le cadre le projet doivent être conservées ?
  • REUTILISATION : Ces données seront-elles réutilisables, leur format est-il ouvert ?
  • OUVERTURE : Ces données pourront-elles être mises en accès libre ? Faut-il leur faire subir un traitement préalable (anonymisation)
  • DEPOT : Où va t-on archiver ces données ? Comment va t-on garantir leur accès ?

Conservation

Toutes les données produites à l’occasion d’un projet de recherche n’ont pas vocation à être conservées. On ne conserve pas en revanche les échanges administratifs ou scientifiques avec les collègues, ni les publications qui ont aidé dans le cours du travail. Toutes celles utiles pour la rédaction de l’article/thèse ou l’administration de la preuve en revanche doivent être conservées.

Documentation des données, formats ouverts

De préférence, ces données doivent être présentées dans un format ouvert pour garantir leur interopérabilité avec d’autres systèmes. Leur méthode de collecte, de sélection et de mise en forme doivent être correctement documentées.

Accessibilité

En conformité avec les principes FAIR (aussi ouverts que possibles, aussi fermé que nécessaire), on doit dissocier les données qui peuvent être accessibles à tous immédiatement, de celles qui doivent être accessibles de façon restreinte, notamment en conformité avec le Réglement Général sur la Protection des Données. L’usage de certains outils numériques permettent de trouver le meilleur compromis entre anonymisation et utilité des données récoltées.

Dépôt

Il y a plusieurs lieux de dépôts possibles pour chaque projet. Que l’on s’oriente plutôt vers des répertoires disciplinaires ou bien des vers des répertoires liés à des institutions (un répertoire national de dépôt et gestion des données est en cours de construction), il est important de vérifier que ce répertoire qu’il soit public ou privé permet bien de gérer ses données selon les principes FAIR. Un répertoire par exemple qui ne délivre pas de DOI pour chaque jeu de données déposé ne remplit pas cette condition.

Au printemps 2022, les chercheurs français pourront bénéficier d’une infrastructure nationale dans laquelle ils pourront déposer leurs données (recherche data gouv) Pour trouver des répertoires actuellement disponibles, l’annuaire Re3data.org est une ressource utile. Nous pouvons également vous orienter sur les caractéristiques souhaitables de ces entrepôts.


* Source : L. Bracco et al. Former les professionnels de l’information et de la documentation aux données de la recherche en 45 minutes, 2020 (CC-BY)