Infos Inist

Use Cases CNRS – la gestion des données de la recherche à la loupe !

Afin de progresser vers le partage des données de la recherche et s’inscrire dans la dynamique du projet recherche Data Gouv, la DDOR a formé 5 groupes mêlant chercheurs, ingénieurs de laboratoire et d’infrastructure de recherche et spécialistes de l’Information Scientifique et Technique de l’Inist.

Ces groupes correspondent à 5 thèmes scientifiques distincts, où la gestion des données de la recherche peut être questionnée : Le nucléaire, la microscopie, la chimie, les données autour de la Covid-19 et les données sur la dynamique des fluides. Ils sont invités à effectuer plusieurs réunions plénières et des travaux en sous-groupes organisée en cas pratique.

On retrouve dans chaque groupe des chercheurs leaders dans leur domaine, un directeur scientifique adjoint (DAS), 2 à 3 représentants de la DDOR et deux spécialistes des données de l’Inist. Ces derniers fonctionnent toujours en duo, une personne du service OpiDoR avec une personne du service DoRaNum. Sylvie Rousset, participent également aux discussions.

Les membres de l’Inist qui prennent part aux réunions sont : Anne Ciolek-Figiel, Yvette Lafosse, Françoise Tisserand et Coralie Wysoczynski.

Christine Hadrossek et Jean-Michel Parret coordonne les groupes. Par des réunions mensuelles avec la DDOR et son groupe données, ils font le point et s’assurent du bon déroulement  du travail des groupes et des actions à entreprendre pour en faciliter le travail. Ils consultent les DAS des instituts si besoin.

Le projet a démarré pendant le dernier trimestre 2021, et il y a déjà eu 3 réunions avec les chercheurs en Nucléaire, 3 réunions avec les chercheurs en Microscopie, 3 réunion avec les chercheurs chimistes, 2 réunions sur le Covid-19 et 2 réunions sur la dynamique de fluides.

Ces premières réunions permettent d’écouter les besoins des chercheurs et de dégager les axes de travail à venir. Il s’agit alors, pour les agents de l’Inist de dresser un programme sur-mesure pour aider chaque groupe à tendre vers les principes FAIR pour la gestion des données. En fonction des domaines scientifiques et du type de données recueillies,  les stades d’avancement des groupes diffèrent.

Ces rencontres permettent de dresser un état des lieux sur la gestion des données de la recherche. C’est l’occasion de comprendre ce qu’il se passe au plus près des chercheurs et les compte rendus peuvent servir d’outil décisionnel pour le CNRS. En outre, des actions concrètes découlent de ces réunions, comme la création de DMP personnalisé, des choix d’entrepôt, des choix de vocabulaire, de standard de métadonnées, de construction d’un SI capable de fédérer des bases de données existantes, d’laboration d’un cahier des charges pour la construction d’un nouvel entrepôt.

 

Pour aller plus loin…

Parmi les activités envisagées dans cette étude, on retrouve :

  • identifier parmi les données produites par la communauté quelles données il faudrait partager et avec quel objectif (reproductibilité des résultats, réutilisation des données…), et quelles données il n’est pas nécessaire de partager ;
  • clarifier le cycle de vie de ces données – les étapes par lesquelles elles passent à partir de leur production, et même les étapes antérieures lorsque c’est pertinent (par exemple une proposition de programme utilisant une infrastructure de recherche pour obtenir les données) ;
  • identifier les formats des données et les métadonnées – les informations décrivant les données, leur producteur, les instruments ou les logiciels utilisés… – qu’il faudrait attacher aux données pour permettre aux membres de la communauté de les comprendre, de les trouver et de les réutiliser de façon pertinente, et comment et par qui ces métadonnées seront renseignées ;
  • identifier les actions qui devraient être menées ;
  • identifier s’il y a des activités autour du partage des données de la communauté en France ou à l’étranger.