Open Data et Research Data Management

Contexte

L’ouverture des données de la recherche (Open Research Data) vise à donner un accès libre aux données de recherche afin notamment d’assurer la reproductibilité des résultats scientifiques. Cependant, étant donné le caractère parfois confidentiel de certaines données, l’ouverture totale des données n’est pas toujours possible. Le FAIR data principle est alors visé ; les données doivent être aussi ouvertes que possible et fermées autant que nécessaire. Le Research Data Management (RDM) concerne l’entièreté du cycle de vie des données en abordant la planification, la collecte, la gestion, le stockage, la publication, le référencement, la pérennisation et le partage de données de recherche, ainsi que les droits d’accès et de réutilisation.

Concepts

Les données ouvertes ou Open Data sont des données en ligne, gratuites et accessibles qui peuvent être utilisées, réutilisées et distribuées grâce à une licence ouverte de type Creative Commons.
La gestion des données de recherche, ou Research Data Management (RDM) couvre l’ensemble du cycle de vie des données de recherche.
Un·e data ambassador est un chercheur ou une chercheuse qui, au sein de son entité de recherche promeut les bonnes pratiques de gestion des données de la recherche dans la discipline scientifique concernée.

Objectifs

Les objectifs suivants ont été définis dans le projet H600 Open Education et Open Science de l’UCLouvain.

  • Intégrer l’Open Data/FAIR data (RDM et stratégies de diffusion et de stockage) dans les principes et pratiques de gestion de la recherche des instituts de recherche et des secteurs.
  • En relais avec les bibliothèques, l’administration de la recherche et le service des archives,
    • sensibiliser et développer une culture de la gestion, de la préservation et du partage des données chez tous les acteurs et actrices impliqués dans la production de données de recherche;
    • mettre à disposition des chercheurs et chercheuses des cycles de formation, des conseils ainsi que des outils adaptés.
  • Développer l’infrastructure Open Data (opendata.uclouvain.be) à l’UCLouvain, en synergie avec CISM (Calcul Intensif et Stockage de Masse), l’interconnecter à l’infrastructure d’archivage (Service des Archives) ; rendre gratuite l’utilisation de l’infrastructure Open Data, sauf pour les très grands jeux de données.
  • Favoriser la visibilité des données ouvertes de l’UCLouvain (qualité des métadonnées, moteur de recherche, indexation automatique dans des répertoires nationaux et internationaux, pairage automatique à DIAL et aux journaux ouverts de ojs.uclouvain.be).
  • Proposer un support à la rédaction aux Data Management Plans ainsi qu’aux métadonnées de l’Open Data.

Résultats

Research Data Management plan

L’UCLouvain a d’abord mis l’accent sur la première étape du cycle de vie d’un projet de recherche, le Data Management Plan, document qui permet de planifier son projet de recherche sous un angle gestion des données. À cet égard, l’UCLouvain est membre du consortium DMPonline.be, qui a déployé le logiciel open source DMP afin de permettre à nos scientifiques de répondre aux conditions imposées par les bailleurs de fonds, désormais nombreux à demander un DMP lors de la réalisation d’un projet de recherche.

  • Accompagnement Data Management Plans (286 au sein de DMPonline DMP depuis 2018, 593 chercheurs UCLouvain inscrits sur plateforme).
  • Désignation d’un Research Data Officer, Adeline Grard qui a quitté l’UCLouvain fin 2022.

Data Ambassadors

  • L’UCLouvain a mis en place une communauté d’ambassadeurs de données qui s’inscrit dans le réseau collaboratif des Data Ambassadors des six universités de la FWB, qui rassemble 80 Data Ambassadors.  Les data ambassadors UCLouvain sont situés dans les instituts de recherche.  Ils sont le point de contact pour toute question relative à la gestion des données de recherche qui nécessite une connaissance spécifique de la discipline.  Il y a à ce jour 28 data ambassadors à l’UCLouvain.

Éléments clés

Au sein des instituts de recherche, un réseau de 28 data ambassadors soutient les bonnes pratiques du RDM ainsi que l’ouverture des données.

Dépôt de données

Afin de permettre l’ouverture des données, une exigence de plus en plus fréquemment requise par les journaux scientifiques mais également par les bailleurs de fonds, l’UCLouvain s’est doté en 2020 d’une infrastructure Open Data (opendata.uclouvain.be). Cette infrastructure, gérée par  CISM, se base sur la plateforme open source Dataverse. Cette infrastucture met à disposition des chercheurs et chercheuses un entrepôt pour les données FAIR, notamment lorsqu’il n’y a pas d’entrepôt thématique international. La publication de ces données de recherche permet leur citation par d’autres scientifiques, ce qui valorise ce travail de gestion des données dans la carrière du chercheur ou de la chercheuse.

  • 13 instituts ont un dataverse sur le dépôt institutionnel;
  • 113 jeux de données, 13.778 fichiers (décembre 2022);
  • 1.500.000 téléchargements (décembre 2022) (560 886 téléchargements août 2022).

Un appel à projets Open Data a été lancé à l’UCLouvain 2022.  Celui-ci a permis de financer une mise en forme pour l’ouverture de données de deux projets.

Dans le cadre du projet M-QTOS, projet initié par UMons et financé par la FWB, l’UCLouvain a réalisé (via le CISM) un prototype de moissonneur de meta-données des dépôts Open Data des différentes universités FWB.

Éléments clés

L’UCLouvain est la première université belge a avoir déployé un dépôt institutionnel de données ouvertes : opendata.uclouvain.be. Ce dépôt, géré par le CISM, est aujourd’hui utilisé par 13 instituts.  Il contient plus de 110 jeux de données et plus de 13.000 fichiers.  Depuis sa mise en route en 2020, on compte plus de 1.500.000 téléchargements.

Formations

Différentes formations ont été organisées sur le Research Data Management.

  • Formation Introduction to Research Data Management & Data Management Plan.
  • Atelier – Compléter un Plan de gestion des données (Data Management Plan) (en collaboration avec ADRE et BIUL).
  • Accompagnements individuels et en atelier de chercheur et chercheuses UClouvain dans la rédaction de leur plan de gestion des données (en collaboration avec ADRE).
  • Webinaire Données sensibles et valorisation.
  • Formation Gestion des données de la recherche : données qualitatives.
  • Guide du Data Ambassador en FWB (en collaboration avec le réseau des Data Ambassadors de la FWB).
  • Courseware Research data management (version RDM@Bicfb) – en collaboration avec Bicfb.

Perspectives

  • Objectif de moissonnage (automatique) de meta-données d’Open Data de chercheurs UCLouvain sur différents dépôts internationaux thématiques.
  • Mise en livre ouvert du courseware Research Data Management.
  • Formation doctorale à la Gestion des Données de Recherche FAIR et Open.
  • Appels à projets annuels pour l’ouverture de jeux de données de recherche (datasets) existantes (formats, anonymisation, etc.).

Memberships

Contacts