Les données de la recherche

Que sont les données de la recherche ?

Enregistrements factuels (chiffres, statistiques, prélèvements, éléments de code ou algorithme, textes, images etc.), les données constituent la matière première de l’activité de recherche. Ce sont les données tangibles qui permettent d’élaborer de nouvelles hypothèses, d’en consolider d’autres, de faire progresser les connaissances sur tel ou tel domaine de recherche. Leur bonne gestion est donc essentielle pour :

  • Ne pas les perdre : la sécurisation des données à l’aide d’outils et de solutions d'hébergement dédiées est un enjeu important ;
  • Garantir leur origine : la donnée a un cycle de vie qu’il convient de documenter à chaque étape du parcours ;
  • Les retrouver : les données peuvent représenter des masses d’information qu’il convient d’organiser et de structurer ;
  • Les exploiter : le chercheur à l’origine de la collecte des données pourra y revenir et ouvrir leur accès à d’autres chercheurs.

Découvrez ce que sont les données de la recherche en 3 minutes dans la vidéo réalisée par les universités du Grand Est.

What is data? Researchers answer the question. Vidéo d’EOSC (European Open Science Cloud) réalisée dans le cadre du projet EOSC-Pillar dans laquelle des chercheurs français parlent des données couramment utilisées dans leurs disciplines.

Science ouverte, quels enjeux pour les données de la recherche ?

Découvrez l'impact de la Science ouverte sur les données de la recherche en 3 minutes

Il est important de bien gérer les données, de les décrire, de les stocker et de les conserver, pour ne pas les perdre. Il est important aussi de pouvoir les communiquer ou les diffuser, dès lors que cela est possible, à des fins de traçabilité et de reproductibilité. Dans son deuxième axe relatif aux données de la recherche, le Plan national incite les porteurs de projets financés sur fonds publics à diffuser ouvertement leurs données (sauf exceptions légales) et demande la généralisation des Plans de gestion de données (PGD) dans le respect des principes FAIR.

  • Facile à trouver par l’homme ou par la machine
  • Accessible : grâce aux moyens de stockage et aux modalités de téléchargement facilitées, grâce aussi aux métadonnées (un DOI)
  • Interopérable : la donnée est utilisable, intelligible et combinable avec d’autres données par l’homme ou par la machine ; elle est décrite par exemple selon un standard de métadonnées
  • Réutilisable à des fins d’enseignement, de recherche, de vérification (reproductibilité d’une expérience)

What are the impacts of FAIRification? - Interviews with French researchers [VIDEO]

Communauté d'acteurs et d'institutions concernés par les enjeux liées à la gestion des données de la recherche, la Research Data Alliance (RDA) est une initiative conjointe de l’Union européenne (Commission européenne), des États-Unis (National Science Foundation, National Institute of Standards and Technology) et de l’Australie (Ministère de l'innovation). Ses actions autour du partage et de la réutilisation des données sont relayées en France par RDA France.

Des ressources pour accompagner la communauté scientifique dans la gestion et le partage des données

DORANUM

Élaboré par le collège Données de la recherche du Comité pour la science ouverte, le guide Partager les données liées aux publications scientifiques accompagne les chercheurs dans cette démarche, qui contribue à la transparence et favorise la réutilisation des données de recherche.

"Comment assurer la lisibilité et la visibilité de vos données dans le temps, d'un projet à l'autre ? Comment répondre aux exigences des financeurs ? Comment partager vos données afin que vos pairs puissent comprendre au mieux vos recherches ? Comment organiser et formater les données pour qu'elles soient communicables et interprétables ? "

Consulter le guide de SciencesPo

Le décret du 3 décembre 2021 reconnaît la science ouverte et la gestion des données comme des éléments relevant de l'intégrité scientifique.

Il précise, entre autres, que : « Les établissements publics et fondations reconnues d’utilité publique […] :

  • promeuvent la diffusion des publications en accès ouvert et la mise à disposition des méthodes et protocoles, des données et des codes sources associés aux résultats de la recherche afin d’en garantir la traçabilité et la reproductibilité. Ils incitent à la publication des résultats de recherche dits négatifs. (Article 2)
  • définissent une politique de conservation, de communication et de réutilisation des résultats bruts des travaux scientifiques menés en son sein. A cet effet, ils veillent à la mise en œuvre par leur personnel de plans de gestion de données et contribue aux infrastructures qui permettent la conservation, la communication et la réutilisation des données et des codes sources. » (Article 6)

La fiche synthétique rédigée par DORANUM permet de mieux comprendre les conditions de partage des données dans le respect de la propriété intellectuelle.