“les données de la recherche sont définies comme des enregistrements factuels (chiffres, textes, images et sons), qui sont utilisés comme sources principales pour la recherche scientifique et sont généralement reconnus par la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Un ensemble de données de recherche constitue une représentation systématique et partielle du sujet faisant l’objet de la recherche. Ce terme ne s’applique pas aux éléments suivants : carnets de laboratoire, analyses préliminaires et projets de documents scientifiques, programmes de travaux futurs, examens par les pairs, communications personnelles avec des collègues et objets matériels (par exemple, les échantillons de laboratoire, les souches bactériennes et les animaux de laboratoire tels que les souris) “
Définition Rapport OCDE 2007
Cette définition est assez restrictive et on peut élargir aux catégories suivantes (proposées par l'INIST - Institut de l’Information Scientifique et Technique du CNRS) :
Les données de la recherche peuvent donc prendre des formes très variées : images, données numériques, textes, vidéos, code source, …