Les data papers (ou articles de données) sont des publications scientifiques consacrées à la description détaillée d’un jeu de données, de sa collecte, de ses méthodes et de son potentiel de réutilisation. Ils sont nés de l’essor de la science ouverte et visent à donner du crédit aux auteurs pour le partage de données de recherche, avec un format citable et évalué par les pairs.
Un data paper permet de valoriser la production et la curation d’un jeu de données en le rendant citable et visible (souvent via un DOI), ce qui peut augmenter son impact et sa réutilisation. En décrivant clairement la méthode de collecte, le traitement, la structure, la qualité et les limites des données, il facilite leur compréhension par d’autres équipes et renforce la transparence et la reproductibilité. Enfin, l’évaluation par les pairs et la formalisation des métadonnées, des licences et des conditions d’accès contribuent à améliorer la qualité du dataset et à répondre aux exigences d’open science (FAIR, plans de gestion des données).
Depuis le milieu des années 2010, plusieurs ont lancé des revues dédiées : par exemple Scientific Data ou Data in Brief publient exclusivement des descriptions de jeux de données dans de multiples domaines. D’autres éditeurs intègrent les data papers comme type d’article optionnel au sein de revues existantes. Les politiques éditoriales évoluent donc pour encourager le partage de données : de plus en plus de revues exigent une Data Availability Statement (déclaration de disponibilité des données) et acceptent la soumission d’articles de données pour valoriser les jeux de données associés à un projet.
Dans le domaine des sciences de l’éducation, les data papers restent rares à ce jour. L’un des freins est que de nombreux travaux éducatifs mobilisent des données sur des personnes mineures et/ou issues de contextes scolaires spécifiques, ce qui rend délicate la mise à disposition ouverte des données brutes pour des raisons de confidentialité (exigences de la protection des données, anonymisation complexe) (Van Driel, 2022). Néanmoins, les objectifs des data papers sont parfaitement en phase avec les préoccupations actuelles en matière d’ouverture des sciences, y compris dans le domaine des sciences de l'éducation. Quelques revues en éducation publient désormais des data papers (comme Education et Formations), et des projets internationaux (par exemple, bases de données d’évaluation à grande échelle type PISA, TIMSS…) encouragent la documentation réutilisable de leurs données via des articles dédiés.
Pour un exemple précis, l’article de Robertie Solimann et al. (2024) illustre la méthodologie sous-jacente à la publication d’un set de données dans le domaine de la didactique de la musique. La revue Data & Corpus est une revue récente qui est dédiée aux questions méthodologiques et aux données de recherche dans le domaine des sciences humaines et sociales.