Généralités
Le pôle de données et de services pour l’océan ODATIS a pour objectif général de promouvoir et faciliter l’utilisation des données d'observations réalisées dans l’océan, à partir de mesures in situ et de télédétection pour répondre à l'enjeu scientifique et sociétal de décrire, quantifier et comprendre l’océan dans sa globalité ou à son interface avec les autres milieux.
Cela nécessite des infrastructures interopérables permettant d'assurer la diffusion, le partage, la sauvegarde et l’usage intelligent et transversal des données. Le développement de la science ouverte, la mise en oeuvre des principes FAIR et la certification des entrepôts de données offrent un cadre et une ligne directrice pour la mise en oeuvre d'une telle politique de gestion des données.
Science ouverte
A l'automne 2020, le CNRS met en place son "Plan Données de la recherche » pour inciter les scientifiques à rendre leurs données accessibles et réutilisables. Ce plan fait suite à sa Feuille de route pour la science ouverte publiée en 2019.
Passeport pour la Science Ouverte (2020) à l'usage des doctorants, rassemble bonnes pratiques et outils pour partager et diffuser ses contenus scientifique. En 2023, ce passeport est actualisé avec de nouveaux contenus pédagogique (lien); notamment une vidéo de 5 minutes sur la gestion des données et le cycle de vie des données de la recherche.
Guide de bonnes pratiques sur la gestion des données de la recherche
Le Comité pour la science ouverte du Ministère de l’Enseignement supérieur et de la Recherche publie le Passeport pour la Science Ouverte (2020) à l'usage des doctorants qui rassemble bonnes pratiques et outils pour partager et diffuser ses contenus scientifique. En 2023, ce passeport est actualisé avec de nouveaux contenus pédagogique (lien); notamment une vidéo de 5 minutes (ci-contre) sur la gestion des données et le cycle de vie des données de la recherche. L'Atelier Données du groupe de travail inter-réseaux de la Mission pour les initiatives transverses et interdisciplinaires (MITI) – CNRS, guidé par le « Plan National pour la Science Ouverte », publie un "Guide de bonnes pratiques sur la gestion des données de la recherche" avec des ressources pragmatiques à chaque étape de gestion des données, calée ici sur le cycle de la donnée : imaginer et préparer, Concevoir et planifier, collecter, traiter, analyser, préserver et archiver, publier et diffuser. |
La gestion des données et le cycle de vie des données de la recherche. Crédits Egon Heuson. ouvrirlascience. [Vidéo]. Canal-U. |
Principes FAIR
Les principes FAIR "Findable, Accessible, Interoperable, Reusable" (Facile à trouver, Accessible, Interopérable, Réutilisable), de gestion des données fonctionnent comme une ligne directrice pour garantir une utilisation optimale des données de recherche et des métadonnées associées, à la fois par les hommes et par les machines.
Ces principes s'appliquent aux jeux de données des Centres de Données et Services (en étant définis dans leur cahier des charges) référencés au catalogue ODATIS, à tous les projets financés par le programme H2020 (listes et liens vers ceux-ci), recommandations pour les données de la recherche CNRS (plus d'information sur la feuille de route du CNRS).
Dans le cadre du projet ANR COPiLOtE, le pôle ODATIS met à disposition des CDS un guide pour évaluer leur maturité sur l'ensemble des principes et harmoniser l’implémentation de ces principes : Guide ANR COPiLOtE Guide principes FAIR - Principes FAIR dans le contexte du pôle ODATIS.
Plusieurs autres actions du pôle ODATIS présentent les principes FAIR à appliquer aux données et métadonnées des données marines en général ou pour des disciplines plus spécifiques:
- Gestion FAIR des données bioinformatiques en biologie marine, présentée par Clémence Cotten et Laura Leroi lors de l'atelier technique ODATIS - PNDB Données bioinformatiques de diversité, mars 2024 à la Station Biologique de Roscoff
-
Webinaires Possibilité d’archivage de données de CO2/pH Marin et Vocabulaire et thesaurus pour l’archivage de données de CO2/pH marin, organisés par le CES CO2 - pH marin en octobre et décembre 2023.
Schéma interactif des principes FAIR; cliquez sur chaque item pour plus d'information. Crédits détaillés dans le lien "Références".
Certification Core Trust Seal
La certification Core Trust Seal évalue des critères relatifs aux entrepôts de données selon plusieurs niveaux de conformité. Cette étape de certification est importante pour garantir: la fiabilité et la durabilité des dépôt de données ainsi que l’archivage et le partage à long terme des données. La Research Data Alliance (RDA) fournit un cadre commun pour la mise en œuvre et la maintenance des dépôts numériques selon 16 critères organisés en 3 thèmes (Infrastructure organisationnelle, Gestion des objets numériques des données et des metadonnées et Technologie:
L'outil en ligne CRUSÖE, développé par le SEDOO, permet d'évaluer les critères R0 à R16 de la certification Core Trust Seal.
-
R0. Contexte général : type d’entrepôt, description de l’entrepôt, description de la communauté concernée, niveau de curation, contenu en accès tel que déposé, curation de base et avancée, curation au niveau des données, partenaires,...
Infrastructure organisationnelle
- R1. Mission/Périmètre : L’entrepôt de données a pour mission explicite de donner accès à des données dans son domaine et de les préserver.
- R2. Licences : L’entrepôt maintient toutes les licences applicables à l'accès et à l'utilisation des données et en surveille la conformité.
- R3. Continuité de l'accès: L’entrepôt dispose d'un plan de continuité pour assurer un accès continu à ses collections et leur préservation.
- R4. Confidentialité/éthique: L’entrepôt garantit, dans la mesure du possible, que les données sont créées, conservées, qu’on y accède et qu’elles sont utilisées dans le respect des normes disciplinaires et éthiques.
- R5. Infrastructure organisationnelle: L’entrepôt dispose d'un financement adéquat et d'un nombre suffisant d'employés qualifiés gérés par un système de gouvernance clair pour mener à bien sa mission.
- R6. Conseils d’experts: L’entrepôt adopte un ou plusieurs mécanismes pour s’entourer de façon continue d’avis et commentaires d’experts (en interne ou en externe, incluant une expertise scientifique si le besoin en est pertinent).
Gestion des objets numériques
- R7. Intégrité et authenticité des données: L’entrepôt garantit l'intégrité et l'authenticité des données.
- R8. Appréciation et sélection des données: L’entrepôt accepte des données et des métadonnées sur la base de critères définis garantissant pertinence et intelligibilité pour les utilisateurs
- R9. Procédures d’archivage documentées: L’entrepôt applique des processus et des procédures documentés pour l'archivage des données.
- R10. Plan de préservation: L’entrepôt de données assume la responsabilité de la préservation à long terme et gère cette fonction de façon planifiée et documentée.
- R11. Qualité des données: L’entrepôt dispose de l’expertise appropriée pour traiter la question de la qualité technique des données et métadonnées et pour assurer qu’une information suffisante est accessible aux utilisateurs pour leur permettre d’évaluer la qualité des données.
- R12. Processus de traitement (Workflows): L'archivage s'effectue selon des processus de traitement (workflows) précisément définis, de l’ingestion des données à leur diffusion.
- R13. Découverte et identification des données: L’entrepôt permet aux utilisateurs de découvrir les données et d’y faire référence de façon pérenne par un mécanisme de citation approprié.
- R14. Réutilisation des données : L’entrepôt permet de réutiliser les données sur la durée, en veillant à ce que des métadonnées appropriées soient disponibles pour permettre la compréhension et l’utilisation des données.
Technologie
- R15. Infrastructure technique L’entrepôt fonctionne avec des systèmes d'exploitation et d'autres systèmes de base bien maintenus et utilise des technologies matérielles et logicielles adaptées aux services qu'il fournit à sa communauté cible.
- R16. Sécurité: L'infrastructure technique de l’entrepôt assure la protection de l'installation et de ses données, de ses produits, de ses services et de ses utilisateurs.
Le projet COPiLOtE du pôle océan ODATIS, s'intéresse à la Certification des Centres de Données et de Services avec plusieurs objectifs: harmoniser l’implémentation des principes FAIR à l’ensemble des Centres de Données ODATIS, améliorer la qualité des données et services proposés par les Centres de Données, pour atteindre les exigences édictées par la RDA en vue d’une certification «Core Trust Seal». Le pôle Océan ODATIS, dans le cadre de ce projet COPiLOtE, organise un support continu pour accompagner les CDS dans leur démarche de certification : sessions régulières et individuelles, ateliers techniques (présentations sur les principes FAIR, les identifiants permanents (DOI, PID, ...), les métadonnées et interopérabilité sémantique, ...Retrouvez les présentations faites lors des ateliers techniques, à partir de cette page.