Gérer les données de leur création à leur diffusion: étude de cas du projet DHARMA - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Gérer les données de leur création à leur diffusion: étude de cas du projet DHARMA

Résumé

Le projet DHARMA : The Domestication of “Hindu” Asceticism and the Religious Making of South and Southeast Asia est financé pour 6 ans (2019-2025) par la bourse Synergy de l’ERC, dans le cadre du programme H2020. Il étudie la diffusion de l’hindouisme autour du Golfe du Bengale et son impact sur les institutions entre le VIe et le XIIIe siècle. Le projet s’attache à confronter des sources variées, principalement des inscriptions épigraphiques et des manuscrits, à leur contextualisation archéologique, avec l’engagement d’offrir l’accès à toutes les ressources collectées au cours du projet, corrélées à une édition numérique des inscriptions et des manuscrits, dans une base de données. Textes, images, artefacts, archives et données archéologiques sont organisés en jeux de données hétérogènes à la volumétrie importante, dont la cohérence et la qualité dépendent d’une bonne gestion. Celle-ci s’articule, dans le projet DHARMA, autour des chaînes de travail qui tentent de trouver l’équilibre entre pratiques et standards techniques d’un côté, méthodologies scientifiques et usages disciplinaires de l’autre, pour aboutir à un compromis dont l’application serait homogène. Force est de reconnaître que le modèle théorique doit être réévalué selon l’évolution des données, l’interprétation de la documentation et l’usage des procédures par les membres du projet. Certains principes a priori basiques s’avèrent parfois plus complexes qu’on ne l’aurait initialement envisagé, tels que la création de métadonnées. Ainsi, notre communication propose d’établir un état des lieux des données du projet, ainsi que les choix et enjeux qui en découlent pour leur traitement et leur gestion, afin de garantir leur pérennité et leur respect aux principes FAIR. Nous reviendrons donc sur les données collectées: leurs formats, l’existence de métadonnées, leur adhésion au cadre légal et autres aspects qui interrogent leur réutilisation réelle. A partir des constatations faites, nous détaillerons notre stratégie d’homogénéisation des données. Ceci se manifeste par l’alignement des formats, des systèmes d’identification et de nommage des fichiers, des métadonnées saisies ou encore du stockage, afin d’intégrer les données préexistantes transformées et les données nouvellement créées dans des chaînes de traitement propres à chaque type de données. Ce choix nous permet notamment de les soumettre à des procédures de contrôles et des tests de qualité tout en favorisant leur traçabilité.
DHARMA_MATE-SHS_Janiak-Levivier.pdf (2.95 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

halshs-03276532 , version 1 (23-09-2021)

Licence

Paternité

Identifiants

  • HAL Id : halshs-03276532 , version 1

Citer

Axelle Janiak, Adeline Levivier. Gérer les données de leur création à leur diffusion: étude de cas du projet DHARMA. Journées Annuelles 2021 de MATE-SHS, réseau MATE, Jun 2021, Bordeaux, France. ⟨halshs-03276532⟩
46 Consultations
17 Téléchargements

Partager

Gmail Facebook X LinkedIn More