Le "modèle abstrait" du corpus Bouvard : première approche - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Le "modèle abstrait" du corpus Bouvard : première approche

Résumé

Tout travail de transcription est d'abord un travail de décodage avant un ré-encodage. Il y a des choix à faire, mais comment s'assurer de faire les bons ? Comment, dans un corpus complexe, polymorphe et hétérogène comme le corpus Bouvard, satisfaire de manière systématique et cohérente aux divers objectifs du projet de numérisation ? L'un des objectifs est la production d'une édition diplomatique fidèle au manuscrit. Cependant le besoin d'un encodage TEI pour produire une édition numérique conforme aux standards de la communauté scientifique et aux enjeux techniques du projet, conduit le travail d'encodage à privilégier la structure du texte (la nature des composants textuels et leur hiérarchie) sur le document (la disposition des éléments sur la page, leur apparence).

Confrontés à cette difficulté dans le cadre du travail préparatoire à l'encodage TEI du corpus Bouvard, nous avons cherché à élaborer une représentation abstraite du corpus (son " modèle abstrait ") articulant les deux niveaux de structures (appartenant à deux plans distincts) avec lesquelles nous aurons à jongler constamment : structures textuelles exprimées dans le choix des éléments de la TEI (titre, paragraphe, listes, abréviations, etc.) et structures du document (feuillets, mise en page principalement, éléments scriptographiques).

Cet outil sera utilisé pour la rédaction du manuel d'encodage principalement. Mais il pourra aussi constituer un outil de référence permettant aux encodeurs de comprendre plus facilement à quel niveau tel ou tel trait doit être prioritairement encodé, ou s'il doit l'être ou pas.
Fichier principal
Vignette du fichier
SDC_EMG_modele_abstrait_BP.pdf (515.86 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

halshs-00368044 , version 1 (20-04-2009)

Identifiants

  • HAL Id : halshs-00368044 , version 1

Citer

Stéphanie Dord-Crouslé, Emmanuelle Morlock-Gerstenkorn. Le "modèle abstrait" du corpus Bouvard : première approche. journée d'étude " Constitution et exploitation de corpus issus de manuscrits - Lectures, écritures et nouvelles approches en recherche documentaire " organisée par Cécile Meynard et Thomas Lebarbé, Mar 2009, Grenoble, France. ⟨halshs-00368044⟩
222 Consultations
153 Téléchargements

Partager

Gmail Facebook X LinkedIn More