Le "modèle abstrait" du corpus Bouvard : première approche

Résumé : Tout travail de transcription est d'abord un travail de décodage avant un ré-encodage. Il y a des choix à faire, mais comment s'assurer de faire les bons ? Comment, dans un corpus complexe, polymorphe et hétérogène comme le corpus Bouvard, satisfaire de manière systématique et cohérente aux divers objectifs du projet de numérisation ? L'un des objectifs est la production d'une édition diplomatique fidèle au manuscrit. Cependant le besoin d'un encodage TEI pour produire une édition numérique conforme aux standards de la communauté scientifique et aux enjeux techniques du projet, conduit le travail d'encodage à privilégier la structure du texte (la nature des composants textuels et leur hiérarchie) sur le document (la disposition des éléments sur la page, leur apparence).

Confrontés à cette difficulté dans le cadre du travail préparatoire à l'encodage TEI du corpus Bouvard, nous avons cherché à élaborer une représentation abstraite du corpus (son " modèle abstrait ") articulant les deux niveaux de structures (appartenant à deux plans distincts) avec lesquelles nous aurons à jongler constamment : structures textuelles exprimées dans le choix des éléments de la TEI (titre, paragraphe, listes, abréviations, etc.) et structures du document (feuillets, mise en page principalement, éléments scriptographiques).

Cet outil sera utilisé pour la rédaction du manuel d'encodage principalement. Mais il pourra aussi constituer un outil de référence permettant aux encodeurs de comprendre plus facilement à quel niveau tel ou tel trait doit être prioritairement encodé, ou s'il doit l'être ou pas.
Complete list of metadatas

https://halshs.archives-ouvertes.fr/halshs-00368044
Contributor : Stéphanie Dord-Crouslé <>
Submitted on : Monday, April 20, 2009 - 2:37:33 PM
Last modification on : Tuesday, July 23, 2019 - 10:36:03 AM
Long-term archiving on : Tuesday, June 8, 2010 - 11:26:31 PM

File

SDC_EMG_modele_abstrait_BP.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-00368044, version 1

Citation

Stéphanie Dord-Crouslé, Emmanuelle Morlock-Gerstenkorn. Le "modèle abstrait" du corpus Bouvard : première approche. journée d'étude " Constitution et exploitation de corpus issus de manuscrits - Lectures, écritures et nouvelles approches en recherche documentaire " organisée par Cécile Meynard et Thomas Lebarbé, Mar 2009, Grenoble, France. ⟨halshs-00368044⟩

Share

Metrics

Record views

497

Files downloads

216