Transcription et codage des imprimés de la Renaissance. - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Document numérique - Revue des sciences et technologies de l'information. Série Document numérique Année : 2013

Transcription et codage des imprimés de la Renaissance.

Résumé

Preserving as many informations as possible from the original document, a transcription of ancient printed text should serve as a basis not only for literary analysis, but also for palaeotypographic studies. With this aim, we require a standardized encoding able to preserve a unequivocal link between the characters of the digital transcription and those of the original source. We define here the new concept of typem, a transitional element between the notion of character and glyph as defined by Unicode. It is proposed here to use MUFI, an extension to the Unicode standard, by adding new code points dedicated to "typems", in order to produce what we call "typemic transcriptions", reproducing all the characters of the original document. Finally, a project of a census of all the typems, named PICA (Projet d'Inventaire des Caractères Anciens), is described.
Conservant le plus grand nombre possible d'informations du document-source, une transcription de texte imprimé ancien devrait pouvoir servir de base non seulement à des analyses littéraires, mais également à des études " paléotypographiques ". Pour ce faire, il faudrait disposer d'un codage normalisé permettant d'assurer une correspondance univoque entre les caractères de la transcription numérique et ceux de la source originale. Le terme " caractère " pouvant prêter à confusion, nous introduisons un nouveau concept : celui de " typème ", intermédiaire entre le caractère et le glyphe tel qu'Unicode les définit. Nous proposons d'utiliser le codage MUFI, une extension d'Unicode, augmentée des typèmes attestés dans les imprimés anciens, afin de produire une transcription dite " typémique ", reproduction fidèle de la composition typographique du document original. Nous concluons sur la nécessité de réaliser l'inventaire des typèmes attestés dans les imprimés anciens, qui fera l'objet d'un Projet d'Inventaire des Caractères Anciens (PICA) actuellement à l'étude.
Fichier principal
Vignette du fichier
10_André_Jimenes.pdf (3.19 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00983575 , version 1 (18-01-2017)

Identifiants

Citer

Jacques André, Rémi Jimenes. Transcription et codage des imprimés de la Renaissance. : Réflexions pour un inventaire des caractères anciens. Document numérique - Revue des sciences et technologies de l'information. Série Document numérique, 2013, 16 (3), pp.113-139. ⟨10.3166/DN.16.3.113-139⟩. ⟨halshs-00983575⟩
313 Consultations
549 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More