Construction assistée de glossaires à l'aide des outils du DMF - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Construction assistée de glossaires à l'aide des outils du DMF

Résumé

Le Dictionnaire du Moyen Français (DMF) a conduit à développer un environnement de travail riche en outils permettant de faciliter la rédaction des articles et la consultation du dictionnaire. Après avoir répondu aux besoins des rédacteurs, nous nous sommes intéressés à ceux des utilisateurs. Plus particulièrement, nous avons étudié la gestion de la variation graphique en développant le lemmatiseur LGeRM. Le consultant n'a pas besoin de se préoccuper de l'entrée retenue par l'équipe de rédaction, il tape le mot rencontré dans son texte et le lemmatiseur lui propose les entrées probables pour la forme. Toujours dans le but de satisfaire au mieux les utilisateurs, nous avons, au fur et à mesure de la sortie des différentes versions du DMF, fait évoluer les interfaces pour améliorer la consultation, nous avons ajouté de nouvelles fonctionnalités, nous avons consolidé la passerelle entre les articles du dictionnaire et les bases de textes servant à la rédaction. Nous nous sommes ensuite aperçus que les éditeurs de textes avaient des demandes spécifiques que nous pouvions satisfaire en modifiant et en adaptant les outils dont nous disposions déjà, plus spécifiquement au niveau de la lemmatisation. Nous avons dégagé trois souhaits : la possibilité d'afficher un article sans passer par l'interface standard de la base, la lemmatisation d'un texte et la construction du glossaire du texte. Le travail principal d'un éditeur de texte est de faire la transcription de son manuscrit. L'idée est de développer un outil qui s'occupe de toute la partie automatique de la construction du glossaire en s'appuyant sur le dictionnaire. Si l'éditeur met en ligne directement sa transcription, le DMF permet par un simple clic d'afficher l'entrée correspondant au mot à l'aide d'un lien. Cette fonctionnalité laisse la gestion des ambiguïtés à la perspicacité de l'utilisateur final. Pour afficher l'entrée exacte, il est nécessaire de lemmatiser le texte. L'outil glossaire permet de le préparer avant sa mise en ligne. Le texte encodé au format XML/TEI subit une série de traitements automatiques (dont sa lemmatisation) conduisant à un glossaire : tous les mots du texte sont regroupés sous un ou plusieurs lemmes. Il est alors possible de consulter le texte page par page, mot par mot ou encore lemme par lemme. L'éditeur peut corriger les erreurs de lemmatisation et lever les ambiguïtés. L'éditeur peut être amené à corriger sa transcription et à faire une ou plusieurs nouvelles lemmatisations. Au final, le résultat pourra être exporté sous différents formats : index lemmatisé ou texte TEI.

Domaines

Linguistique
Fichier non déposé

Dates et versions

hal-00521893 , version 1 (28-09-2010)

Identifiants

  • HAL Id : hal-00521893 , version 1

Citer

Gilles Souvay, Sylvie Bazin-Tacchella. Construction assistée de glossaires à l'aide des outils du DMF. XXVIème Congrès International de Linguistique et de Philologie Romane, Sep 2010, Valencia, Espagne. à paraître. ⟨hal-00521893⟩
108 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More