Corpus and Models for Lemmatisation and POS-tagging of Old French - HAL Accéder directement au contenu
Pré-publication, Document de travail Année : 2021

Corpus and Models for Lemmatisation and POS-tagging of Old French

Frédéric Duval
  • Fonction : Auteur
  • PersonId : 1056626
Lucence Ing
  • Fonction : Auteur
  • PersonId : 1098515

Résumé

Old French is a typical example of an under-resourced historic languages, that furtherly displays an important amount of linguistic variation. In this paper, we present the current results of a long going project (2015-.. .) and describe how we broached the difficult question of providing lemmatisation and POS models for Old French with the help of neural taggers and the progressive constitution of dedicated corpora.
L'ancien français est un exemple caractéristique d'une langue historique peu pourvue en ressources, qui présente en outre une importante variation linguistique. Dans cet article, nous présentons les résultats actuels d'un projet de longue haleine (2015-...) et décrivons comment nous avons abordé la difficile question de la lemmatisation et des modèles d'annotation morphosyntaxique pour l'ancien français à l'aide d'étiqueteurs neuronaux et de la constitution progressive de corpus dédiés.
Fichier principal
Vignette du fichier
corpusAndModels.pdf ( 212.37 Ko ) Télécharger
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-03353125, version 1 (23-09-2021)

Licence

Paternité - CC BY 4.0

Identifiants

  • HAL Id : halshs-03353125 , version 1

Citer

Jean-Baptiste Camps, Thibault Clérice, Naomi Kanaoka, Ariane Pinche, Frédéric Duval, et al.. Corpus and Models for Lemmatisation and POS-tagging of Old French. 2021. ⟨halshs-03353125⟩
100 Consultations
602 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus