Détection automatique de chaînes de coréférence pour le français écrit - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2019

Détection automatique de chaînes de coréférence pour le français écrit

Bruno Oberle
  • Fonction : Auteur
  • PersonId : 1028649

Résumé

Nous présentons un système end-to-end de détection automatique des chaînes de coréférence, à base de règles, pour le français écrit. Ce système insiste sur la prise en compte de phénomènes linguistiques négligés par d'autres systèmes. Nous avons élaboré des ressources lexicales pour la résolution des anaphores infidèles (Mon chat... Cet animal...), notamment lorsqu'elles incluent une entité nommée (La Seine... Ce fleuve...). Nous utilisons également des règles pour le repérage de mentions de groupes (Pierre et Paul) et d'anaphores zéros (Pierre boit et ø fume), ainsi que des règles pour la détection des pronoms de première et deuxième personnes dans les citations (Paul a dit: "Je suis étudiant."). L'article présente l'élaboration des ressources et règles utilisées pour la gestion de ces phénomènes spécifiques, avant de décrire le système dans son ensemble, et notamment les différentes phases de la résolution de la coréférence.
Fichier principal
Vignette du fichier
paper_final.pdf (120.93 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-01793477 , version 1 (21-02-2020)

Identifiants

  • HAL Id : halshs-01793477 , version 1

Citer

Bruno Oberle. Détection automatique de chaînes de coréférence pour le français écrit : règles et ressources adaptées au repérage de phénomènes linguistiques spécifiques. Conférence sur le Traitement Automatique des Langues Naturelles (TALN-RECITAL) 2019, Jul 2019, Toulouse, France. ⟨halshs-01793477⟩
164 Consultations
267 Téléchargements

Partager

Gmail Facebook X LinkedIn More