Skip to Main content Skip to Navigation
Conference papers

Détection automatique de chaînes de coréférence pour le français écrit : règles et ressources adaptées au repérage de phénomènes linguistiques spécifiques

Résumé : Nous présentons un système end-to-end de détection automatique des chaînes de coréférence, à base de règles, pour le français écrit. Ce système insiste sur la prise en compte de phénomènes linguistiques négligés par d'autres systèmes. Nous avons élaboré des ressources lexicales pour la résolution des anaphores infidèles (Mon chat... Cet animal...), notamment lorsqu'elles incluent une entité nommée (La Seine... Ce fleuve...). Nous utilisons également des règles pour le repérage de mentions de groupes (Pierre et Paul) et d'anaphores zéros (Pierre boit et ø fume), ainsi que des règles pour la détection des pronoms de première et deuxième personnes dans les citations (Paul a dit: "Je suis étudiant."). L'article présente l'élaboration des ressources et règles utilisées pour la gestion de ces phénomènes spécifiques, avant de décrire le système dans son ensemble, et notamment les différentes phases de la résolution de la coréférence.
Complete list of metadata

Cited literature [33 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-01793477
Contributor : Bruno Oberle <>
Submitted on : Friday, February 21, 2020 - 9:45:00 AM
Last modification on : Monday, December 14, 2020 - 5:38:34 PM
Long-term archiving on: : Friday, May 22, 2020 - 2:38:25 PM

File

paper_final.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-01793477, version 1

Citation

Bruno Oberle. Détection automatique de chaînes de coréférence pour le français écrit : règles et ressources adaptées au repérage de phénomènes linguistiques spécifiques. Conférence sur le Traitement Automatique des Langues Naturelles (TALN-RECITAL) 2019, Jul 2019, Toulouse, France. ⟨halshs-01793477⟩

Share

Metrics

Record views

162

Files downloads

102