Skip to Main content Skip to Navigation
Conference papers

Apprentissage automatique d'un modèle de résolution de la coréférence à partir de données orales transcrites du français : le système CROC

Résumé : Cet article présente CROC (Coreference Resolution for Oral Corpus), un premier système de résolution des coréférences en français reposant sur des techniques d'apprentissage automatique. Une des spécificités du système réside dans son apprentissage sur des données exclusivement orales, à savoir ANCOR (anaphore et coréférence dans les corpus oraux), le premier corpus de français oral transcrit annoté en relations anaphoriques. En l'état actuel, le système CROC nécessite un repérage préalable des mentions. Nous détaillons les choix des traits – issus du corpus ou calculés – utilisés par l'apprentissage, et nous présentons un ensemble d'expérimentations avec ces traits. Les scores obtenus sont très proches de ceux de l'état de l'art des systèmes conçus pour l'écrit. Nous concluons alors en donnant des perspectives sur la réalisation d'un système end-to-end valable à la fois pour l'oral transcrit et l'écrit.
Complete list of metadatas

Cited literature [14 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-01162174
Contributor : Frédéric Landragin <>
Submitted on : Tuesday, June 16, 2015 - 5:30:27 PM
Last modification on : Tuesday, November 19, 2019 - 9:56:33 AM
Document(s) archivé(s) le : Tuesday, April 25, 2017 - 5:48:45 AM

File

15_TALN.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-01162174, version 1

Citation

Adèle Désoyer, Frédéric Landragin, Isabelle Tellier. Apprentissage automatique d'un modèle de résolution de la coréférence à partir de données orales transcrites du français : le système CROC. Vingt-deuxième Conférence sur le Traitement Automatique des Langues Naturelles, Jun 2015, Caen, France. pp.439-445. ⟨halshs-01162174⟩

Share

Metrics

Record views

449

Files downloads

628