Combiner parseur automatique et révision manuelle pour la constitution d'un corpus arboré de parole spontanée : retour d'expérience sur le corpus ODIL_syntaxe - Laboratoire LI, équipe BDTLN Accéder directement au contenu
Poster De Conférence Année : 2019

Combining Automatic Parsing and Manual Revision for the Constitution of a Spontaneous Speech Treebank : Experience Feedback on the ODIL_Syntaxe Corpus

Combiner parseur automatique et révision manuelle pour la constitution d'un corpus arboré de parole spontanée : retour d'expérience sur le corpus ODIL_syntaxe

Résumé

This paper describes a syntactic annotation platform (Contemplata) that integrates a parser (Stanford Parser precisely) to automatically annotate written text or oral transcriptions and then allows their manual revision by an expert, in order to ease the annotation task. This tool was used in the ODIL Project to produce a phrase-structure treebank based on a corpus of spontaneous speech. In this paper, we present the annotation process that has been implemented as well as our annotation guidelines and plan to provide a demonstration of the annotation tool during the presentation.
Cet article présente l'utilisation d'une plateforme d'annotation syntaxique (Contemplata) qui intègre un parseur pour annoter automatiquement des corpus écrits ou oraux puis permettre leur révision manuelle par un·e expert·e, afin de limiter son travail d'annotation. Dans le cadre du projet ODIL, cet outil a permis de réaliser un corpus de français parlé spontané annoté en arbres de constituants, ceci dans la perspective d'une annotation en temporalité. Nous présentons ici la démarche mise en œuvre pour l'annotation ainsi que les conventions d'annotation, et proposerons une démonstration de l'outil.
Fichier principal
Vignette du fichier
LIFT_ODIL_v2.pdf (228.61 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02295494 , version 1 (24-09-2019)
hal-02295494 , version 2 (25-09-2019)

Identifiants

  • HAL Id : hal-02295494 , version 2

Citer

Ilaine Wang, Aurore Pelletier, Jakub Waszczuk, Anais Anais Lefeuvre-Halftermeyer, Jean-Yves Antoine, et al.. Combiner parseur automatique et révision manuelle pour la constitution d'un corpus arboré de parole spontanée : retour d'expérience sur le corpus ODIL_syntaxe. Journées scientifiques du groupement de recherche « Linguistique informatique, formelle et de terrain », Nov 2019, Orléans, France. . ⟨hal-02295494v2⟩
568 Consultations
119 Téléchargements

Partager

Gmail Facebook X LinkedIn More