Peut-on bien chunker avec de mauvaises étiquettes POS ? - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Peut-on bien chunker avec de mauvaises étiquettes POS ?

Résumé

. Dans cet article, nous testons deux approches distinctes pour chunker un corpus oral transcrit, en cherchant à minimiser les étapes de correction manuelle. Nous ré-utilisons tout d'abord un chunker appris sur des données écrites, puis nous tentons de ré-apprendre un chunker spécifique de l'oral à partir de données annotées et corrigées manuellement, mais en faible quantité. L'objectif est d'atteindre les meilleurs résultats possibles pour le chunker en se passant autant que possible de la correction manuelle des étiquettes POS. Nos expériences montrent qu'il est possible d'apprendre un nouveau chunker performant pour l'oral à partir d'un corpus de référence annoté de petite taille, sans intervention sur les étiquettes POS.

Domaines

Linguistique
Fichier principal
Vignette du fichier
taln2014.pdf (541.63 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-01024274 , version 1 (24-07-2014)
hal-01024274 , version 2 (09-07-2015)

Identifiants

  • HAL Id : hal-01024274 , version 1

Citer

Iris Eshkol-Taravella, Isabelle Tellier, Yoann Dupont, Ilaine Wang. Peut-on bien chunker avec de mauvaises étiquettes POS ?. TALN 2014, Jul 2014, Marseille, France. pp.125-136. ⟨hal-01024274v1⟩

Collections

MODYCO
373 Consultations
258 Téléchargements

Partager

Gmail Facebook X LinkedIn More