s'authentifier
rss feed
HAL : halshs-00003994, version 1

Fiche détaillée  Récupérer au format
Actes des XVes Journees d'Etude sur la Parole, France (2004)
Gestion de corpus oraux annotés : Méthodes et outils
Michel Jacobson 1
(04/2004)

En linguistique comme en phonétique, les corpus de parole comportent généralement deux types de ressources: les enregistrements et leurs annotations. Les outils de gestion de tels corpus doivent être capable de gérer ces deux types de ressources. Nous présentons ici une revue des outils et des formalismes utilisés pour la création de ces corpus. Nous présenterons aussi des critères pour nous aider a faire un choix parmis eux.
Nous conclurons par la présentation d'un modèle connectant deux outils de gestion: un logiciel d'analyses phonétiques et un logiciel permettant de faire des requêtes sur des annotations linguistiques. Nous illustrerons l'utilisation de ce modèle par un exemple d'enrichissement automatique de l'annotation par des valeurs calculées par l'analyse du signal.
1 :  Laboratoire des langues et civilisations à tradition orale (LACITO)
CNRS : UMR7107 – Université Paris III - Sorbonne nouvelle – Université Paris IV - Paris Sorbonne
Sciences de l'Homme et Société/Linguistique
phonétique – langage de balisage de texte – corpus oraux
Liste des fichiers attachés à ce document : 
PDF
jep-jacobson.2004.pdf(133.4 KB)