Un concordancier multi-niveaux et multimédia pour des corpus oraux

Résumé : Les concordanciers jouent depuis longtemps un rôle important dans l’analyse des corpus linguistiques, tout comme dans les domaines de la philologie, de la littérature, de la traduction et de l’enseignement des langues. Toutefois, il existe peu de concordanciers qui soient capables d’associer des annotations à plusieurs niveaux et synchronisées avec le signal sonore. L’essor des grands corpus de français parlé introduit une augmentation des exigences au niveau de la performance. Dans ce travail à caractère préliminaire, nous avons développé un prototype de concordancier multi-niveaux et multimédia, que nous avons testé sur le corpus de français parlé du projet Phonologie du Français Contemporain (PFC, 1,5 million de tokens de transcription alignée au niveau de l’énoncé). L’outil permet non seulement d’enrichir les résultats des concordances grâce aux données relevant de plusieurs couches d’annotation du corpus (annotation morphosyntaxique, lemme, codage de la liaison, codage du schwa etc.), mais aussi d’élargir les modalités d’accès au corpus.
Type de document :
Communication dans un congrès
21e Conférence sur le Traitement automatique des Langues Naturelles (TALN 2014), Jul 2014, Marseille, France. Actes de la 21e Conférence sur le Traitement automatique des Langues Naturelles (TALN 2014), 2014
Liste complète des métadonnées

Littérature citée [9 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-01078133
Contributeur : Laboratoire Modyco <>
Soumis le : vendredi 7 novembre 2014 - 13:25:49
Dernière modification le : mercredi 4 juillet 2018 - 23:14:05
Document(s) archivé(s) le : vendredi 14 avril 2017 - 14:37:19

Fichier

Barreca 2014 concordancier.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : halshs-01078133, version 1

Collections

Citation

Giulia Barreca, George Christodoulides. Un concordancier multi-niveaux et multimédia pour des corpus oraux. 21e Conférence sur le Traitement automatique des Langues Naturelles (TALN 2014), Jul 2014, Marseille, France. Actes de la 21e Conférence sur le Traitement automatique des Langues Naturelles (TALN 2014), 2014. 〈halshs-01078133〉

Partager

Métriques

Consultations de la notice

115

Téléchargements de fichiers

120