Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012 - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2011

Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012

Résumé

Cet article présente la constitution et la mise à disposition du corpus oral ESLO. Notre objectif est de montrer qu'il ne s'agit pas seulement de recueillir et rendre disponible des données langagières mais aussi de rendre explicite l'ensemble de la chaîne de traitement qui permet d'élaborer un tel corpus. Après avoir présenté le projet et le corpus nous préciserons les problèmes juridiques et méthodologiques qui ont conditionné les opérations de traitement du corpus et notamment les procédures d'anonymisation indispensables à la libre diffusion de cette ressource. Dans une seconde partie, nous présenterons les différentes annotations effectuées sur les données brutes avec quelques exemples de leurs exploitations. Nous expliquerons la méthodologie suivie qui est toujours guidée par la nature des données et l'objectif final visé : constituer un grand corpus oral variationniste du français. Nous aborderons enfin les questions de mise à disposition du corpus en ligne.

Mots clés

Domaines

Linguistique
Fichier principal
Vignette du fichier
2011_ESLO_TAL52-3.pdf (441.93 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-01163053 , version 1 (11-06-2015)

Identifiants

  • HAL Id : halshs-01163053 , version 1

Citer

Iris Eshkol-Taravella, Olivier Baude, Denis Maurel, Linda Hriba, Céline Dugua, et al.. Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012. Revue TAL : traitement automatique des langues, 2011, Ressources Linguistiques Libres, 53 (2), pp.17-46. ⟨halshs-01163053⟩
803 Consultations
984 Téléchargements

Partager

Gmail Facebook X LinkedIn More