Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012
Iris Eshkol-Taravella
(1)
,
Olivier Baude
(1)
,
Denis Maurel
(2)
,
Linda Hriba
(3)
,
Céline Dugua
(1)
,
Isabelle Tellier
(4)
Iris Eshkol-Taravella
- Fonction : Auteur
- PersonId : 18520
- IdHAL : iris-eshkol-taravella
- ORCID : 0000-0003-0814-3623
- IdRef : 074195158
Olivier Baude
- Fonction : Auteur
- PersonId : 4228
- IdHAL : olivier-baude
- ORCID : 0000-0002-8627-5229
- IdRef : 105682640
Denis Maurel
- Fonction : Auteur
- PersonId : 5934
- IdHAL : denis-maurel
- ORCID : 0000-0002-6752-8243
- IdRef : 058477446
Céline Dugua
Connectez-vous pour contacter l'auteur
- Fonction : Auteur correspondant
- PersonId : 743998
- IdHAL : celine-dugua
- ORCID : 0000-0003-3104-6784
- IdRef : 119297256
Connectez-vous pour contacter l'auteur
Isabelle Tellier
- Fonction : Auteur
- PersonId : 10815
- IdHAL : isabelle-tellier
- ORCID : 0000-0002-0977-2926
- IdRef : 154913634
Résumé
Cet article présente la constitution et la mise à disposition du corpus oral ESLO. Notre objectif est de montrer qu'il ne s'agit pas seulement de recueillir et rendre disponible des données langagières mais aussi de rendre explicite l'ensemble de la chaîne de traitement qui permet d'élaborer un tel corpus. Après avoir présenté le projet et le corpus nous préciserons les problèmes juridiques et méthodologiques qui ont conditionné les opérations de traitement du corpus et notamment les procédures d'anonymisation indispensables à la libre diffusion de cette ressource. Dans une seconde partie, nous présenterons les différentes annotations effectuées sur les données brutes avec quelques exemples de leurs exploitations. Nous expliquerons la méthodologie suivie qui est toujours guidée par la nature des données et l'objectif final visé : constituer un grand corpus oral variationniste du français. Nous aborderons enfin les questions de mise à disposition du corpus en ligne.
Domaines
LinguistiqueFormat du dépôt | Fichier |
---|---|
Type de dépôt | Article dans une revue |
Résumé |
fr
Cet article présente la constitution et la mise à disposition du corpus oral ESLO. Notre objectif est de montrer qu'il ne s'agit pas seulement de recueillir et rendre disponible des données langagières mais aussi de rendre explicite l'ensemble de la chaîne de traitement qui permet d'élaborer un tel corpus. Après avoir présenté le projet et le corpus nous préciserons les problèmes juridiques et méthodologiques qui ont conditionné les opérations de traitement du corpus et notamment les procédures d'anonymisation indispensables à la libre diffusion de cette ressource. Dans une seconde partie, nous présenterons les différentes annotations effectuées sur les données brutes avec quelques exemples de leurs exploitations. Nous expliquerons la méthodologie suivie qui est toujours guidée par la nature des données et l'objectif final visé : constituer un grand corpus oral variationniste du français. Nous aborderons enfin les questions de mise à disposition du corpus en ligne.
|
Titre |
fr
Un grand corpus oral « disponible » : le corpus d'Orléans 1 1968-2012
|
Auteur(s) |
Iris Eshkol-Taravella
1
, Olivier Baude
1
, Denis Maurel
2
, Linda Hriba
3
, Céline Dugua
1
, Isabelle Tellier
4
1
LLL -
Laboratoire Ligérien de Linguistique
( 243264 )
- UFR LLSH-Université d'Orléans BP 46527 45065 Orléans cedex 2
- France
2
BDTLN -
Bases de données et traitement des langues naturelles
( 394523 )
- France
3
LDI -
Lexiques, Dictionnaires, Informatique
( 24509 )
- UFR Lettres, Sciences de l'Homme et des Sociétés, Université Paris 13, 99 avenue Jean-Baptiste Clément, F-93430, Villetaneuse
- France
4
Lattice -
Lattice - Langues, Textes, Traitements informatiques, Cognition - UMR 8094
( 104851 )
- Lattice - ENS 1, rue Maurice Arnoux 92120 Montrouge
- France
|
Audience |
Internationale
|
Comité de lecture |
Oui
|
Vulgarisation |
Non
|
Nom de la revue |
|
Langue du document |
Français
|
Page/Identifiant |
17-46
|
URL éditeur |
https://www.atala.org/content/un-grand-corpus-oral-«-disponible-»-le-corpus-d’orléans-1968-2012
|
Numéro |
2
|
Titre de la collection |
Ressources Linguistiques Libres
|
Volume |
53
|
Date de publication |
2011
|
Domaine(s) |
|
Mots-clés |
fr
TAL, corpus oral
|
Origine :
Fichiers produits par l'(les) auteur(s)
Loading...