. Le-lexique-du-lefff-et-les-tables-de-verbes-et-de-noms-prédicatifs-du-lexique-grammaire, étiquetage sera compatible avec les fichiers XML de Transcriber pour permettre la synchronisation avec les fichiers sonores. D'autres couches d'annotations sont programmées sur ESLO, comme l'annotation syntaxique en chunks 49 , par exemple. On citera également le projet ANCOR 50 décrit dans (Schang et al., 2011) consistant dans l'annotation et l'étude des coréférences à l'oral et se fondant majoritairement sur le corpus ESLO, Cent vingt et un entretiens d'ESLO1 annotés des entités nommées et dénommantes ou un corpus de 1 723 « énoncés » (tours de parole ou séquences entourées de « blancs ») comportant 18 424 unités lexicales étiquetées morphosyntaxiquement représentent des ressources riches et très utiles pour les techniques d'apprentissage

E. Le-corpus, . Peut-Être-aujourd-'hui-exploité-de-manières, and . Dupont, Nous avons mentionné un exemple du travail qui a croisé l'information annotée avec les métadonnées. Il s'agit de l'analyse de la variation des valeurs numériques de temps dans les fichiers de transcription en fonction de différents profils sociologiques des locuteurs à l'aide des méthodes statistiques (pour plus de détails voir, 2012.

S. Abney, Parsing by chunks éditeurs : Principlebased Parsing, 1991.

O. Baude, Corpus oraux : guide des bonnes pratiques, CNRS-Editions et Presses universitaires d'Orléans, 2006.

O. Baude and C. Dugua, « (Re)faire le corpus d'Orléans quarante ans après : quoi de neuf, linguiste ?, 2011.

G. Bergounioux, J. Baraduc, and C. Dumont, étude socio-linguistique sur Orléans (1966- 1991): 25 ans d'histoire d'un corpus », n°93, Langue française, pp.74-93, 1992.
DOI : 10.3406/lfr.1992.5812

C. Blanche-benveniste and C. Jeanjean, Le français parlé, transcription et édition, 1987.

P. Cappeau and F. Gadet, « Où en sont les corpus sur les français parlés ? » Revue Française de Linguistique Appliquée, pp.129-133, 2007.

E. Cresti and M. Moneglia, Integrated Reference Corpora for Spoken Romance Languages, Studies in Corpus Linguistics 15, 2005.

M. Debrock, P. Mertens, F. Truyen, V. Brosens, and . Elicop, Étude LInguistique de la COmmunication Parlée: Constitution et exploitation d'un corpus de français parlé automatisé, 2000.

P. Denis and B. Sagot, « Exploitation d'une ressource lexicale pour la construction d'un étiqueteur morpho-syntaxique état-de-l'art du français, 2010.

A. Dister, De la transcription à l'étiquetage morphosyntaxique. Le cas de la banque de données textuelles orales VALIBEL, Thèse de doctorat, 2007.

A. Dupont, I. Eshkol-taravella, and L. Delsol, « Étude d'application des méthodes et des outils statistiques sur les données du corpus ESLO : cas de la question sur mai 68, pp.13-15

I. Eshkol and . Entrer, Etude des "entités dénommantes" dans un corpus oral », Eigennamen in der gesprochenen Sprache, pp.245-266, 2010.

N. Friburger, Reconnaissance automatique des noms propres ; application à la classification automatique de textes journalistiques, Thèse de doctorat, 2002.

L. Hriba, Identification automatique des locus de variation dans un corpus de français parlé, Thèse de doctorat. Université d'Orléans

A. Kaufmann, The Santa Barbara Corpus of Spoken American English???Part ILingistic Data Consortium. 3 CD-Rom package US$75., Journal of Pragmatics, vol.34, issue.9, pp.1309-1316, 2002.
DOI : 10.1016/S0378-2166(02)00040-1

J. Lafferty, A. Mccallum, and F. Pereira, « Conditional random fields : Probabilistic models for segmenting and labeling sequence data, Proceedings of ICML'01, pp.282-289, 2001.

G. Leech, « Introduction corpus annotation Corpus annotation: Linguistic information from computer text corpora, p.18, 1997.

J. Lonergan, J. Kay, and J. Ross, Etude sociolinguistique sur Orléans, catalogue des enregistrements, 1974.

D. Maurel, N. Friburger, and I. Eshkol, « Who are you, you who speak? Transducer cascades for information retrieval », 4th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, pp.6-8, 2009.

P. Mertens, « Les corpus de français parlé ELICOP : consultation et exploitationéd.) Tableaux Vivants. Opstellen over taal-en-onderwijs aangeboden aan Mark Debrock, 2002.

A. Nazarenko, « Le point sur l'état actuel des connaissances en traitement automatique du langage (TAL) », Compréhension des langues et interaction, pp.31-70, 2006.

S. Paumier, De la reconnaissance de formes linguistiques à l'analyse syntaxique, Thèse de Doctorat, 2003.

E. Schang, A. Boyer, J. Muzerelle, J. Antoine, I. Eshkol et al., Coreference and Anaphoric Annotations for Spontaneous Speech Corpora In French », The 8th Discourse Anaphora and Anaphor Resolution Colloquium, 2011.

C. Sutton and A. Mccallum, « An Introduction to Conditional Random Fields for Relational Learning Introduction to Statistical Relational Learning, 2006.

I. Tellier and M. Tommasi, « Champs Markoviens Conditionnels pour l'extraction d'information », dans Modèles probabilistes pour l'accès à l'information textuelle, pp.223-267, 2011.