Un grand corpus de référence du français parlé : état des lieux et perspectives - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Un grand corpus de référence du français parlé : état des lieux et perspectives

Résumé

Cette communication vise à interroger les concepts de "corpus de référence" et de "corpus représentatif" du français qui sont très largement utilisés dans la communauté scientifique depuis quelques années. Qu'est-ce qu'un corpus si représentatif qu'il en devient de référence ? De quoi est-il constitué ? Comment est-il collecté et exploité ? Quelle place pour les variétés et les variations diachroniques, diatopiques, diastratiques, diaphasiques du ou des français ? Pour répondre à ces questions, il s'agira tout d'abord de faire un état des lieux des usages de ces concepts et de leurs implications théoriques dans les grands projets, actuels ou en gestation, de constitution de corpus de français parlé (CRFP, PFC, CLAPI, VALIBEL, ESLO-VARILING, CIEL-F, Corpus de la parole, etc.). Dans un deuxième temps, je présenterai et discuterai les principaux choix théoriques et méthodologiques du Projet ESLO-VARILING de l'université d'Orléans dont l'objectif est la constitution d'un grand corpus prototypique de français parlé afin de mettre à disposition une banque de données de 10 millions de mots selon les principes suivants : (1) accumuler des heures de parole et développer une expérience critique sur leur mode de collecte et d’analyse, (2) créer des matériaux exploitables par les chercheurs et structurer la communauté « corpus », (3) ouvrir des champs d’investigation à l’ensemble des sciences humaines et apporter les attestations requises par la lexicographie ou l’élaboration de grammaires de référence. La troisième partie de ma communication présentera à partir des expériences présentées, des propositions concrètes, en termes de représentativité et d'usages, pour la constitution d'un vaste corpus de référence du français parlé dans le cadre institutionnel du programme Corpus de la parole de la Délégation générale à la langue française et aux langues de France du Ministère de la culture et du CNRS. Il s'agira in fine de concevoir une démarche de constitution de corpus variationnistes pour laquelle la réflexivité reste un élément fondateur d'une méthodologie qui observe et décrit mais aussi construit le français parlé comme objet scientifique.

Domaines

Linguistique
Fichier non déposé

Dates et versions

halshs-01165952 , version 1 (21-06-2015)

Identifiants

  • HAL Id : halshs-01165952 , version 1

Citer

Olivier Baude. Un grand corpus de référence du français parlé : état des lieux et perspectives. Colloque international AFLS, Les voix du français, Sep 2008, Oxford, Royaume-Uni. ⟨halshs-01165952⟩

Collections

UNIV-ORLEANS
81 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More