L’oral un domaine à exploiter - HAL Accéder directement au contenu
Autre publication scientifique Année : 2008

L’oral un domaine à exploiter

Résumé

Verba volant, scripta manent. Dans un pays si fortement marqué par la tradition écrite et les usages littéraires, longtemps la langue parlée n'est pas apparue dans toute son importance. C'est l'auteur de la grande Histoire de la langue française, Ferdinand Brunot, qui le premier s'est préoccupé d'enregistrer et de conserver les traces sonores de faits de langue, en créant les fameuses Archives de la parole en 1911. Ces enregistrements sur rouleaux de cire, pieusement conservés, forment le fonds premier du département de l'audiovisuel à la BNF. Jusque-là, la parole vivante apparaissait curieusement - et paradoxalement - comme une forme subalterne, dérivée, et pour tout dire dégradée de la langue écrite. Effet de culture : telle était la représentation dominante qu'on se faisait du langage en France. Ç'a été le travail de la linguistique du XXe siècle que de rétablir l'ordre des choses. L'apparition des moyens de communication comme le téléphone et la radio, le déclin corollaire de la correspondance écrite formaient naturellement un contexte favorable à cette évolution, marquée ultérieurement par l'institution du dépôt légal des phonogrammes en 1938. En France, les premières enquêtes ont été effectuées dans les années cinquante à des fins didactiques. Plus de cinquante ans après, nous ne disposons toujours pas d'un véritable corpus de référence qui permette toutes sortes de recherches (description, analyse,applications). On mesure le retard pris par notre pays, y compris vis-à-vis d'autres zones francophones, en comparant ces résultats avec les données engrangées ailleurs. Claire Blanche-Benveniste nous en parlera dans un instant... Nous avons néanmoins entrepris de combler ce retard : depuis 2004, le ministère de la culture, en partenariat avec le CNRS, travaille au programme intitulé « Corpus de la parole ». La première étape du programme a été l'édition d'un Guide des bonnes pratiques pour la constitution, la conservation et l'exploitation des corpus oraux. Le plan de numérisation du ministère de la culture piloté par la Mission de la Recherche et de la technologie a permis de sauvegarder de nombreuses heures d'enregistrement. Cela constitue un riche patrimoine, qu'il fallait rendre accessible à tous. C'est désormais possible avec le site « Corpus de la parole », dont la première version est en ligne à partir d'aujourd'hui. Je tiens à remercier en particulier Michel Jacobson qui a réalisé le site au CNRS, et Julie Remfort qui était son correspondant à la DGLFLF. Ils ont tous les deux beaucoup travaillé, vite travaillé pour que ce soit aujourd'hui possible. Les première enquêtes ont été effectuées dans les années 50 à des fins didactiques, mais force est de constater que plus de 50 ans après nous ne disposons toujours pas pour le français d'un véritable corpus de référence qui pemette toutes sortes de recherches, descriptions, analyses, applications et on mesure le retard pris par notre pays y compris vis à vas d'autres pays francophones en comparant ces résultats avec les données engrangées ailleurs. Qu'est-ce qu'un corpus oral? Ce n'est pas une simple collection d'enregistrement de la parole humaine, c'est un objet construis par toute une série de procédures : numérisation, transcription, élaboration de métadonnées, annotations, des procédures qui permettent de passer d'un simple enregistrament à un objet patrimonial qui peut faire objet d'une recherche et d'un travail de valorisation. Par exemple s'agissant de la parole il est pour l'instant encore techniquement impossible de faire de la recherche de mots sur le son brut, il faut passer par la transcription. Autrement dit il s'agit de procéder à une métamorphose, à une sorte de conversion, il s'agit de transformer un ensemble de données brutes, un ensemble de produstions verbales en un objet de savoir, c'est à dire en l'occurrence en un objet oral susceptible d'être conservé et étudié et par conséquent prendrfe place dans le patrimoine culturel de la nation. La DGLFLF et le CNRS a entrepris de combler le retard qu'accuser le pays dans ce domaine et nous l'avons fait dans une perspective de valorisation de la diversité. Il convient de le rappeler la France dispose d'une richesse linguistique considérable fondée sur la diversité à côté du français, langue nationale, langue commune des citoyens français présente sur les cinq continents, les langues de France constituent un patrimoine culturel unique, unique en Europe, le plus riche 'Europe, une grande diversité les caractèrise, il ya sur le territoire de la République des langues romanes, des langues germaniques, le breton qui est une langue celtique, le basque qui n'est pas une langue indoeuropéenne, voilà pour l'hexagone et puis les créoles, les langues amérindiennes, es langues polynésiennes, les langues austronésienne, parlées par un nombre très variable de citoyen, l'arabe dialectal ont 3 ou 4 millions de locuteurs en France, en revanche le mecu ne conmpte que quelques dizaines de locuteurs en Nouvelle Calédonie. C'est dire la richesse et la variété des parlers sur le territoire de la République. Ce patrimoine est trop souvent méconnue et si les archives sonores existent désormais pour la quasi totalité de ces langues, cette richesse constitué du français parlé mais aussi de la diversité des langues en France n'était accessible jusqu'ici ni à l'ensemble de la communauté scientifique ni au grand public. Plus grave encore de nombreux documents sonores conservés sur des supports physiques en fin de vie (enregistrement sur bandes magnétiques) sont voués à disparaître à tout jamais dans des délais très courts, il s'agit souvent des derniers et des seuls documents dont nous disposons sur des langues de France comme par exemple pour certaines langues de Guyane ou de nouvelles Calédonie, et même sur le français la DGLFLF a numérisé les seuls enregistrements de français constitués par des linguistes dans les années 70, c'est dire la tâche que nous avons devant nous. Aujourd'hui, le progrès de nouvelles technologies, la numérisation offre non seulement la possibilité de sauver ces documents mais aussi la possibilité de les valoriser en les transformant en de véritables ressources linguistiques numériques assurant ainsi la vitalité de cette diversité. Nous nous sommes donc engagés dans une triple démarche, depuis 2004 le MCC travaille à un programme intitulé Corpus de la Parole. La première étape de ce programme était d'ordre méthodologique, il s'agissait de définir les conditions dans lesquels des productions verbales devaient être recueillies à des fins d'études et de recherches .
Loading...
Fichier non déposé

Dates et versions

halshs-01166006, version 1 (21-06-2015)

Identifiants

  • HAL Id : halshs-01166006 , version 1

Citer

Olivier Baude. L’oral un domaine à exploiter. 2008. ⟨halshs-01166006⟩

Collections

UNIV-ORLEANS
63 Consultations
0 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus