La transcription, entre donnée primaire et donnée secondaire L’empreinte du transcripteur en question - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

La transcription, entre donnée primaire et donnée secondaire L’empreinte du transcripteur en question

Résumé

Quarante ans après les travaux de Ochs (1979) qui précisait que toute transcription est empreinte de théorie, celle-ci reste une façon de mettre en perspective les conditions de production des données offertes à l’analyse linguistique. La difficulté majeure réside dans la représentation graphique, cette forme de codage qui ne peut se ramener à la notation conventionnelle de la langue écrite. A cette difficulté s’ajoute une deuxième quand il s’agit d’un grand corpus oral, impliquant une masse de données volumineuse. Enfin, l’enjeu de l’interopérabilité des données apporte une troisième difficulté : la transcription produit-elle des données secondaires résultant d’une forme d’analyse ou doit-elle être considérée comme une donnée primaire, source de l’étude ? Ces pratiques de transcription, contraintes par des choix théoriques, des normes sociales et des formats technologiques mais relevant aussi de pratiques individuelles offrent par-delà l'observation de celles-ci, une définition de l'objet scientifique "langue" appréhendé par les habitus linguistiques. Dans le projet ESLO, pour tout enregistrement, trois versions de transcriptions sont effectuées par trois transcripteurs différents et toutes sont rendues disponibles. Les procédures ont évolué au fil des années pour aboutir à une répartition des tâches claire qui priorise, selon les versions, la segmentation, l’orthographe, l’application des conventions, la transcription des passages marqués comme “inintelligibles” ou l’anonymisation. Avec une telle procédure, le temps moyen de travail estimé pour effectuer la transcription d’un enregistrement dans ses trois versions est de 20 heures. La transcription constitue donc une phase essentielle de la chaîne de traitement du corpus et ce, sur plusieurs plans : •celui du temps de travail du transcripteur (11.000 heures de travail dédiées aux transcriptions d’ESLO1 et ESLO2), •celui du temps consacré à la formation des transcripteurs et au suivi de leur travail (questions/réponses par mail, échanges de fichiers, vérifications du travail rendu), •celui de l’enjeu de fournir une version validée la plus aboutie possible par rapport aux conventions et objectifs donnés, et de rendre disponibles les trois versions. Le transcripteur tient ainsi une place centrale dans le projet. Il est celui qui se retrouve entre l’enregistrement et le chercheur et c’est justement cet auditeur particulier qui nous intéresse. Nous souhaitons mettre en évidence dans quelle mesure les transcriptions et tout particulièrement les variations observées dans ces dernières sont influencées par les caractéristiques sociales des transcripteurs ainsi que par leur rapport à l’écrit et à la norme Dans ce but, nous avons mis en place un module dédié aux transcripteurs qui prend la forme d’entretiens semi-directifs autour de ces questions. Pour l’heure, sept entretiens ont été réalisés et sont en cours d’analyse. Il s’agit d’abord d’établir une échelle qui prend en compte les différents paramètres questionnés afin de proposer, pour chacun, une catégorisation de ses pratiques et représentations. L’objectif à terme étant de mettre en parallèle ces informations avec les variations de transcriptions observées. Ainsi l’étude des conditions de production des transcriptions permet une approche inattendue de la variation linguistique et ouvre des perspectives pour des analyses linguistiques qui ne refoulent pas la valeur sociale de la langue.

Domaines

Linguistique
Fichier non déposé

Dates et versions

halshs-03405068 , version 1 (27-10-2021)

Identifiants

  • HAL Id : halshs-03405068 , version 1

Citer

Linda Hriba, Layal Kanaan-Caillol, Olivier Baude, Céline Dugua. La transcription, entre donnée primaire et donnée secondaire L’empreinte du transcripteur en question. 50 ans de linguistique sur corpus oraux : apports à l’étude de la variation, Nov 2018, Orléans, France. ⟨halshs-03405068⟩
362 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More