Traces de l’orale dans les forums du Web

Résumé : L’Internet et les nouvelles technologies ont permis une nouvelle forme de communication, le discours dialogique, présente dans les réseaux sociaux, les forums, les chats, etc. Il s’agit des discussions menées instantanément par deux ou plusieurs personnes. Beaucoup de travaux en linguistique portent sur l’analyse de ces nouvelles formes de communication écrite. Les études sur la communication électronique ont été inaugurées dans les années 2000 par (Anis 1999, 2006). Elles ont été poursuivies par beaucoup d’autres chercheurs dans les domaines différents (Véronis et Guimier De Neef 2006, Lorenz 2013, Longhi 2012, 2013, Honeycutt et Herring 2009, Java et al. 2007). Ce domaine de recherche se structure et les premières journées internationales de recherche sur les Médias sociaux et les corpus de communication médiée par les réseaux (CMR) se sont tenues à Rennes les 23-24 octobre 2015. Le discours de CMR est également au centre du travail présenté. L’objectif de ce travail est de comparer ce discours que nous appelons « discours dialogique du Web » avec le discours oral. L’hypothèse de départ est que le discours dialogique écrit est une sorte de discours oral transcrit qui contient, par conséquent, différentes traces de l’oral. Une première comparaison entre l’oral et l’écrit dialogique a été déjà montrée au CMLF 2016 dans le cadre de l’étude portant sur les reformulations dans les entretiens du corpus oral ESLO et dans le forum de santé Doctissimo (Eshkol-Taravella et Grabar, 2016). La communication actuelle vise cette fois d’approfondir cette réflexion et de démontrer cette hypothèse sur le corpus issus du Web, en se concentrant sur les marques de l’oral observables dans les corpus issus de CMR. L’étude fait partie du domaine de linguistique de corpus. L’approche est fondée sur l’annotation manuelle préalable de différentes marques ou traces de l’oral dans le corpus de discussions sur le forum de santé. La typologie effectuée comprend par exemple : les marqueurs de discours propres à l’oral comme bon, quoi, etc. ; interjection hein, euh etc., ; les signes typographiques comme !!!, :) ou les émoticônes  qui sont les expressions de sentiments et d’émotions, manifestées à l’oral par la prosodie ; les signes typographiques …, etc. qui marquent des pauses ou des hésitations à l’écrit. Notons déjà que certains fils de discussions ne contiennent pas du tout de signes propres à l’écrit, comme les points ou les virgules pour la fin des phrases ou des propositions, ou encore les majuscules pour le début de phrases ou de noms propres : « s »alut tous le monde j'ai 34 ans et depuis 10 ans maintenants je souffre d'extrasystole elle viennent par periode dure quelque jours voir quelques semaine mais a chaque fois c'est la meme chose je vais en cardio et la c'est toujour la meme reponse ce n'est pas grave vous n'avez rien et hop on vous fout dehors en s'en excuserai presque de les avoir derangé je trouve qu'il n'y a pas assez de prise en charge des personnes comme nous et franchement j'en ai vraiment marre j'ai tous fait echo cardiaque r.a.s holter r.a.s on me dit que c'est le stress le stress de quoi il m'arive de les avoir meme quand tous va bien bref je ne sait plus quoi faire si vous avez les memes problemmes que moi c’est-à-dire des extrasystole ventriculaire et que vous avez trouvé le moyen de les calmer aidé moi s'il vous plait parceque la je n'en peut vraiment plus. » Ces fils sans la ponctuation segmentant le discours ressemblent beaucoup aux transcriptions de l’oral. En effet, les conventions de transcription interdisent l’utilisation de signes de ponctuation ou de majuscule pour le début de tour de parole. Selon les (Blanche-Benveniste et Jeanjean, 1987), en ponctuant, le transcripteur « suggère une analyse avant de l’avoir faite » (p. 142). La segmentation est faite soit sur une unité intuitive de type « groupe de souffle » repérée par le transcripteur humain, soit sur un « tour de parole », défini uniquement par le changement de locuteur. Le manque de segmenteurs de discours dans les fils de discussions peut être expliqué par la taille souvent courte de message posté ou par l’état émotionnel du scripteur, un phénomène assez caractéristique des forums de santé. Même si l’orthographe laisse souvent à désirer, un autre fait marquant concerne la phonétisation de l’écriture. Par exemple, les accords de genre ou de personne sont essentiellement présents pour les formes où ces accords sont phonétisés à l’oral : les extrasystoles viennent et dure ou le pronom ces dans l’exemple qui suit : « TU n'as pas le même soin; et tous ces bien passées à la maison, par la je veux dire aucun faux mouvement, mais je n'ai pas eu la qualité du kiné et cela a servi a rien » Toutes ces marques seront annotées et étudiées du point de vue quantitatif et qualitatif. L’étude proposée vise de démontrer que les discussions sur le forum est un cas de discours spontané libre et elles peuvent, sur ce point, être comparées à un discours oral. La contribution s’inscrit dans la troisième thématique du colloque. Après avoir introduit le contexte de la recherche menée et les données traitées, nous présenterons, dans la première partie de la communication, la typologie des marqueurs de l’oral présents dans le discours dialogique du Web. Les conventions et la méthodologie d’annotation seront développées dans la deuxième partie. L’analyse quantitative et qualitative des données annotées sera explicitée dans la partie suivante. La communication conclura sur les résultats obtenus et les perspectives envisagées.
Type de document :
Communication dans un congrès
CILF 2018 Marques d’oralité et représentation de l’oral en français, Oct 2018, Madrid, Espagne
Liste complète des métadonnées

https://halshs.archives-ouvertes.fr/halshs-01968334
Contributeur : Natalia Grabar <>
Soumis le : lundi 14 janvier 2019 - 09:53:11
Dernière modification le : mercredi 16 janvier 2019 - 01:25:55

Identifiants

  • HAL Id : halshs-01968334, version 1

Collections

Citation

Iris Eshkol-Taravella, Natalia Grabar. Traces de l’orale dans les forums du Web. CILF 2018 Marques d’oralité et représentation de l’oral en français, Oct 2018, Madrid, Espagne. 〈halshs-01968334〉

Partager

Métriques

Consultations de la notice

19