Skip to Main content Skip to Navigation
New interface
Conference papers

Partage d'expérience en textométrie : Étude linguistique diachronique de l'oralité, textométrie sur corpus vidéo, réécriture analytique de corpus.

Résumé : L'exposé présentera la démarche méthodologique et les résultats d'études textométriques réalisées dans le cadre de deux projets différents, l'un sur un corpus d'écrits, l'autre sur des transcriptions d'oral. Il sera l'occasion de rendre compte de scénarios d'analyse possibles et de développements récents pour le logiciel open-source TXM (https://textometrie.org). La première problématique abordée est la caractérisation de l'oralité en ancien et moyen français à partir d'un grand corpus de textes (la Base de français médiéval, http://bfm.ens-lyon.fr), en se basant sur le contraste entre les passages au discours direct par rapport au reste des textes. À partir d'expérimentations progressives, l'analyse s'est affinée en introduisant d'autres dimensions de variation à croiser avec celle du discours direct pour approcher l'oralité : la diachronie, et les domaines et genres de discours. Au plan de la méthodologie textométrique, ce parcours a permis de mettre au point des pratiques et outils de portée plus générale : la gestion de la fiabilité de l'étiquetage, le jeu possible sur la granularité des informations linguistiques, et des modes d'exploration et de visualisation pertinents pour l'étude d'un gradient (c'est à dire d'une dimension de variation se déployant comme un continuum). Le deuxième contexte de recherche évoqué est celui du projet interdisciplinaire ANTRACT (https://antract.hypotheses.org), concernant l'analyse des Actualités françaises, ces journaux d'information d'une dizaine de minutes diffusés dans les salles de cinéma en France, avant le film, de 1945 à 1969. Les données sources sont audiovisuelles mais aussi textuelles (fiches documentaires INA, tapuscrits des commentaires). D'un point de vue textométrique, le "retour au texte", si central dans la méthode, est amené à se généraliser en "retour au document source", ici les vidéos. Cela a conduit à mettre au point l'extension MediaPlayer de TXM, permettant la lecture synchronisée de vidéo en lien direct avec l'exploration des données textuelles. Par ailleurs, l'un des sujets étudiés dans le projet est la standardisation du montage audiovisuel, et la possibilité de mettre en évidence des traits d'une grammaire cinématographique, à partir de la position de certains plans et de la récurrence de certains enchaînements. Cette question été l'occasion d'expérimenter un scénario d'analyse combinant une annotation systématique par requêtes, pour ajouter une représentation analytique au corpus textuel, puis la production d'un corpus centré sur cette représentation analytique, et permettant de travailler directement sur la représentation analytique avec tous les outils textométriques.
Complete list of metadata

https://halshs.archives-ouvertes.fr/halshs-03762995
Contributor : Bénédicte Pincemin Connect in order to contact the contributor
Submitted on : Monday, August 29, 2022 - 11:19:22 AM
Last modification on : Friday, September 2, 2022 - 4:21:35 PM

Annex

Licence


Distributed under a Creative Commons Attribution 4.0 International License

Identifiers

  • HAL Id : halshs-03762995, version 1

Citation

Bénédicte Pincemin. Partage d'expérience en textométrie : Étude linguistique diachronique de l'oralité, textométrie sur corpus vidéo, réécriture analytique de corpus.. Séminaire Praxiling, Laboratoire Praxiling UMR5267, May 2022, Montpellier, France. ⟨halshs-03762995⟩

Share

Metrics

Record views

26

Files downloads

1