Skip to Main content Skip to Navigation
Conference papers

Lexicométrie et analyse médiatique : une étude de cas sur la protection des données personnelles

Résumé : Notre proposition s'inscrit dans le cadre de recherches menées au carrefour des Sciences de l'Information et de la Communication, des Sciences du Langage et plus spécifiquement du Traitement Automatique des Langues (Abney 2011) et de la linguistique textuelle (Adam 2011), et de l'analyse textuelle en sociologie (Demazière et al. 2006). Ce travail s'appuie sur des travaux réalisés dans le cadre du projet ANR Lyrics (http://projet.lyrics.orange-labs.fr/) dont l'objet porte sur la protection de la vie privée et les services mobiles sans contact. Dans ce cadre, nous continuons de développer une méthodologie instrumentée proposée dans (Juanals & al. 2012, Lafrechoux & al. 2012) en l'enrichissant notamment par une analyse lexicométrique du traitement médiatique de l'information. L'apport de cette analyse lexicométrique vise à nous permettre un passage à l'échelle pour le traitement de grandes masses de données textuelles en vue de répondre à différentes questions au centre du projet Lyrics. Comment les informations et les débats autour de la protection de la vie privée liée à l'accès mobile sont-elles mises en scène dans les médias ; quels sont les thèmes récurrents et les controverses émergentes, quels sont les acteurs impliqués ? Notre approche repose sur le traitement d'observables (les textes médiatiques) et nécessite la constitution d'un corpus dont la composition repose sur des critères éditoriaux et langagiers et sur l'identification d'acteurs. L'article est divisé en trois parties. Au cours de la première, on reviendra sur la problématique de la constitution semi-automatique d'un corpus et sa nécessaire curation. Au cours de la deuxième partie, on reviendra d'une part, sur le choix de l'outil d'analyse, en l'occurrence le logiciel Calliope (de Saint Leger & al. 2005, Turner & al. 2012) qui est fondé sur la méthode des mots associés, et d'autre part sur les différentes étapes qui nous ont permis de réaliser une extraction terminologique automatisée, de détecter les acteurs, d'obtenir les cartographies des thématiques et les graphes d'influence des acteurs. Et enfin dans une troisième partie nous reviendrons sur l'interprétation de ces cartes, leur analyse comparée et sur les éventuelles remises en cause d'hypothèses qu'elles impliquent. Nous proposons de développer une heuristique permettant de s'affranchir, du moins en partie, des contraintes de l'outil utilisé en argumentant nos choix.
Complete list of metadata

https://halshs.archives-ouvertes.fr/halshs-00834979
Contributor : Jean-Luc Minel <>
Submitted on : Monday, June 17, 2013 - 5:09:20 PM
Last modification on : Tuesday, March 2, 2021 - 10:01:57 AM

Identifiers

  • HAL Id : halshs-00834979, version 1

Citation

Mathilde de Saint Léger, Brigitte Juanals, Jean-Luc Minel. Lexicométrie et analyse médiatique : une étude de cas sur la protection des données personnelles. Usages de la lexicométrie en sociologie, Jun 2013, Saint-Quentin-en-Yveline, France. ⟨halshs-00834979⟩

Share

Metrics

Record views

539