On Computational Stylistics: Mining Literary Texts for the Extraction of Characterizing Stylistic Patterns

Résumé : Notre thèse se situe dans le domaine interdisciplinaire de la stylistique computationnelle, à savoir l'application des méthodes statistiques et computationnelles à l'étude du style littéraire. Historiquement, la plupart des travaux effectués en stylistique computationnelle se sont concentrés sur les aspects lexicaux. Dans notre thèse, l’accent est mis sur l'aspect syntaxique du style qui est beaucoup plus difficile à analyser étant donné sa nature abstraite. Comme contribution principale, dans cette thèse, nous travaillons sur une approche à l'étude stylistique computationnelle de textes classiques de littérature française d'un point de vue herméneutique, où découvrir des traits linguistiques intéressants se fait sans aucune connaissance préalable. Plus concrètement, nous nous concentrons sur le développement et l'extraction des motifs morphosyntaxiques. Suivant la ligne de pensée herméneutique, nous proposons un processus de découverte de connaissances pour la caractérisation stylistique accentué sur la dimension syntaxique du style et permettant d'extraire des motifs pertinents à partir d'un texte donné. Ce processus proposé consiste en deux étapes principales, une étape d'extraction de motifs séquentiels suivi de l'application de certaines mesures d'intérêt. En particulier, l'extraction de tous les motifs syntaxiques possibles d'une longueur donnée est proposée comme un moyen particulièrement utile pour extraire des caractéristiques intéressantes dans un scénario exploratoire. Nous proposons, évaluons et présentons des résultats sur les trois mesures d'intérêt proposées, basée chacune sur un raisonnement théorique linguistique et statistique différent.
Type de document :
Thèse
Document and Text Processing. Pierre et Marie Curie, Paris VI, 2016. English
Liste complète des métadonnées

https://hal.sorbonne-universite.fr/tel-01493312
Contributeur : Mohamed Amine Boukhaled <>
Soumis le : mardi 21 mars 2017 - 12:31:17
Dernière modification le : mercredi 21 mars 2018 - 18:58:09
Document(s) archivé(s) le : jeudi 22 juin 2017 - 12:53:07

Identifiants

  • HAL Id : tel-01493312, version 1

Collections

Citation

Mohamed Amine Boukhaled. On Computational Stylistics: Mining Literary Texts for the Extraction of Characterizing Stylistic Patterns. Document and Text Processing. Pierre et Marie Curie, Paris VI, 2016. English. 〈tel-01493312〉

Partager

Métriques

Consultations de la notice

197

Téléchargements de fichiers

293