Modélisation textométrique des textes - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Modélisation textométrique des textes

Résumé

This contribution analyses the data model for textometry (for calculations like the ones in textual statistics (Lebart & Salem, 1994)). It also presents a review of the textual representations proposed by textometric software. Taking into account a linguistic point of view (especially Rastier's textual semantics), it then points out the limits of these representations, and explores new propositions for textual modelization in textometry.
Les statistiques textuelles (ou textométrie) exploitent une représentation du texte sous forme d'une suite d'unités typées, éventuellement réparties entre des subdivisions du corpus. Pour rendre compte et tirer parti de la multiplicité des typages possibles, des logiciels ont mis au point des représentations tabulaires du texte, claires et très efficaces pour la recherche de motifs complexes. Mais les délimitations des unités et des partitions, et la catégorisation des unités, sont encore peu souples, car fortement prédéfinies. De nouvelles modélisations seraient à élaborer, qui élargiraient le rôle accordé aux propriétés, distingueraient des contextes locaux (passages) et globaux (entités), et s'associeraient avec des calculs textométriques adaptés à la caractérisation de corpus structurés, aux unités non uniformes. Nous proposons alors une schématisation des étapes d'un calcul textométrique, qui explicite les multiples sélections en jeu (niveaux de corpus, fond, forme, dimensions de lecture, d'analyse et d'affichage). Puis nous étudions la récente modélisation du texte comme trame et soulignons comment elle innove en relativisant le découpage en formes graphiques ; nous concluons en ébauchant une modélisation du texte comme trace, davantage en accord avec la sémantique différentielle et interprétative de Rastier.
Fichier principal
Vignette du fichier
pincemin_jadt08_texte.pdf (128.17 Ko) Télécharger le fichier
pincemin_jadt08_graph.pdf (457 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Autre

Dates et versions

halshs-00280721 , version 1 (19-05-2008)

Identifiants

  • HAL Id : halshs-00280721 , version 1

Citer

Bénédicte Pincemin. Modélisation textométrique des textes. 9es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2008), Mar 2008, Lyon, France. pp.949-960. ⟨halshs-00280721⟩
286 Consultations
821 Téléchargements

Partager

Gmail Facebook X LinkedIn More