Modélisation textométrique des textes

Résumé : Les statistiques textuelles (ou textométrie) exploitent une représentation du texte sous forme d'une suite d'unités typées, éventuellement réparties entre des subdivisions du corpus. Pour rendre compte et tirer parti de la multiplicité des typages possibles, des logiciels ont mis au point des représentations tabulaires du texte, claires et très efficaces pour la recherche de motifs complexes. Mais les délimitations des unités et des partitions, et la catégorisation des unités, sont encore peu souples, car fortement prédéfinies. De nouvelles modélisations seraient à élaborer, qui élargiraient le rôle accordé aux propriétés, distingueraient des contextes locaux (passages) et globaux (entités), et s'associeraient avec des calculs textométriques adaptés à la caractérisation de corpus structurés, aux unités non uniformes. Nous proposons alors une schématisation des étapes d'un calcul textométrique, qui explicite les multiples sélections en jeu (niveaux de corpus, fond, forme, dimensions de lecture, d'analyse et d'affichage). Puis nous étudions la récente modélisation du texte comme trame et soulignons comment elle innove en relativisant le découpage en formes graphiques ; nous concluons en ébauchant une modélisation du texte comme trace, davantage en accord avec la sémantique différentielle et interprétative de Rastier.
Type de document :
Communication dans un congrès
Heiden, Serge & Pincemin, Bénédicte. 9es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2008), Mar 2008, Lyon, France. Presses Universitaires de Lyon, 2, pp.949-960, 2008
Liste complète des métadonnées

https://halshs.archives-ouvertes.fr/halshs-00280721
Contributeur : Bénédicte Pincemin <>
Soumis le : lundi 19 mai 2008 - 15:53:32
Dernière modification le : mercredi 22 juin 2016 - 01:05:23
Document(s) archivé(s) le : vendredi 28 mai 2010 - 18:08:27

Identifiants

  • HAL Id : halshs-00280721, version 1

Collections

Citation

Bénédicte Pincemin. Modélisation textométrique des textes. Heiden, Serge & Pincemin, Bénédicte. 9es Journées internationales d'Analyse statistique des Données Textuelles (JADT 2008), Mar 2008, Lyon, France. Presses Universitaires de Lyon, 2, pp.949-960, 2008. <halshs-00280721>

Partager

Métriques

Consultations de
la notice

254

Téléchargements du document

194