Normes de saisie et de dépouillement des textes politiques - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Cahier du CERAT Année : 1990

Normes de saisie et de dépouillement des textes politiques

Résumé

Présentation des procédures de saisie et de dépouillement des textes politiques en vue de leur analyse lexicométrique. La première partie présente la norme de Saint-Cloud qui unifie la saisie et le traitement des "types" ou "formes graphiques". Elle édicte également les règles de reconnaissance des mots composés et des locutions figées. La seconde partie présente la "norme Muller" régissant la lemmatisation. Cette opération consiste à ajouter à chaque occurence du texte une forme canonique et un code grammatical à la manière d'une entrée de dictionnaire. Le rapport présente les règles de résolution des homographies du groupe verbal, du nom et des mots invariables. Dans ces différentes opérations, l'opérateur est assisté par l'ordinateur grâce à une série de programmes informatiques. En annexes, le rapport comporte des tables récapitulatives (mots composés et locutions, désinences du verbe, homographies des participes, des autres formes verbales, des substantifs...) ; une présentation de la méthode de calcul de l'indice de répartition utilisé pour mesurer la régularité d'apparition d'un mot dans un corpus ; un index des principales homographies traitées dans l'ouvrage.
Fichier principal
Vignette du fichier
LabbeNormes.pdf (1.19 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00437150 , version 1 (29-11-2009)

Identifiants

  • HAL Id : halshs-00437150 , version 1

Citer

Dominique Labbé. Normes de saisie et de dépouillement des textes politiques. Cahier du CERAT, 1990, 7, pp.1-135. ⟨halshs-00437150⟩

Collections

UGA CNRS
267 Consultations
1484 Téléchargements

Partager

Gmail Facebook X LinkedIn More