Normes de saisie et de dépouillement des textes politiques
Résumé
Présentation des procédures de saisie et de dépouillement des textes politiques en vue de leur analyse lexicométrique. La première partie présente la norme de Saint-Cloud qui unifie la saisie et le traitement des "types" ou "formes graphiques". Elle édicte également les règles de reconnaissance des mots composés et des locutions figées. La seconde partie présente la "norme Muller" régissant la lemmatisation. Cette opération consiste à ajouter à chaque occurence du texte une forme canonique et un code grammatical à la manière d'une entrée de dictionnaire. Le rapport présente les règles de résolution des homographies du groupe verbal, du nom et des mots invariables. Dans ces différentes opérations, l'opérateur est assisté par l'ordinateur grâce à une série de programmes informatiques. En annexes, le rapport comporte des tables récapitulatives (mots composés et locutions, désinences du verbe, homographies des participes, des autres formes verbales, des substantifs...) ; une présentation de la méthode de calcul de l'indice de répartition utilisé pour mesurer la régularité d'apparition d'un mot dans un corpus ; un index des principales homographies traitées dans l'ouvrage.
Domaines
Science politique
Origine :
Fichiers produits par l'(les) auteur(s)
Loading...