Segmentation des corpus chronologiques : 143 ans de discours gouvernemental au Québec - HAL Accéder directement au contenu
Communication dans un congrès Année : 2010

Segmentation des corpus chronologiques : 143 ans de discours gouvernemental au Québec

Résumé

A method for segmenting large textual corpora in uniform periods. Firstly, vocabulary growth is adjusted by calculating the trend. Then a segmentation algorithm, associated with validity tests, indicates the optimal succession in distinct periods. This method is applied to the "Queen's speeches" which have been given by the Quebec government at the beginning of each parliamentary session since 1867 and up until 2009.
Méthode originale pour segmenter un corpus chronologique en périodes homogènes. On calcule l'accroissement du vocabulaire et son ajustement par une tendance. Un algorithme de segmentation associé à des tests de validité donne le découpage optimal du corpus. Une série d'indicateurs mesure l'ampleur des mouvements de vocabulaire caractérisant chacune des périodes. Application aux déclarations du gouvernement québécois à l'ouverture de chaque session du parlement provincial de 1867 à 2009.
Fichier principal
Vignette du fichier
MoniereLabbeJADT2010.pdf ( 133.62 Ko ) Télécharger
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00495784, version 1 (29-06-2010)

Identifiants

  • HAL Id : halshs-00495784 , version 1

Citer

Denis Monière, Dominique Labbé. Segmentation des corpus chronologiques : 143 ans de discours gouvernemental au Québec. 10th International Conference Statistical Analysis of Textual Data, Jun 2010, Rome, Italie. pp.805-816. ⟨halshs-00495784⟩
142 Consultations
146 Téléchargements
Dernière date de mise à jour le 13/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus