UNE ÉTUDE DE CORPUS POUR LA DÉTECTION AUTOMATIQUE DE THÈMES - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Texte et corpus Année : 2009

UNE ÉTUDE DE CORPUS POUR LA DÉTECTION AUTOMATIQUE DE THÈMES

Laurence Longo
Amalia Todirascu

Résumé

Nous présentons un outil de détection automatique de thèmes, paramétrable selon le genre textuel des documents à traiter (rapports, articles de journal, fiches produits). Cet outil sera utilisé pour optimiser l'indexation et la recherche des documents dans une archive de documents internes à une organisation. Le système hybride de détection de thèmes que nous mettons en place combine des méthodes statistiques et linguistiques pour dégager les thèmes de chaque document. En particulier, pour la détection de thèmes, nous exploitons une catégorie spécifique de marqueurs de cohérence : les chaînes de référence. Dans cet article, nous présentons l'étude d'un corpus composé de divers genres textuels permettant de construire les ressources linguistiques nécessaires à l'identification automatique de ces chaînes de référence.

Domaines

Linguistique
Fichier non déposé

Dates et versions

halshs-01225268 , version 1 (30-11-2015)

Identifiants

  • HAL Id : halshs-01225268 , version 1

Citer

Laurence Longo, Amalia Todirascu. UNE ÉTUDE DE CORPUS POUR LA DÉTECTION AUTOMATIQUE DE THÈMES. Texte et corpus, 2009, 4, pp.143-155. ⟨halshs-01225268⟩

Collections

SITE-ALSACE
87 Consultations
2 Téléchargements

Partager

Gmail Facebook X LinkedIn More