Construction de ressources sémantiques pour l'amélioration de la qualité du clustering de messages courts - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2016

Construction de ressources sémantiques pour l'amélioration de la qualité du clustering de messages courts

Résumé

Prendre en compte l'aspect sémantique des données textuelles lors de la tâche de classification s'est imposé comme un réel défi ces dix dernières années. Cette difficulté vient s'ajouter au fait que la plupart des données disponibles sur les réseaux sociaux sont des textes courts, ce qui a notamment pour conséquence de rendre les méthodes basées sur la représentation "bag of words" peu efficientes. La plupart des approches présentes dans la littérature utilisent des connaissances externes comme wikipedia afin d'enrichir les messages courts avant la tâche de classification. Dans cet article, nous proposons la création de ressources permettant d'enrichir les messages courts afin d'améliorer la performance des méthodes de classification non supervisée. Pour constituer ces ressources, nous utilisons des techniques de fouille de données séquentielles.
Fichier principal
Vignette du fichier
IC2016_paper_40_ConstructionRessourcesSem.pdf (263.91 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-01359862 , version 1 (05-09-2016)

Licence

Paternité - Pas d'utilisation commerciale

Identifiants

  • HAL Id : halshs-01359862 , version 1

Citer

Mahaman Sanoussi Yahaya Alassa. Construction de ressources sémantiques pour l'amélioration de la qualité du clustering de messages courts. 27es Journées francophones d'Ingénierie des Connaissances (IC2016), Jun 2016, Montpellier, France. ⟨halshs-01359862⟩
169 Consultations
203 Téléchargements

Partager

Gmail Facebook X LinkedIn More