Polysémie et calcul du sens. - HAL Accéder directement au contenu
Communication dans un congrès Le poids des mots, Actes des 7es Journées internationales d'Analyse statistique des Données Textuelles Année : 2004

Polysémie et calcul du sens.

Résumé

Polysemy is a pervasive phenomenon in natural languages, but it remains a vexing issue for natural language
computing. In order to deal with this problem, Victorri and Fuchs (1996) proposed the model of dynamical
construction of meaning. Each polysemic unit is associated to a semantic space. The meaning of the unit in a
given sentence corresponds to a more or less restricted area of the semantic space, resulting from a dynamical
interaction with all other units of the sentence. Ploux and Victorri (1998) designed a software, called Visusyn,
allowing an automatic construction of the semantic space of a polysemic unity. The algorithm is based on the
analysis of a large graph of synonyms (www.unicaen.crisco.fr). Visusyn was extended to take into account the
data from one corpus (base Frantext categorisée). The performance of Visusyn was compared to that of french
speakers in a disambiguation task. The results of this experiment strongly incited us to start a theoretical
mathematic and informatic study of the graph of synonyms. This study will be crucial for a better understanding
of french lexical organisation.
La polysémie est un phénomène omniprésent dans le langage, mais il reste problématique dans le cadre du
traitement automatique des langues. Nous nous proposons d'aborder ce problème à l'aide du modèle de
construction dynamique du sens, proposé par Victorri et Fuchs (1996). On associe à chaque unité polysémique
un espace sémantique. Le sens de l'unité dans un énoncé donné correspond à une région plus ou moins étendue
de cet espace, déterminée par l'interaction dynamique de toutes les unités présentes dans l'énoncé. Ploux et
Victorri (1998) ont développé Visusyn, un logiciel permettant de construire automatiquement l'espace
sémantique d'une unité polysémique. L'algorithme repose sur l'analyse d'un grand graphe de synonymie
(www.unicaen.crisco.fr). Nous avons étendu Visusyn afin qu'il prenne en compte les données issues d'un corpus
(Frantext catégorisée). Nous avons comparé les performances de Visusyn avec celles de locuteurs du français
dans une tâche de désambiguïsation. Les résultats de cette expérience nous ont encouragé à entreprendre une
étude théorique mathématique et informatique du graphe de synonymie. Celle-ci devrait s'avérer cruciale pour
une meilleure compréhension de l'organisation du lexique français.
Fichier principal
Vignette du fichier
JADT_094.pdf ( 438.92 Ko ) Télécharger
Loading...

Dates et versions

halshs-00067871, version 1 (09-05-2006)

Identifiants

  • HAL Id : halshs-00067871 , version 1

Citer

Fabienne Venant. Polysémie et calcul du sens.. Le poids des mots, Actes des 7es Journées internationales d'Analyse statistique des Données Textuelles, 2004, France. ⟨halshs-00067871⟩
182 Consultations
704 Téléchargements
Dernière date de mise à jour le 06/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus