Le dictionnaire comme genre ou comme ressource - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Le dictionnaire comme genre ou comme ressource

Résumé

De nombreuses expériences dans le domaine de la linguistique informatique recourent aux dictionnaires comme à des « corpus » à partir desquels il devient possible d'inférer des relations et des structures sémantiques à l'échelle de la langue. Ce recours aux dictionnaires – et plus particulièrement aux dictionnaires de synonymes – dans le traitement automatique des langues s'est accru récemment avec la diffusion de méthodologies issues de la théorie des graphes (Gaume et al., 2002; Ploux & Victorri, 1998, etc.).
Dans ces expériences, les dictionnaires ne sont plus utilisés comme l'aboutissement et la stabilisation d'une description (la description lexicologique), mais comme une « matière première » à informer, sur laquelle se fondent de nouvelles descriptions impliquant d'autres objectifs (notamment psycholinguistiques et cognitifs). Un aboutissement descriptif devient donc le point de départ d'une nouvelle construction ; ce qui est, somme toute, une situation banale de la description en sciences humaines, où l'on n'accède jamais à une matière qui n'ait pas déjà été informée d'interprétations.
Or, autant les règles de lecture et d'interprétation d'un dictionnaire en tant que résultat d'une description sont bien connues, et s'appuient sur une longue tradition d'élaboration de conventions, autant les règles d'interprétation et d'utilisation d'un dictionnaire comme source d'un dispositif descriptif quantitatif sont largement méconnues. Le dictionnaire n'est pas une abstraction mais un texte relevant d'un genre, et à ce titre, il est difficile d'en dériver des taxinomies spontanées sans tenir compte des propriétés liées à ce genre.

Cette proposition de communication se donne donc pour objectif d'examiner l'incidence des propriétés génériques du dictionnaire sur la construction de dispositifs descriptifs quantitatifs recourant à des dictionnaires. On montrera que l'examen de ces dispositifs dans cette perspective permet, en retour, de proposer de nouveaux indicateurs pour caractériser et décrire les dictionnaires en tant que textes.
Les expériences auxquelles nous nous limiterons recourent à la théorie des graphes comme outil de modélisation du dictionnaire. Nous montrerons tout d'abord qu'un grand nombre de graphes peuvent être dérivés d'un dictionnaire (il peut représenter les relations « mots vedettes » - mots de la glose » ou les relations entre mots d'une même glose ; il peut être orienté, bipartite ; se fonder sur différentes parties de chaque article, etc.). De plus, les différents types de dictionnaires (trésors, généralistes, pour enfants) produisent également des graphes ayant des topologies différentes.
Notre analyse s'appuiera sur des indicateurs couramment utilisés dans la manipulation de graphes, comme les distributions des degrés des noeuds, le taux de clustering ou l'intermédiarité (Newman, 2003) ou la distribution du nombre de définitions (Cooper, 2005). Certains de ces indicateurs reprennent d'ailleurs des observations déjà connues. Les relations entre fréquence d'un mot et nombre de définitions ont par exemple été observé pour la première fois par G. Zipf (1949, cf. Manning & Schütze, 1999, p. 27).

Sur ces bases comparatives, nous montrerons que la recherche d'une correspondance entre catégories sémantiques et propriétés topologiques des graphes de dictionnaire est difficile à faire aboutir. Alors que de nombreuses interprétations sur la structure profonde du lexique ont été produites sur la base de graphes de dictionnaires (hypothèse continuiste de S. Ploux (1998), hypothèse sur l'acquisition de K. Duvignau (2002)), aucune mise en correspondance fine de la topologie d'un graphe de dictionnaire avec une typologie sémantique n'a encore été proposée. La recherche d'une telle articulation entre le modèle mathématique et les outils descriptifs, qui permettrait de raisonner et de contrôler l'interprétation de ces données, montre qu'un graphe de dictionnaire est un « mélange » de plusieurs graphes, une superposition de plusieurs typologies (structuration en domaines lexicaux, en classes sémantiques locales, en niveaux diaphasiques, etc.), qui reflète ses propriétés en tant que genre.
Fichier non déposé

Dates et versions

halshs-00284328 , version 1 (02-06-2008)

Identifiants

  • HAL Id : halshs-00284328 , version 1

Citer

Philippe Gréa, Sylvain Loiseau. Le dictionnaire comme genre ou comme ressource. Lexicographie et informatique : bilan et perspectives, Jan 2008, Nancy, France. ⟨halshs-00284328⟩
90 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More