Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Thèse Année : 2014

The analogical reasoning in lexicography and its computerisation : application to the French Lecial Network

Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français

Résumé

By using theorical and practical advances in computer sciences and linguistics, contemporary lexicography have freed itself from the linear organisation of print publications. It had sought to define new descriptive models and provide henceforth the community with formal and consistent ressources. Such ressources offer many opportunities for natural language processing tasks. This PhD thesis focuses on lexical systems model, which is proposed by Explanatory Combinatorial Lexicography. Specifically, it takes an interest in the the French Lexical Network, presently under development. As lexical system, this ressource is a monolingual graph of lexical units connected by a rich set of lexical relations mainly based on syntactico-semantic Meaning-Text lexical functions. The PhD thesis lays the groundwork for an exploration of this ressource by analogical reasonning. It begins with a selective overview of formalisation and computerisation of analogy in natural language processing. It thus defines the principle of exploration of lexical graph implemented as a grouping of unifiable structures. The nodes in the graph are similar to objects, which have some attributes available in their lexicographic descriptions and edges represent relations. A reflection is conducted on the nature of the various constituents of the graph and the relations between them. The evolution of the resource over thirty months is taken into account during the carrying out of this study. It is accompanied by a topological analysis, which highlights properties close to those of small word networks. Then two sets of exploratory experiments are conducted. The first one confirms the belief that the resource formalisation makes it possible to detect automatically analogies consistent with lexicographers'intuition. It highlights the possibility of several kind of analogical explorations, according to entry points and compared pieces of information. It also reveals that this exploration enable us to check the consistency of the resource and to allow lexical rules to emerge. The second set of experiments is focused around the concept of lexical derivation configurations. It shows how grouping of analogous subgraphs reveals recurrent lexical connections through the resource. The progress status of the resource doesn't enable us to obtain successfully completed rules and models. The results obtained are nontheless encouraging. Analogy can already be considered as a guide to ensure the quality of lexical resources. It also allows for the acquisition of knowledge about its organisation. Such knowledge can be used to identify linguitic phenomena and to design instruments to support lexicographic activity.
La lexicographie contemporaine, en mettant à profit les avancées théoriques et pratiques de l'informatique et de la linguistique, s'est affranchie de l'organisation linéaire imposée par les ouvrages papier. Elle s'est attachée à définir de nouveaux modèles de description et met aujourd'hui à disposition de la communauté des ressources formelles et cohérentes offrant de multiples possibilités d'exploitations automatiques. Cette thèse concentre son attention sur le modèle des systèmes lexicaux proposé par la Lexicographie Explicative et Combinatoire. Plus précisément, elle s'intéresse au Réseau Lexical du Français, en cours de développement. En tant que système lexical, cette ressource est un graphe lexical monolingue. Elle est constituée d'un ensemble de sommets, les unités lexicales du français, entre lesquels sont encodées de nombreuses relations, en grande majorité syntaxico-sémantiques. La présente thèse pose les bases d'une exploration de cette ressource lexicographique par raisonnement analogique. Elle débute par une revue sélective de la formalisation et de l'informatisation de l'analogie en traitement automatique des langues, dans le cas précis de l'étude du lexique. Elle définit ainsi le principe de l'exploration réalisée comme un regroupement de structures unifiables. Les sommets du graphe lexical s’apparentent alors à des objets disposant d’un certain nombre d’Attributs, disponibles dans leur description lexicographique. Ils entretiennent des Relations, représentées par les arcs. Une réflexion est menée sur la nature des différents éléments composant le réseau et sur les différents rapports qu'ils entretiennent entre eux. Elle est réalisée en prenant en compte l'évolution de la ressource sur une période de trente mois. Elle est accompagnée d'une analyse topologique, qui met en avant des propriétés proches de celles des graphes petit monde. Deux séries d'expériences exploratoires sont ensuite réalisées. La première d'entre elles permet de conforter l'idée selon laquelle la formalisation en oeuvre dans la ressource permet de détecter automatiquement des analogies conformes à l'intuition des locuteurs. Elle met en avant la possibilité de réaliser différents types d'exploration par raisonnement analogique, en fonction des points d'entrée et des éléments d'informations comparés. Elle montre également l'apport de telles explorations en terme de vérification de la cohérence du réseau et d'émergence de règles lexicales. La seconde série d'expériences se concentre autour de la notion de configurations de dérivations lexicales. Elle montre comment le regroupement de sous-graphes analogues met en avant l'existence de connexions lexicales récurrentes à travers la ressource. L'état d'avancement de la ressource exploitée ne permet pas d'obtenir des règles et des modèles aboutis. Les résultats obtenus sont toutefois encourageants. Les observations réalisées nous amènent à considérer l'analogie comme un guide permettant de s'assurer de la bonne qualité de la représentation du lexique proposée par une ressource. Elle permet également d'acquérir automatiquement des connaissances sur son organisation. De telles connaissances permettent d'identifier des phénomènes linguistiques et d'instrumenter l'activité lexicographique.
Fichier principal
Vignette du fichier
theseOllingerS.pdf (3.24 Mo) Télécharger le fichier
marquepage.pdf (1.55 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01751806 , version 2 (21-01-2015)
tel-01751806 , version 1 (29-03-2018)

Identifiants

  • HAL Id : tel-01751806 , version 2

Citer

Sandrine Ollinger. Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français. Linguistique. Université de Lorraine, 2014. Français. ⟨NNT : 2014LORR0330⟩. ⟨tel-01751806v2⟩
625 Consultations
1703 Téléchargements

Partager

Gmail Facebook X LinkedIn More