Morfetik : une ressource lexicale pour le TAL - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Cahiers de Lexicologie Année : 2009

Morfetik : une ressource lexicale pour le TAL

Michel Mathieu-Colas
  • Fonction : Auteur
  • PersonId : 864850

Résumé

Le traitement automatique des langues exige au préalable un recensement lexical aussi rigoureux et complet que possible. Dans ce but, nous avons élaboré un dictionnaire morphologique du français qui sert de point de départ à un ensemble modulaire (Morfetik) incluant un moteur de flexion, des interfaces de consultation et des outils d'exploitation. C'est le dictionnaire de base qui est ici décrit (le lexique des mots simples). Les données, établies à partir de nombreuses sources lexicographiques, sont structurées sous forme de tables. Pour les mots les plus complexes – noms, adjectifs et verbes –, deux grilles complémentaires ont été élaborées : d'une part des tables de flexion permettant d'identifier et de coder tous les types de formation (pluriels, conjugaisons, etc.), d'autre part des tables attribuant à chaque lemme le code flexionnel correspondant. A partir de cette double représentation, le moteur de flexion peut produire l'ensemble de toutes les formes fléchies. La ressource lexicale qui est à la base de Morfetik se caractérise par son ampleur (plus de 100 000 lemmes recensés et codés), la précision des informations et son évolutivité. Selon le même principe, nous terminons la mise au point d'un dictionnaire des mots composés.
Fichier principal
Vignette du fichier
Morfetik.pdf (75.31 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00433855 , version 1 (20-05-2010)

Identifiants

  • HAL Id : halshs-00433855 , version 1

Citer

Michel Mathieu-Colas. Morfetik : une ressource lexicale pour le TAL. Cahiers de Lexicologie, 2009, 94, pp.137-146. ⟨halshs-00433855⟩
449 Consultations
368 Téléchargements

Partager

Gmail Facebook X LinkedIn More