Le programme Mogador en linguistique formelle arabe et ses applications dans le domaine de la recherche et du filtrage sémantique - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Pré-Publication, Document De Travail Année : 2012

Le programme Mogador en linguistique formelle arabe et ses applications dans le domaine de la recherche et du filtrage sémantique

Résumé

The MOGADOR project aims at devolopping a new approach to Arabic Natural Langage Processing, by designing software tools based on an original description of Arabic grammar that gives top priority to its tool-words (in a redefined definition). These 'tool-words', that do not derivate from the standard morphological system, trigger off expectations at both syntactic and semantic levels, and thus constrain the sentence either locally or globally. Based on our theoretical and algorithmic work in morphological analysis, electronic dictionaries and proof software in corpora analysis and Information Retrieval, we plan to make available a new generation of filters featuring limited complexity. We propose steps in both theoretical and software fields, with the design of new parsers and software proof tools. These filters could be embedded in search tools boosting them with the results of new linguistic analysis, which have become essential considering the recent boom of the Arabic Web.
Développer une approche nouvelle du traitement automatique de l’arabe fondés sur une modélisation originale de la grammaire arabe donnant la priorité aux mots-outils (redéfinis), est l'ambition du programme MOGADOR. Échappant au système de dérivation, ces mots-outils induisent des attentes syntaxiques voire sémantiques contraignant localement et/ou globalement la phrase. Forts de nos développements algorithmiques et applicatifs en analyse morphologique, en dictionnaires électroniques et en démonstrateurs dans le domaine de l'analyse de corpus et de la recherche d'informations, nous projetons, par des développements théoriques, la construction de nouveaux analyseurs et des mises en œoeuvre concrètes, de rendre possibles de nouvelles méthodes de filtrage à complexité maîtrisée. Ces filtres pourront être couplés à des moteurs de recherche, dopant ces derniers par des analyses linguistiques qui sont devenues nécessaires depuis l'explosion du Web en langue arabe.
Fichier principal
Vignette du fichier
Mogador_Jaccarini_Gaubert.pdf (2.75 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00912009 , version 1 (02-12-2013)

Identifiants

  • HAL Id : halshs-00912009 , version 1

Citer

André Jaccarini, Christian Gaubert. Le programme Mogador en linguistique formelle arabe et ses applications dans le domaine de la recherche et du filtrage sémantique. 2012. ⟨halshs-00912009⟩
223 Consultations
818 Téléchargements

Partager

Gmail Facebook X LinkedIn More