Enriching a Text by Semantic Disambiguation for Information Extraction - HAL Accéder directement au contenu
Communication dans un congrès Année : 2002

Enriching a Text by Semantic Disambiguation for Information Extraction

Résumé

External linguistic resources have been used for a very long time in information extraction. These methods enrich a document with data that are semantically equivalent, in order to improve recall. For instance, some of these methods use synonym dictionaries. These dictionaries enrich a sentence with words that have a similar meaning. However, these methods present some serious drawbacks, since words are usually synonyms only in restricted contexts. The method we propose here consists of using word sense disambiguation rules (WSD) to restrict the selection of synonyms to only these that match a specific syntactico-semantic context. We show how WSD rules are built and how information extraction techniques can benefit from the application of these rules.
Des ressources linguistiques externes ont été exploitées depuis longtemps en extration d'information. Ces méthodes enrichissent un document en y ajoutant des données sémantiquement équivalentes aux informations originales, afin d'améliorer le rappel. Par exemple, certaines de ces approches exploitent des dictionnaires de synonymes pour ajouter aux phrases des mots de signification proche. Cependant, cette technique présente certains désavantages, car ces mots sont habituellement synonymes seulement dans certains contextes. Nous proposons une méthodologie qui utilise un système de désambiguïsation sémantique pour restreindre la sélection des synonymes et conserver seulement ceux qui correspondent au contexte syntaxico-sémantique. Nous montrons comment les règles de désambiguïsation sémantiques sont construites et dans quelle mesure les techniques d'extraction d'information peuvent profiter de l'application de ces règles.
Fichier principal
Vignette du fichier
JacqueminAlLREC02.pdf ( 155.6 Ko ) Télécharger
Loading...

Dates et versions

halshs-00003968, version 1 (20-06-2005)

Licence

Paternité - Pas d'utilisation commerciale - Partage selon les Conditions Initiales - CC BY 4.0

Identifiants

Citer

Bernard Jacquemin, Caroline Brun, Claude Roux. Enriching a Text by Semantic Disambiguation for Information Extraction. Proceeding of the Workshop on Using Semantics for Information Retrieval and Filtering: State of the Art and Future Research (LREC 2002), May 2002, Las Palmas, Canary Islands, Spain. pp.45-51. ⟨halshs-00003968⟩

Relations

Collections

ISC
259 Consultations
247 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Altmetric

Partager

Gmail Facebook Twitter LinkedIn Plus