Nouvelles perspectives en extraction d'information

Résumé : L'extraction d'information (EI) est une technologie visant à reconnaître dans un corpus de documents textuels un ensemble d'informations spécifiques, à les extraire et à les structurer dans un format prédéfini. L'EI a connu un essor considérable ces dix dernières années et devrait conduire à des applications industrielles dans un avenir proche. Après une présentation des principes de cette technologie, cet article décrit les travaux menés dans notre groupe sur ce thème. Un système opérationnel, ayant permis d'analyser un corpus de constats d'accidents y est présenté. Nous montrons ensuite comment les techniques de l'EI peuvent être exploitées pour de nouvelles tâches de l'informatique documentaire : encodage sémantique, aide à la lecture, structuration de documents composites. Enfin nous présentons des travaux en sémantique susceptibles d'améliorer les performances des systèmes actuels.
Type de document :
Article dans une revue
Revue des Sciences et Technologies de l'Information - Série TSI : Technique et Science Informatiques, Lavoisier, 2002, 1 (21), pp.37-63
Liste complète des métadonnées

Littérature citée [11 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-00009485
Contributeur : Bernard Victorri <>
Soumis le : mercredi 8 mars 2006 - 17:06:30
Dernière modification le : mardi 5 juin 2018 - 10:14:40
Document(s) archivé(s) le : samedi 3 avril 2010 - 22:43:50

Identifiants

  • HAL Id : halshs-00009485, version 1

Citation

Michel Dupont, Jean-Marc Vuillaume, Bernard Victorri, Patrice Enjalbert, Yann Mathet, et al.. Nouvelles perspectives en extraction d'information. Revue des Sciences et Technologies de l'Information - Série TSI : Technique et Science Informatiques, Lavoisier, 2002, 1 (21), pp.37-63. 〈halshs-00009485〉

Partager

Métriques

Consultations de la notice

894

Téléchargements de fichiers

552