Chaîne de traitement linguistique : du repérage d'expressions temporelles au peuplement d'une ontologie de tourisme - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2009

Chaîne de traitement linguistique : du repérage d'expressions temporelles au peuplement d'une ontologie de tourisme

Résumé

This paper presents the linguistic data processing sequence built for a tourism web portal. The first steps of this sequence are the detection and the annotation of the temporal expressions found in the web pages. These tasks are performed using linguistic patterns. They lead to many questions which we try to answer, such as the definition of information to detect, annotation format and constraints. In the next step this annotated data is used to populate a tourism ontology. We present the acquisition rules which are necessary to enrich the portal knowledge base. Then we present an evaluation of our annotation system. This evaluation is able to judge the detection of the temporal expressions and their annotation.
Cet article présente la chaîne de traitement linguistique réalisée pour la mise en place d'une plateforme touristique sur Internet. Les premières étapes de cette chaîne sont le repérage et l'annotation des expressions temporelles présentes dans des pages Web. Ces deux tâches sont effectuées à l'aide de patrons linguistiques. Elles soulèvent de nombreux questionnements auxquels nous tentons de répondre, notamment au sujet de la définition des informations à extraire, du format d'annotation et des contraintes. L'étape suivante consiste en l'exploitation des données annotées pour le peuplement d'une ontologie du tourisme. Nous présentons les règles d'acquisition nécessaires pour alimenter la base de connaissance du projet. Enfin, nous exposons une évaluation du système d'annotation. Cette évaluation permet de juger aussi bien le repérage des expressions temporelles que leur annotation.
Fichier non déposé

Dates et versions

halshs-00400097 , version 1 (29-06-2009)

Identifiants

  • HAL Id : halshs-00400097 , version 1

Citer

Stéphanie Weiser, Florence Amardeilh, Martin Coste. Chaîne de traitement linguistique : du repérage d'expressions temporelles au peuplement d'une ontologie de tourisme. TALN 2009, Jun 2009, Senlis, France. ⟨halshs-00400097⟩
125 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More