La ressource ANNODIS, un corpus enrichi d'annotations discursives - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Revue TAL : traitement automatique des langues Année : 2011

La ressource ANNODIS, un corpus enrichi d'annotations discursives

Résumé

This paper describes the ANNODIS ressource, a corpus of written French enriched with several markups, including a manual annotation of discourse structures. The resource is original in that it offers a diversified corpus representing several text types, and two annotations based on different approaches to discourse organisation. As well as a description of the ressource - annotated objects, composition of the corpus - the paper presents the theoretical underpinnings of the annotation models and the methodological choices underlying corpus preparation and annotation. It also sketches the potential contribution of such a resource for linguistics and NLP, and describes initial results of its exploitation.
Cet article décrit la ressource ANNODIS, issue d'un projet financé par l'ANR, corpus de français écrit enrichi à différents niveaux, dont un niveau d'annotation manuelle de structures discursives. Une originalité de la ressource est de proposer un corpus diversifié (plusieurs types de textes sont représentés) et deux annotations fondées sur des approches distinctes de la structuration des discours. La description de la ressource - objets annotés, textes composant le corpus - s'accompagne de la présentation des ancrages théoriques sous-jacents aux modèles d'annotation, et des choix méthodologiques qui ont guidé les diverses phases de préparation et d'annotation du corpus. Nous formulons les enjeux d'une telle ressource pour la linguistique et le TAL, et présentons les premières exploitations.
Fichier principal
Vignette du fichier
Pery-Woodley-TAL52-3.pdf (285.67 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00935201 , version 1 (23-01-2014)

Identifiants

  • HAL Id : halshs-00935201 , version 1

Citer

Marie-Paule Péry-Woodley, Stergos Afantenos, Lydia-Mai Ho-Dac, Nicholas Asher. La ressource ANNODIS, un corpus enrichi d'annotations discursives. Revue TAL : traitement automatique des langues, 2011, 52 (3), pp.71-101. ⟨halshs-00935201⟩
344 Consultations
400 Téléchargements

Partager

Gmail Facebook X LinkedIn More