s'authentifier
version française rss feed
HAL : halshs-00658362, version 1

Fiche détaillée  Récupérer au format
Corpus 10 (2011) 61-80
Une procédure d'analyse et d'annotation des chaînes de coréférence dans des textes écrits
Frédéric Landragin 1
(2011)

Nous présentons une étude en cours sur la coréférence lorsque le référent est un individu ou un groupe d'individus. Avec l'objectif d'annoter manuellement les expressions référentielles et les chaînes de coréférence d'un texte écrit, nous décrivons les problèmes rencontrés et les solutions adoptées face à la nature sémantico-pragmatique des phénomènes retenus, à leur complexité, à la présence fréquente d'ambiguïtés et de sous-déterminations, et aux relations d'appartenance parfois floue d'un individu à des groupes. Nous montrons comment faire évoluer les outils d'annotation pour optimiser les analyses linguistiques et leur fournir de nouveaux indicateurs.
1 :  Langues, Textes, Traitements Informatiques, Cognition (LaTTICe)
CNRS : UMR8094 – Ecole normale supérieure de Paris - ENS Paris – Université Paris III - Sorbonne nouvelle
Sciences de l'Homme et Société/Linguistique

Informatique/Traitement du texte et du document
référence – anaphore – sémantique – annotation – saillance
Liste des fichiers attachés à ce document : 
PDF
11_corpus_draft.pdf(297.8 KB)