CorpusReader : construction et interrogation de corpus multi-annotés - HAL Accéder directement au contenu
Article dans une revue Revue TAL : traitement automatique des langues Année : 2009

CorpusReader : construction et interrogation de corpus multi-annotés

Résumé

CorpusReader is a framework for creating and querying multi-layer
corpora, which contain several levels of analysis (morphology, syntax,
semantics, etc.) and which are aimed at observing correlations between these
levels. Building, representing and querying multi-layer corpora is complex.
CorpusReader's specificity essentially lies in merging the outputs of existing
corpus analysis tools, avoiding the problem of integrating them at the software
level.
CorpusReader est une plate-forme pour construire et
interroger des corpus multiannotés. Ces corpus articulent plusieurs
niveaux de description linguistique (morphologie, syntaxe,
sémantique, etc.), de façon à permettre la construction d'observables
associant plusieurs niveaux, ainsi que la description de corrélations
entre niveaux de description. Les corpus multiannotés sont complexes
à construire, à représenter et à interroger. Les spécificités de
CorpusReader tiennent principalement au choix d'opérer une fusion
a posteriori des annotations que produisent les outils d'analyse
existants, plutôt qu'à organiser leur interopérabilité.
Loading...
Fichier non déposé

Dates et versions

halshs-00377871, version 1 (23-04-2009)

Identifiants

  • HAL Id : halshs-00377871 , version 1

Citer

Sylvain Loiseau. CorpusReader : construction et interrogation de corpus multi-annotés. Revue TAL : traitement automatique des langues, 2009, 49 (2), pp.189-215. ⟨halshs-00377871⟩
35 Consultations
0 Téléchargements
Dernière date de mise à jour le 20/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus