A French Corpus Annotated for Multiword Nouns - HAL Accéder directement au contenu
Communication dans un congrès Année : 2008

A French Corpus Annotated for Multiword Nouns

Résumé

This paper presents a French corpus annotated for multiword nouns. This corpus is designed for investigation in information retrieval and extraction, as well as in deep and shallow syntactic parsing. We delimit which kind of multiword units we targeted for this annotation task; we describe the resources and methods we used for the annotation; and we briefly comment on the results. The annotated corpus is available at http://infolingu.univ-mlv.fr/ under the LGPLLR license.
Cet article présente un corpus du français muni d'annotations sur les noms composés. Ce corpus est conçu pour la recherche sur l'extraction d'informations ainsi que sur l'analyse syntaxique superficielle ou profonde. Nous délimitons quels types de mots composés nous avons ciblés pour cette tâche d'annotation ; nous décrivons les ressources et les méthodes que nous avons utilisées pour l'annotation ; et nous commentons brièvement les résultats. Le corpus annoté est disponible sur http://infolingu.univ-mlv.fr/ sous licence LGPLLR.
Fichier principal
Vignette du fichier
MWEnouns2008.pdf ( 32.41 Ko ) Télécharger
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00286552, version 1 (09-06-2008)

Identifiants

  • HAL Id : halshs-00286552 , version 1

Citer

Eric Laporte, Takuya Nakamura, Stavroula Voyatzi. A French Corpus Annotated for Multiword Nouns. Language Resources and Evaluation Conference. Workshop Towards a Shared Task on Multiword Expressions, 2008, Marrakech, Morocco. pp.27-30. ⟨halshs-00286552⟩
943 Consultations
1307 Téléchargements
Dernière date de mise à jour le 06/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus