A French Corpus Annotated for Multiword Nouns - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

A French Corpus Annotated for Multiword Nouns

Eric Laporte
Takuya Nakamura
  • Fonction : Auteur
  • PersonId : 937128
Stavroula Voyatzi
  • Fonction : Auteur
  • PersonId : 878771

Résumé

This paper presents a French corpus annotated for multiword nouns. This corpus is designed for investigation in information retrieval and extraction, as well as in deep and shallow syntactic parsing. We delimit which kind of multiword units we targeted for this annotation task; we describe the resources and methods we used for the annotation; and we briefly comment on the results. The annotated corpus is available at http://infolingu.univ-mlv.fr/ under the LGPLLR license.
Cet article présente un corpus du français muni d'annotations sur les noms composés. Ce corpus est conçu pour la recherche sur l'extraction d'informations ainsi que sur l'analyse syntaxique superficielle ou profonde. Nous délimitons quels types de mots composés nous avons ciblés pour cette tâche d'annotation ; nous décrivons les ressources et les méthodes que nous avons utilisées pour l'annotation ; et nous commentons brièvement les résultats. Le corpus annoté est disponible sur http://infolingu.univ-mlv.fr/ sous licence LGPLLR.
Fichier principal
Vignette du fichier
MWEnouns2008.pdf (32.41 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00286552 , version 1 (09-06-2008)

Identifiants

  • HAL Id : halshs-00286552 , version 1

Citer

Eric Laporte, Takuya Nakamura, Stavroula Voyatzi. A French Corpus Annotated for Multiword Nouns. Language Resources and Evaluation Conference. Workshop Towards a Shared Task on Multiword Expressions, 2008, Marrakech, Morocco. pp.27-30. ⟨halshs-00286552⟩
942 Consultations
1306 Téléchargements

Partager

Gmail Facebook X LinkedIn More