À la croisée des langues. Annotation et fouille de corpus plurilingues

Résumé : Un programme de recherche en cours sur l'étude des phénomènes de contact de langues et de leur rôle dans le changement linguistique s'attache à recueillir des corpus plurilingues, témoignant d'une grande variété de phénomènes de contact sur un échantillon suffisamment varié de langues génétiquement et typologiquement distinctes. Cet effort a impliqué le développement d'une chaîne de traitement des corpus numériques qui tienne compte des spécificités des corpus plurilingues, pour la représentation des données linguistiques, leur stockage, leur annotation, leur visualisation, et les traitements de recherche d'information. Les normes existantes ont dû être étendues pour prendre en compte l'appartenance potentielle d'unités à plusieurs langues dans les pratiques langagiéres plurilingues. Dans cet article, nous décrivons la manière dont a été définie la structure de ces corpus plurilingues, et la conception technique de l'unité linguistique multilingue qui préside à la fouille de données dans ces corpus.
Type de document :
Article dans une revue
Revue des Nouvelles Technologies de l'Information, Hermann, 2014, RNTI-SHS-2, pp.81-100
Liste complète des métadonnées

Littérature citée [33 références]  Voir  Masquer  Télécharger

https://halshs.archives-ouvertes.fr/halshs-01063067
Contributeur : Isabelle Léglise <>
Soumis le : jeudi 11 septembre 2014 - 11:56:34
Dernière modification le : lundi 29 mai 2017 - 14:24:14
Document(s) archivé(s) le : vendredi 12 décembre 2014 - 10:24:31

Fichier

Croisee_des_langues.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : halshs-01063067, version 1

Collections

Citation

Pascal Vaillant, Isabelle Léglise. À la croisée des langues. Annotation et fouille de corpus plurilingues. Revue des Nouvelles Technologies de l'Information, Hermann, 2014, RNTI-SHS-2, pp.81-100. 〈halshs-01063067〉

Partager

Métriques

Consultations de
la notice

332

Téléchargements du document

402