s'authentifier
rss feed
HAL : halshs-00003993, version 1

Fiche détaillée  Récupérer au format
7èmes Journées internationales d'Analyse statistique des Données Textuelles -- Le poids des mots, Louvain : Belgique (2004)
Corpus oraux glosés
Michel Jacobson 1
(03/2004)

La linguistique de terrain et la linguistique textuelle travaillent toutes les deux sur des corpus écrits. Ceux de la linguistique de terrain sont en général issus d'analyses d'enregistrements oraux. La structure et le type de requêtes que l'on peut formuler à leur égard peuvent parfois être spécifiques de l'aspect sonore ou temporel. Mises à part ces quelques différences, les méthodes utilisées pour l'étude de ces corpus ont de nombreux points en commun avec celles utilisées en linguistique textuelle.
Pour illustrer ces points communs, nous examinerons quelques cas de tâches récurrentes en linguistique de terrain : la segmentation et la détermination de gloses. Nous verrons notamment comment le recours à l'examen des contextes d'apparition de segments (mots, morphèmes) donnés par des concordances, ou bien comment le calcul des fréquences d'apparition de ces unités peuvent nous aider à effectuer ces tâches ou bien même à les automatiser en partie.
Nous présenterons enfin un logiciel créé pour aider à gloser des corpus oraux en entretenant parallèlement au corpus, un lexique de toutes les gloses déjà utilisées. Nous examinerons également comment implémenter dans cet outil les méthodes citées plus haut pour optimiser l'aide apportée au linguiste.
1 :  Laboratoire des langues et civilisations à tradition orale (LACITO)
CNRS : UMR7107 – Université Paris III - Sorbonne nouvelle – Université Paris IV - Paris Sorbonne
Sciences de l'Homme et Société/Linguistique
linguistique de terrain – Corpus oraux – Langage de balisage de texte
Liste des fichiers attachés à ce document : 
PDF
jacobson-jadt2004-final.pdf(143.8 KB)