Les outils modernes pour la transcription de corpus de parole - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Revue PAROLE Année : 2002

Les outils modernes pour la transcription de corpus de parole

Résumé

Computer tools and formats for linguistic transcription and for the annotation of linguistic corpora are reviewed. Standardization of these tools and formats will facilitate the coding, exchange, and dissemination of information.
A method of annotation for corpora of spoken language, developed as part of a program to archive linguistic field recordings, is presented as an example. The method relies as far as possible on emerging standards for structured text (XML, Unicode). Data formats for both sound and annotation and processing tools (editors, parsers, browsers) are discussed.
Nous présentons ici une revue des différents outils et formalismes informatiques récents qui peuvent aider le linguiste à faire de la transcription, et plus généralement à faire de l'annotation sur des corpus de parole. La standardisation des ces outils et de ces formalismes facilite le codage, l'échange et la diffusion de l'information.
Nous présentons à titre d'illustration une méthode d'annotation de corpus de parole mise au point dans le cadre d'un programme d'archivage d'enregistrements de terrain. Cette méthode utilise le plus possible les standards émergeants (Unicode et XML). Nous décrivons dans cet article à la fois la structure des données (enregistrements et annotations) et les outils de manipulation de ces dernières (parseurs, éditeurs, browsers, etc.).
Fichier principal
Vignette du fichier
toursDef.pdf (543.39 Ko) Télécharger le fichier
Loading...

Dates et versions

halshs-00009579 , version 1 (10-03-2006)

Identifiants

  • HAL Id : halshs-00009579 , version 1

Citer

Michel Jacobson. Les outils modernes pour la transcription de corpus de parole. Revue PAROLE, 2002, 22,23,24, pp.213-229. ⟨halshs-00009579⟩
198 Consultations
710 Téléchargements

Partager

Gmail Facebook X LinkedIn More