Format du dépôt |
Fichier |
Type de dépôt |
Rapport (rapport de recherche) |
Titre |
fr
La transcription automatique : un rêve enfin accessible ? Analyse et comparaison d’outils pour les SHS. Nouvelle méthodologie et résultats
|
Résumé |
fr
Le recueil de la parole est au cœur des démarches de recherches qualitatives de nombreuses disciplines de sciences humaines et sociales. Depuis la démocratisation des outils d’enregistrement dans les années 80 et surtout 90, la pratique de la transcription de l’intégralité de la parole enregistrée est devenue quasiment la norme, mais elle demande beaucoup de temps et s’avère souvent fastidieuse et un peu décourageante. À l’heure de l’intégration de modules d’intelligence artificielle aux algorithmes de reconnaissance automatique de la parole, ces derniers progressent rapidement et le fantasme de pouvoir automatiser cette tâche longue et pénible semble se rapprocher, voire être déjà accessible. Ce rapport présente le résultat d’un travail de comparaison de 8 outils de transcription automatique (Go Transcribe, Happy Scribe, Headliner, Sonix, Video Indexer, Vocalmatic, Vocapia, You-
Tube) effectué par des membres du réseau méthodologique CNRS MATE-SHS. Quatre extraits de fichiers audio de langue française ont servi de test, chacun avec ses spécificités propres : un texte lu, un cours magistral enregistré en situation, un entretien avec deux interlocuteurs, une réunion associative avec de nombreux locuteurs.
|
Auteur(s)
|
Elise Tancoigne
1
, Jean-Philippe Corbellini
2
, Gaëlle Deletraz
3
, Laure Gayraud
4, 5
, Sandrine Ollinger
6
, Daniel Valero
7
1
UNIGE -
Université de Genève = University of Geneva
( 154620 )
- 24 rue du Général-Dufour CH - 1211 Genève 4
Suisse
- Suisse
2
MSH VL -
Maison des Sciences de l'Homme Val de Loire
( 258753 )
- 33 allée Ferdinand de Lesseps 37204 TOURS Cedex 03
- France
-
Université d'Orléans ( 300297 )
;
-
Université de Tours ( 300298 )
;
-
Centre National de la Recherche Scientifique UAR3501 / USR3501 ( 441569 )
3
Passages
( 456102 )
- Maison des Suds - 12, esplanade des Antilles - 33607 Pessac cedex
- France
-
Université de Bordeaux ( 259761 )
;
-
Ministère de la Culture et de la Communication ( 300125 )
;
-
Université de Pau et des Pays de l'Adour ( 301085 )
;
-
Université Bordeaux Montaigne ( 412629 )
;
-
Centre National de la Recherche Scientifique UMR5319 ( 441569 )
4
CEREQ -
Centre d'études et de recherches sur les qualifications
( 8027 )
- 10, place de la Joliette, BP 21321, 13567 Marseille cedex 02
- France
-
ministère de l'Emploi, cohésion sociale et logement ( 300770 )
;
-
Ministère de l'Education nationale, de l’Enseignement supérieur et de la Recherche ( 301855 )
5
CED -
Centre Émile Durkheim
( 150294 )
- Sciences Po Bordeaux
11 allée Ausone
33607 Pessac CEDEX
- France
-
Sciences Po Bordeaux - Institut d'études politiques de Bordeaux ( 7590 )
;
-
Université de Bordeaux ( 259761 )
;
-
Centre National de la Recherche Scientifique UMR5116 ( 441569 )
6
ATILF -
Analyse et Traitement Informatique de la Langue Française
( 190838 )
- Université de Lorraine, 44 Av de la Libération, BP 30687 54063 Nancy Cedex
- France
-
Université de Lorraine ( 413289 )
;
-
Centre National de la Recherche Scientifique UMR7118 ( 441569 )
7
ICAR -
Interactions, Corpus, Apprentissages, Représentations
( 51028 )
- 5, av Pierre Mendès-France 69676 BRON CEDEX
- France
-
École normale supérieure de Lyon ( 6818 )
;
-
Université Lumière - Lyon 2 ( 33804 )
;
-
INRP ( 300042 )
;
-
Ecole Normale Supérieure Lettres et Sciences Humaines ( 303652 )
;
-
Centre National de la Recherche Scientifique UMR5191 ( 441569 )
|
Langue du document |
Français
|
Date de production/écriture |
2020-08-19
|
Type de rapport |
Rapport de recherche
|
Date de publication |
2020-08-20
|
Domaine(s) |
-
Sciences de l'Homme et Société
|
Institution |
|
Voir aussi |
-
https://mate-shs.cnrs.fr/actions/tutomate/tuto24-retranscription-elise-tancoigne/
-
https://www.youtube.com/watch?v=NRF20NSEWo8
|
Mots-clés |
en
interview transcription, research data, methodology, software evaluation, speech corpora, automatic transcription
fr
corpus oraux, transcription automatique, retranscription entretien, données de la recherche, méthodologie, évaluation logiciels
|