Présentation des outils d'analyse et de requête de la plate-forme CLAPI, Corpus de LAngues Parlées en Interaction : illustration à partir de l'analyse des particules discursives - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Présentation des outils d'analyse et de requête de la plate-forme CLAPI, Corpus de LAngues Parlées en Interaction : illustration à partir de l'analyse des particules discursives

Résumé

Présentation des outils d'analyse et de requête de la plate-forme CLAPI, Corpus de LAngues Parlées en Interaction : illustration à partir de l'analyse des particules discursives,Carole Etienne ,Laboratoire ICAR, Lyon (UMR 5191 CNRS). Cette communication se propose de rendre compte des possibilités analytiques offertes par le recours à une banque de données de Corpus de Langues Parlées en Interaction (CLAPI) conçue par le groupe ICOR (Interactions & CORpus ) pour la description des usages de la langue orale en situation naturelle en étudiant les particules discursives et le rôle fondamental qu'elles jouent dans l'interaction. La recherche que nous exposerons se fonde sur l'exploitation de la plate-forme CLAPI, développée au laboratoire ICAR (cf. http://clapi.univ-lyon2.fr). C'est une base dédiée aux corpus de français parlé en interaction (FPI), constitués d'enregistrements effectués en milieu naturel (vs données élicitées ou données produites en laboratoire), dans une grande variété de contextes. Les enregistrements sont non seulement audio mais aussi vidéo, ce qui ouvre la possibilité d'une description multimodale de la langue. Cette banque de données est dotée d'applications informatiques conçues et développées pour assister le chercheur aux différentes étapes de l'analyse d'une problématique donnée :- un outil de reconnaissance des variantes graphiques employées traditionnellement dans les transcriptions des enregistrements : les formes abrégées « b`jour » pour « bonjour , « `tends» pour « attends »... ;- un outil de recherche d'attestations ; - un outil de recherche de co-occurrences de tokens ;- un outil de recherche de co-occurrences de phénomènes propres à l'interaction : pauses (courtes/longues), chevauchements (segments chevauchants, segments chevauchés), tour de parole court, début/fin de tour de parole, ... - un outil d'analyse contextuelle d'un token qui rend compte de sa fréquence en fonction de critères comme le nombre de locuteurs dans l'interaction, leur sexe, la localisation du token dans le tour ( début, fin, premier, dernier,...), en répétition, en chevauchement, avant ou après une pause, ... - un outil de recherche des segments répétés par un même locuteur au sein d'un même tour ou en reprise du locuteur précédent ;- des outils d'analyse automatique de transcription produisant des "bilans" portant sur les divers phénomènes transcrits : lexique comprenant notamment les tokens les plus fréquents, fréquence et répartition des phénomènes au cours de l'interaction;- un outil de requêtes complexes spécialisé dans la recherche de clusters de phénomènes interactionnels (formes de mots et syntagmes + phénomènes typiques de l'oral en interaction comme les chevauchements et les pauses + positions dans les tours de parole), pouvant en outre faire intervenir certains descripteurs sociolinguistiques.Le concordancier permet d'afficher de manière identique pour l'ensemble des outils les attestations recherchées, avec un contexte significatif, aligné avec le signal audio/vidéo en streaming, et une sortie imprimable ou directement intégrable dans un document.Depuis ce concordancier, un accès aux descripteurs de la banque de données est disponible pour revenir sur les caractéristiques du corpus, de l'interaction, des locuteurs ...Ces outils d'analyse et de requête sont accessibles en ligne, sans condition d'accès, pour environ 70% des données de CLAPI à l'adresse http://clapi.univ-lyon2.fr. L'analyse du français parlé en interaction reposait jusqu'à présent sur des analyses qualitatives ; le recours à une banque de données comporte deux atouts majeurs :1) l'intégration d'une dimension quantitative à l'analyse. La description repose non seulement sur un nombre significatif d'occurrences, mais surtout sur une grande diversité de corpus et par conséquent de situations interactionnelles documentées, ce qui fournit les matériaux nécessaires à une validation quantitative des hypothèses élaborées dans le cadre d'une approche qualitative, inspirée de l'analyse conversationnelle et de la linguistique de l'interaction ;2) l'intégration d'une dimension multimodale, puisque l'analyse s'effectue sur la base de l'environnement séquentiel et interactionnel des unités linguistiques enrichi de l'accès au signal audiovisuel. Les outils de présentation des données enregistrées autorise l'exploitation systématique de la nature fondamentalement multimodale du parler en interaction, en intégrant et en synchronisant les composantes vocales et gestuelles.Les particules discursives, ces « petits mots » du discours comme « alors, ben, donc, euh, voilà,... » sont omniprésents dans l'oral où ils jouent un rôle déterminant dans le déroulement de l'interaction. L'analyse portera sur l'influence de différents éléments dans l'usage qui est fait de ces particules, leur spécificité en tant que ressource interactionnelle. On s'interrogera par exemple sur la diversité de leurs emplois en fonction du nombre de locuteurs, de la nature de l'interaction : « voilà » est-il utilisé aussi souvent en face à face qu'au téléphone, en privé que dans une réunion de travail, chez l'enfant que chez l'adulte ...On cherchera à déterminer dans quelle mesure ces particules s'associent à d'autres phénomènes interactionnels pour mener leur action : « ben » est-il vraiment spécialisé dans des positionnements en début de tour, en chevauchement, en cascade, ...Par ailleurs, cette étude permettra de mettre en évidence les moyens d'investigation qu'offre CLAPI à un utilisateur qui n'en connaît ni les corpus, ni les outils d'analyse et de requêtes : on détaillera la manière de constituer un exemplier de particules en contexte (une collection), de revenir aux descripteurs pour mieux comprendre l'interaction concernée, d'accéder au signal audio/vidéo correspondant.

Domaines

Linguistique
Fichier non déposé

Dates et versions

halshs-00378456 , version 1 (24-04-2009)

Identifiants

  • HAL Id : halshs-00378456 , version 1

Citer

Icor Groupe, Michel Bert, Sylvie Bruxelles, Carole Etienne, Lorenza Mondada, et al.. Présentation des outils d'analyse et de requête de la plate-forme CLAPI, Corpus de LAngues Parlées en Interaction : illustration à partir de l'analyse des particules discursives. Présentation des outils d'analyse et de requête de la plate-forme CLAPI, Corpus de LAngues Parlées en Interaction : illustration à partir de l'analyse des particules discursives, Sep 2007, Lorient, France. p X-Y. ⟨halshs-00378456⟩
200 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More