Vers l'évaluation de systèmes de dialogue homme-machine : de l'oral au multimodal

Frédéric Landragin

Communication dans un congrès Année : 2008

Vers l'évaluation de systèmes de dialogue homme-machine : de l'oral au multimodal

(1)

Frédéric Landragin

Fonction : Auteur
PersonId : 5570
IdHAL : frederic-landragin
IdRef : 071347321

Langues, textes, traitement informatique, cognition

Résumé

Evaluating human-machine dialogue systems is not so efficient, objective, and consensual than evaluating other natural language processing systems. Oral and multimodal dialogue systems are still working within reduced applicative domains. Comparative and normative evaluations are then difficult. Moreover, the continuous technological progress makes obsolete and numerous the evaluating paradigms. Some solutions are still to be identified to improve existing methods and to allow a more automatic diagnosis of systems. The aim of this paper is to provide a set of remarks dealing with the evaluation of multimodal spoken language dialogue systems. Some extensions of existing paradigms are presented, in particular DQR/DCR, considering that some paradigms fit better multimodal issues than others. Some conclusions and perspectives are then drawn on the future of the evaluation of human-machine dialogue systems.

L'évaluation pour le dialogue homme-machine ne se caractérise pas par l'efficacité, l'objectivité et le consensus que l'on observe dans d'autres domaines du traitement automatique des langues. Les systèmes de dialogue oraux et multimodaux restent cantonnés à des domaines applicatifs restreints, ce qui rend difficiles les évaluations comparatives ou normées. De plus, les avancées technologiques constantes rendent vite obsolètes les paradigmes d'évaluation et ont pour conséquence une multiplication de ceux-ci. Des solutions restent ainsi à trouver pour améliorer les méthodes existantes et permettre des diagnostics plus automatisés des systèmes. Cet article se veut un ensemble de réflexions autour de l'évaluation de la multimodalité dans les systèmes à forte composante linguistique. Des extensions des paradigmes existants sont proposées, en particulier DQR/DCR, sachant que certains sont mieux adaptés que d'autres au dialogue multimodal. Des conclusions et perspectives sont tirées sur l'avenir de l'évaluation pour le dialogue homme-machine.

Mots clés

test utilisateur diagnostic paraphrase multimodale Dialogue finalisé multimodalité évaluation pour le dialogue homme-machine paradigme d'évaluation

Task-driven dialogue multimodality evaluating human-machine dialogue evaluation paradigm user test diagnosis

Domaines

Sciences de l'information et de la communication Informatique Intelligence artificielle [cs.AI] Interface homme-machine [cs.HC]

Liste complète des métadonnées

Format du dépôt	Fichier
Type de dépôt	Communication dans un congrès
Résumé	en Evaluating human-machine dialogue systems is not so efficient, objective, and consensual than evaluating other natural language processing systems. Oral and multimodal dialogue systems are still working within reduced applicative domains. Comparative and normative evaluations are then difficult. Moreover, the continuous technological progress makes obsolete and numerous the evaluating paradigms. Some solutions are still to be identified to improve existing methods and to allow a more automatic diagnosis of systems. The aim of this paper is to provide a set of remarks dealing with the evaluation of multimodal spoken language dialogue systems. Some extensions of existing paradigms are presented, in particular DQR/DCR, considering that some paradigms fit better multimodal issues than others. Some conclusions and perspectives are then drawn on the future of the evaluation of human-machine dialogue systems. fr L'évaluation pour le dialogue homme-machine ne se caractérise pas par l'efficacité, l'objectivité et le consensus que l'on observe dans d'autres domaines du traitement automatique des langues. Les systèmes de dialogue oraux et multimodaux restent cantonnés à des domaines applicatifs restreints, ce qui rend difficiles les évaluations comparatives ou normées. De plus, les avancées technologiques constantes rendent vite obsolètes les paradigmes d'évaluation et ont pour conséquence une multiplication de ceux-ci. Des solutions restent ainsi à trouver pour améliorer les méthodes existantes et permettre des diagnostics plus automatisés des systèmes. Cet article se veut un ensemble de réflexions autour de l'évaluation de la multimodalité dans les systèmes à forte composante linguistique. Des extensions des paradigmes existants sont proposées, en particulier DQR/DCR, sachant que certains sont mieux adaptés que d'autres au dialogue multimodal. Des conclusions et perspectives sont tirées sur l'avenir de l'évaluation pour le dialogue homme-machine.
Titre	fr Vers l'évaluation de systèmes de dialogue homme-machine : de l'oral au multimodal
Auteur(s)	Frédéric Landragin ¹ 1 LaTTice - Langues, textes, traitement informatique, cognition ( 1242 ) - 1 rue Maurice Arnoux 92120 Montrouge - France École normale supérieure - Paris ( 59704 ) ; Université Paris Sciences et Lettres ( 564132 ) ; Université Paris Diderot - Paris 7 ( 300301 ) ; Centre National de la Recherche Scientifique UMR8094 ( 441569 )
Vulgarisation	Non
Comité de lecture	Oui
Actes	Oui
Invité	Non
Langue du document	Français
Titre de l'ouvrage	Actes de la quinzième conférence sur le traitement automatique des langues naturelles
Audience	Internationale
Date de publication	2008-06
Page/Identifiant	390-399
Titre du congrès	JEP/TALN/RECITAL
Date début congrès	2008-06
Ville	Avignon
Pays	France
Domaine(s)	Sciences de l'Homme et Société/Sciences de l'information et de la communication Sciences cognitives/Informatique Informatique [cs]/Intelligence artificielle [cs.AI] Informatique [cs]/Interface homme-machine [cs.HC]
Mots-clés	fr test utilisateur, diagnostic, paraphrase multimodale, Dialogue finalisé, multimodalité, évaluation pour le dialogue homme-machine, paradigme d'évaluation it Task-driven dialogue, multimodality, evaluating human-machine dialogue, evaluation paradigm, user test, diagnosis

Fichier principal

08_TALN_ev.pdf ( 47.88 Ko )

Origine : Fichiers produits par l'(les) auteur(s)

Frédéric Landragin : Connectez-vous pour contacter le contributeur

https://shs.hal.science/halshs-00300238

Soumis le : jeudi 17 juillet 2008 à 17:14:38

Dernière modification le : vendredi 19 avril 2024 à 16:18:55

Archivage à long terme le : lundi 31 mai 2010 à 19:12:32

Dates et versions

halshs-00300238, version 1 (17-07-2008)

Identifiants

HAL Id : halshs-00300238 , version 1

Citer

Frédéric Landragin. Vers l'évaluation de systèmes de dialogue homme-machine : de l'oral au multimodal. JEP/TALN/RECITAL, Jun 2008, Avignon, France. pp.390-399. ⟨halshs-00300238⟩

Exporter

BibTeX TEI Dublin Core DC Terms EndNote Datacite

Collections

UNIV-PARIS7 ENS-PARIS CNRS CAMPUS-AAR AAI PSL

260 Consultations

222 Téléchargements

Dernière date de mise à jour le 20/04/2024

Vers l'évaluation de systèmes de dialogue homme-machine : de l'oral au multimodal

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager