Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support

Laurent Gautier
Christophe Cruz

Résumé

Cet article présente des travaux visant à développer un système de rédaction automatique de résumés de textes économiques et financiers en attachant une attention particulière à l’idiomaticité et à la fluidité de la langue d’arrivée. Pour ce faire, l’étude part d’un corpus de rapports périodiques de la Banque de France relevant des discours de conjoncture. Le travail linguistique permet de montrer qu’une rédaction des résumés ne s’attachant qu’à l’extraction terminologique et collocationnelle stricte ignore tout un pan de vocabulaire, saisi ici comme « lexique support », jouant un rôle important dans l’organisation cognitive du domaine. Sur cette base, le travail présenté sur les modèles de langage en apprentissage profond met en avant la pertinence du mécanisme d’auto-attention pour identifier et extraire des schémas lexico-grammaticaux ainsi le lexique support, et l’impact sur le guidage du modèle de résumé abstractif de CamemBERT à travers l'augmentation des données. Une première expérimentation utilisant le corpus considéré ainsi que la méthode d'extraction sont présentées.
Fichier principal
Vignette du fichier
image.jpg (1.85 Ko) Télécharger le fichier
Presentation_ToTh_AL_vEnd.pdf (3.81 Mo) Télécharger le fichier
image (1).png (33.14 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

halshs-03027283 , version 1 (27-11-2020)

Identifiants

  • HAL Id : halshs-03027283 , version 1

Citer

Abdelghani Laifa, Laurent Gautier, Christophe Cruz. Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support. ToTh 2020 - Terminologie et Ontologie, Université Savoie Mont-Blanc, Nov 2020, Chambéry (en ligne), France. ⟨halshs-03027283⟩
103 Consultations
40 Téléchargements

Partager

Gmail Facebook X LinkedIn More