Skip to Main content Skip to Navigation
Conference papers

Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support

Résumé : Cet article présente des travaux visant à développer un système de rédaction automatique de résumés de textes économiques et financiers en attachant une attention particulière à l’idiomaticité et à la fluidité de la langue d’arrivée. Pour ce faire, l’étude part d’un corpus de rapports périodiques de la Banque de France relevant des discours de conjoncture. Le travail linguistique permet de montrer qu’une rédaction des résumés ne s’attachant qu’à l’extraction terminologique et collocationnelle stricte ignore tout un pan de vocabulaire, saisi ici comme « lexique support », jouant un rôle important dans l’organisation cognitive du domaine. Sur cette base, le travail présenté sur les modèles de langage en apprentissage profond met en avant la pertinence du mécanisme d’auto-attention pour identifier et extraire des schémas lexico-grammaticaux ainsi le lexique support, et l’impact sur le guidage du modèle de résumé abstractif de CamemBERT à travers l'augmentation des données. Une première expérimentation utilisant le corpus considéré ainsi que la méthode d'extraction sont présentées.
Document type :
Conference papers
Complete list of metadatas

https://halshs.archives-ouvertes.fr/halshs-03027283
Contributor : Laurent Gautier <>
Submitted on : Friday, November 27, 2020 - 9:40:25 AM
Last modification on : Saturday, November 28, 2020 - 3:27:51 AM

Identifiers

  • HAL Id : halshs-03027283, version 1

Collections

Citation

Abdelghani Laifa, Laurent Gautier, Christophe Cruz. Extraire des patterns pour améliorer l'idiomaticité de résumés semiautomatiques en finances : le cas du lexique support. ToTh 2020 - Terminologie et Ontologie, Université Savoie Mont-Blanc, Nov 2020, Chambéry (en ligne), France. ⟨halshs-03027283⟩

Share

Metrics

Record views

22

Files downloads

11