The contribution of Latin to French-language quantitative linguistics: from lemmatisation to grammaticometry and textual topology - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Chapitre D'ouvrage Année : 2016

The contribution of Latin to French-language quantitative linguistics: from lemmatisation to grammaticometry and textual topology

La contribution des études latines à la linguistique quantitative francophone : de la lemmatisation à la grammaticométrie et à la topologie textuelle.

Résumé

In this overview of quantitative linguistics in France, we focus on works involving Latin corpora. Our contribution points out that statistical handling of digitized Latin texts is an original and important addition to quantitative linguistics studies, and we investigate the epistemological foundations of this addition. To this end, we go beyond the boundaries of France and look to Belgium, because the development of quantitative studies devoted to Latin texts is a Franco-Belgian achievement, and is based almost entirely on resources produced, beginning in 1961, by the Laboratory for the Statistical Analysis of Ancient Languages (LASLA) at the University of Liège 1. We first emphasize the role of lemmatisation, and show how this simple operation of abstraction and regrouping allows other more or less complex analysis units to emerge. We then discuss the importance that variability of word order in Latin has assumed with regard to research issues and approaches; finally we discuss software advances and certain necessary adaptations involving digital research methods and quantitative handling made necessary by specific approaches to Latin corpora.
Dans ce panorama sur la linguistique quantitative en France, nous voudrions mettre ici le focus sur les travaux suscités par les corpus latins. L’objectif de notre contribution sera de montrer en quoi le traitement automatique et statistique du latin a constitué un apport original et majeur aux études de linguistique quantitative et sera d’analyser les fondements épistémologiques de cet apport. Pour ce faire, nous serons obligés de sortir des frontières de l’hexagone et de faire un excursus jusqu’en Belgique, puisque le développement des études quantitatives sur les textes latins est franco-belge et repose presque entièrement sur les ressources constituées, à partir de 1961, par le LASLA, Laboratoire d’Analyse Statistique des Langues Anciennes de l’Université de Liège . Nous insisterons d’abord sur le rôle de la lemmatisation, en montrant comment cette simple opération d’abstraction et de regroupement a permis de donner corps à d’autres unités d’analyse, plus ou moins complexes ; nous évoquerons ensuite l’impact de la souplesse de l’ordre des mots latins sur les problématiques et sur les traitements ; enfin, nous évoquerons l’évolution des outils logiciels et l’adaptation nécessaire des méthodes de recherche automatique et de traitement quantitatif induites par les approches spécifiques de ces corpus latins.
Fichier principal
Vignette du fichier
Longree_Mellet_corrigé_sans suivi pour HAL.pdf (332.46 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01571102 , version 1 (01-08-2017)

Identifiants

  • HAL Id : hal-01571102 , version 1

Citer

Dominique Longrée, Sylvie Mellet. The contribution of Latin to French-language quantitative linguistics: from lemmatisation to grammaticometry and textual topology. Jacqueline LEON, Sylvain LOISEAU. History of Quantitative Linguistics in France, 24, RAM Verlag, pp.120-136, 2016, Studies in Quantitative Linguistics 24, 978-3-942303-48-4. ⟨hal-01571102⟩
130 Consultations
130 Téléchargements

Partager

Gmail Facebook X LinkedIn More