Setting bounds in a homogeneous corpus: a methodological study applied to medieval literature - HAL-SHS - Sciences de l'Homme et de la Société Accéder directement au contenu
Article Dans Une Revue Revue des Nouvelles Technologies de l'Information Année : 2013

Setting bounds in a homogeneous corpus: a methodological study applied to medieval literature

Résumé

The authors present here an exploratory and unspecific method that does not necessitate any a priori on the data - or any heavy transformation such as lemmatisation- that would have to be understood as a first step in the apprehension of a corpus. After a first phase of calibration, based on a control sample, the authors will introduce a method which heuristic value is to bring out, at different levels, internal divisions of different kinds (diachronic, diatopic, related to authorship or scribes,. . . ), that can then be analysed specifically. The authors illustrate this method by applying it to a corpus of Occitan medieval texts, the vidas. The corpus's authors and origins are in good part unknown.
Les auteurs présentent ici une méthode exploratoire, non spécifique et ne nécessitant pas d'a priori sur les données -ni de transformations lourdes comme la lemmatisation-, qui se définit comme une première étape dans l'appréhension d'un corpus. Après une phase de calibration, fondée sur l'utilisation d'un échantillon témoin, sera présentée une méthode dont la valeur heuristique est de pouvoir rendre apparentes, à différents niveaux, des divisions internes de différentes natures (diachroniques, diatopiques, autoriales, scribales,. . .), pouvant ensuite faire l'objet d'analyses spécifiques. Ils illustrent cette méthode par une application à un corpus à première vue assez homogène de courts textes occitans médiévaux, les vidas, dont les auteurs et les origines sont en bonne part inconnues.
Fichier principal
Vignette du fichier
Camps_Cafiero_Setting.pdf (13.21 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

halshs-00765651 , version 1 (15-12-2012)

Identifiants

  • HAL Id : halshs-00765651 , version 1

Citer

Jean-Baptiste Camps, Florian Cafiero. Setting bounds in a homogeneous corpus: a methodological study applied to medieval literature. Revue des Nouvelles Technologies de l'Information, 2013, SHS-1 (MASHS 2011/2012. Modèles et Apprentissages en Sciences Humaines et Sociales Rédacteurs invités : Mar), pp.55-84. ⟨halshs-00765651⟩
479 Consultations
250 Téléchargements

Partager

Gmail Facebook X LinkedIn More