Outils logiciels pour l'analyse de corpus textuels

Résumé : Le domaine des logiciels d’analyse de textes peut présenter de prime abord un double obstacle : d’une part, la difficulté technique, le temps nécessaire ou le coût pour prendre connaissance de différents logiciels et les expérimenter, et, d’autre part, la difficulté pour appréhender la diversité des objectifs, des principes de fonctionnement, et des rôles des outils. Or, il est essentiel pour le chercheur d’opter pour des modes de traitement en affinité avec sa problématique, l’approche théorique choisie, et le type d’observations et de résultats qui lui sont pertinents, voire de construire une chaîne de traitements cohérente dans laquelle chaque étape est bien identifiée et opérationnellement outillée. D’un point de vue concret et pragmatique, il s’agit donc d’abord de se donner une vue d’ensemble des ressources, une sorte de carte à grande échelle, pour savoir dans les grandes lignes ce qui existe, avec des repères et des points d’entrée pour pouvoir explorer plus avant un territoire particulier. La vue d’ensemble doit aussi éclairer les dépendances et complémentarités des différentes ressources, qui n’ont quelquefois pas à être opposées (laquelle choisir) mais articulées (plusieurs étapes pour mener à bien l’analyse). Complémentairement, cet article vise également à avancer des repères méthodologiques généraux, moins dépendants de l’état de l’art, et essentiels pour des choix éclairés au moment de la mise en œuvre. De fait, il arrive qu’un doctorant soit amené à défricher ce terrain de l’apport de nouveaux outils logiciels à sa discipline, alors que son directeur ne connaît que peu ou pas ces possibilités technologiques et numériques. Nous n’aurons pas ici un état de l’art expert, dont on assurerait l’exhaustivité comme la présentation des dernières nouveautés : on rend compte plutôt d’un point de vue de chercheur, partageant sa vision et sa compréhension du domaine, avec les principaux repères qui lui sont pertinents pour s’orienter dans l’ensemble. La part belle est faite aux logiciels conçus et diffusés en francophonie, tout en gardant un regard élargi aux principaux produits au plan international. Un focus sera fait sur la textométrie, domaine que nous connaissons le mieux, en expliquant les principes de l’approche qui font sa pertinence pour la plupart des contextes de recherche en sciences humaines et sociales.
Complete list of metadatas

https://halshs.archives-ouvertes.fr/halshs-01961766
Contributor : Bénédicte Pincemin <>
Submitted on : Thursday, December 20, 2018 - 10:54:20 AM
Last modification on : Wednesday, January 23, 2019 - 7:48:19 PM

Licence


Copyright

Identifiers

  • HAL Id : halshs-01961766, version 1

Citation

Bénédicte Pincemin. Outils logiciels pour l'analyse de corpus textuels. Catherine Schnedecker; Angelina Aleksandrova. Le doctorat en France : mode(s) d'emploi, Peter Lang, pp.173-203, 2017, 978-2-8076-0623-4. ⟨https://www.peterlang.com/view/title/62708⟩. ⟨halshs-01961766⟩

Share

Metrics

Record views

34