Twitter comme « corpus » en sciences du langage : questions méthodologiques et pistes de recherche

Résumé : L’avènement des corpus et des travaux sur corpus en sciences du langage ont amené la discipline à décrire des ressources sans cesse diversifiées, qu’il s’agisse de corpus de référence ou ad hoc. Les formes de communication médiées par ordinateur (computer-mediated communication) n’échappent pas cette tendance et ce d’autant plus qu’il s’agit de données numériques natives. Parmi les différents types recensés à ce jour, cette communication s’intéressera spécifiquement à Twitter et à ses potentialités pour la recherche linguistique. A partir d’un corpus compilé à la Maison des Sciences de l’Homme de Dijon – mais aussi des autres initiatives documentées sur la plateforme Ortolang – il s’agira de s’intéresser tout à la fois aux défis que représente cette ressource pour le chercheur linguistique et aux potentialités qu’elle recèle. En termes de défis, on s’arrêtera sur les aspects techniques (comment collecter ces données sans sombrer dans l’amateurisme ?) et surtout méthodologiques (comment les annoter et les interroger ?). La question du statut juridique des données compilées, bien qu’importante, ne sera pas thématisée de façon explicite dans la mesure où des protocoles bien précis existent désormais. Au niveau des potentialités, trois problématiques linguistiques seront abordées pour leur « rendement » à partir d’un corpus Twitter : (i)la question du rapport écrit/oral réinvesti en termes de proximité/distance ; (ii)la description des échanges Twitter en termes interactionnels ; (iii)les questions de linéarité et de textualité des twitts.
Document type :
Lectures
Liste complète des métadonnées

https://halshs.archives-ouvertes.fr/cel-01614435
Contributor : Laurent Gautier <>
Submitted on : Tuesday, October 10, 2017 - 9:26:14 PM
Last modification on : Saturday, January 5, 2019 - 1:09:36 AM
Document(s) archivé(s) le : Thursday, January 11, 2018 - 1:59:51 PM

File

Presentation_séminaire_Bajri...
Files produced by the author(s)

Identifiers

  • HAL Id : cel-01614435, version 1

Collections

Citation

Laurent Gautier. Twitter comme « corpus » en sciences du langage : questions méthodologiques et pistes de recherche . Doctorat. Séminaire du professeur Samir Bajric, Dijon, France. 2017. ⟨cel-01614435⟩

Share

Metrics

Record views

402

Files downloads

473