Peut-on identifier automatiquement l'auteur d'un texte ?
Résumé
Il existe certaines situations où l'identité de l'auteur d'un texte nécessite une vérification ou est mise en question, qui peuvent concerner la justice (lettres anonymes), la littérature (paternité d'une oeuvre) ou encore l'éducation (plagiat). Dans ce genre de situations, la linguistique est confrontée à la question des traces laissées par un auteur dans un texte qu'il rédige : choix de certains mots, de certaines tournures, répétition de certaines erreurs, "style", etc. Ces questions sont désormais abordées par le biais de programmes informatiques, qui mesurent la similarité entre les textes incriminés et d'autres productions connues des auteurs potentiels. Nous présenterons les principales techniques employées et les indices sur lesquelles elles s'appuient, à travers quelques exemples.