Étiquetage morphosyntaxique avec PyNLPIR - HAL Accéder directement au contenu
Article de blog scientifique Tekipaki Année : 2020

Étiquetage morphosyntaxique avec PyNLPIR

Résumé

L’étiquetage morphosyntaxique (ou POS-tagging) est une étape habituelle dans la constitution d’un corpus textuel, assez étroitement liée à la langue dans laquelle le texte est écrit. Il n’y a pas très longtemps, j’ai réalisé deux versions de l’étiquetage d’un corpus écrit en chinois, sous Python. Je vais donc partager successivement la façon dont j’ai procédé avec chacun des deux étiqueteurs, à savoir PyNLPIR (implémentation Python du logiciel NLPIR/ICTCLAS) et Jieba.
Loading...
Fichier non déposé

Dates et versions

halshs-03025755, version 1 (26-11-2020)

Identifiants

  • HAL Id : halshs-03025755 , version 1

Citer

Alexander Delaporte. Étiquetage morphosyntaxique avec PyNLPIR. 2020, https://tekipaki.hypotheses.org/117. ⟨halshs-03025755⟩
70 Consultations
0 Téléchargements
Dernière date de mise à jour le 21/04/2024
comment ces indicateurs sont-ils produits

Partager

Gmail Facebook Twitter LinkedIn Plus