Skip to Main content Skip to Navigation
Other publications (Blog article)

Étiquetage morphosyntaxique avec PyNLPIR

Résumé : L’étiquetage morphosyntaxique (ou POS-tagging) est une étape habituelle dans la constitution d’un corpus textuel, assez étroitement liée à la langue dans laquelle le texte est écrit. Il n’y a pas très longtemps, j’ai réalisé deux versions de l’étiquetage d’un corpus écrit en chinois, sous Python. Je vais donc partager successivement la façon dont j’ai procédé avec chacun des deux étiqueteurs, à savoir PyNLPIR (implémentation Python du logiciel NLPIR/ICTCLAS) et Jieba.
Complete list of metadatas

https://halshs.archives-ouvertes.fr/halshs-03025755
Contributor : Alexander Delaporte <>
Submitted on : Thursday, November 26, 2020 - 1:53:29 PM
Last modification on : Saturday, November 28, 2020 - 3:28:43 AM

Identifiers

  • HAL Id : halshs-03025755, version 1

Collections

Citation

Alexander Delaporte. Étiquetage morphosyntaxique avec PyNLPIR. 2020, https://tekipaki.hypotheses.org/117. ⟨halshs-03025755⟩

Share

Metrics

Record views

16