Creating text corpora for special purposes on the basis of extended TXM platform
Создание специальных корпусов текстов на основе расширенной платформы TXM
Résumé
The extension of the TXM platform for case analysis is considered. It is proposed to use the allocation of pseudo-words in words of text on the basis of the method of structural schemes and the identification of nominal groups in the structure of the text for selecting subcorps in terms of parameters. The results of the analysis of the corpus of extremist texts are described.
Рассмотрено расширение платформы TXM для корпусного анализа. Предложено использовать выделение псевдооснов в словах текста на базе метода структурных схем и выявление именных групп в структуре текста для выделения подкорпусов по параметрам. Описаны результаты анализа корпуса экстремистских текстов.