Creating text corpora for special purposes on the basis of extended TXM platform
Создание специальных корпусов текстов на основе расширенной платформы TXM
Alexei Lavrentiev
(1)
,
Ivan Smirnov
(2)
,
Margarita Suvorova
(2)
,
Fedor Solovyev
(3)
,
Alina Fokina
(4)
,
Andrey Chepovskiy
(4)
Alexei Lavrentiev
- Fonction : Auteur
- PersonId : 2718
- IdHAL : alavrent
- ORCID : 0000-0001-8306-3653
- IdRef : 117944688
Andrey Chepovskiy
- Fonction : Auteur
- PersonId : 960564
Résumé
The extension of the TXM platform for case analysis is considered. It is proposed to use the allocation of pseudo-words in words of text on the basis of the method of structural schemes and the identification of nominal groups in the structure of the text for selecting subcorps in terms of parameters. The results of the analysis of the corpus of extremist texts are described.
Рассмотрено расширение платформы TXM для корпусного анализа. Предложено использовать выделение псевдооснов в словах текста на базе метода структурных схем и выявление именных групп в структуре текста для выделения подкорпусов по параметрам. Описаны результаты анализа корпуса экстремистских текстов.
Domaines
LinguistiqueFormat du dépôt | Notice |
---|---|
Type de dépôt | Article dans une revue |
Titre |
en
Creating text corpora for special purposes on the basis of extended TXM platform
ru
Создание специальных корпусов текстов на основе расширенной платформы TXM
|
Résumé |
en
The extension of the TXM platform for case analysis is considered. It is proposed to use the allocation of pseudo-words in words of text on the basis of the method of structural schemes and the identification of nominal groups in the structure of the text for selecting subcorps in terms of parameters. The results of the analysis of the corpus of extremist texts are described.
ru
Рассмотрено расширение платформы TXM для корпусного анализа. Предложено использовать выделение псевдооснов в словах текста на базе метода структурных схем и выявление именных групп в структуре текста для выделения подкорпусов по параметрам. Описаны результаты анализа корпуса экстремистских текстов.
|
Auteur(s) |
Alexei Lavrentiev
1
, Ivan Smirnov
2
, Margarita Suvorova
2
, Fedor Solovyev
3
, Alina Fokina
4
, Andrey Chepovskiy
4
1
IHRIM -
Institut d’Histoire des Représentations et des Idées dans les Modernités
( 453233 )
- ENS de Lyon
15 parvis René Descartes
BP 7000 69342 Lyon Cedex 07
- France
2
FRC "Computer science and control", Russian Academy of Sciences
( 543545 )
- Russie
3
Institute of Physical and Technical Informatics
( 543512 )
- Russie
4
HSE -
Vysšaja škola èkonomiki = National Research University Higher School of Economics [Moscow]
( 466917 )
- 20 Myasnitskaya Ulitsa, 101000 Moscow
- Russie
|
Langue du document |
Russe
|
Nom de la revue |
|
Vulgarisation |
Non
|
Comité de lecture |
Oui
|
Audience |
Internationale
|
Date de publication |
2018-09-24
|
Volume |
14
|
Numéro |
3
|
Page/Identifiant |
76-81
|
Domaine(s) |
|
DOI | 10.18127/j20729472-201803-13 |
Loading...