Skip to Main content Skip to Navigation
Book sections

Корпус и отворен софтвер за автоматска обработка на македонскиот јазик: примери од Gate Developper

Résumé : Во последните дваесетина години, интересот за автоматската обработка на природните јазици во македонската научна фела постојано се зголемува. Потребата од користење софтвер за третман и обработка на пишани текстови, како и на говорни секвенции од природниот јазик е голема, не само во областа на македонската лингвистика туку и во други домени, како на пример, интернет-пребарувањето, кое се чини, станува составен дел од секојдневjето на сите генерации. Од таа гледна точка, автоматската обработка на јазикот не претставува само апстрактна област во која лингвистите си поигруваат со компјутерите, туку составен дел од нашето секојдневjе. Сепак, изработката на еден ваков вид софтвер бара многу време и ресурси (не само финансиски туку и човечки и научни), исто толку колку и обуката на корисниците што ќе се служат со него. Во тесна врска со компјутерската лингвистика е и корпус-лингвистиката чија цел е да ги проучува јазиците врз основа на корпуси од еден јазик. Спротивно на постојните размислувања, македонскиот јазик не е единствениот јазик што не располага со „национален корпус“. Впрочем, и еден „голем“ јазик како францускиот нема еден единствен корпус што би можеле да го оквалификуваме како таков, бидејќи француската школа претполага дека секој пишан или кажан дискурс е дел од еден глобален корпус, кој може да се истражува со цел да се најдат константите и варијантите на јазикот. Во оваа статија ќе се осврнеме на неколку корисни функционалности на софтверот Gate Developper со кој може да се врши обработка на секаков вид пишани корпуси во UTF-8 поддршка.
Complete list of metadata

Cited literature [21 references]  Display  Hide  Download

https://halshs.archives-ouvertes.fr/halshs-02614408
Contributor : Jovan Kostov <>
Submitted on : Wednesday, May 20, 2020 - 8:26:50 PM
Last modification on : Thursday, January 14, 2021 - 3:19:18 AM

File

jovan-kostov_korubin-2015-arti...
Files produced by the author(s)

Identifiers

  • HAL Id : halshs-02614408, version 1

Collections

Citation

Jovan Kostov. Корпус и отворен софтвер за автоматска обработка на македонскиот јазик: примери од Gate Developper. Снежана Велковска; Снежана Веновска-Антевска; Олгица Додевска-Михалјовска; Катица Топлиска-Евроска; Фани Стефановска-Ристеска. Јазикот наш денешен, Институт за македонски јазик „Крсте Мисирков“ - Скопје, pp.129-146, 2016, Зборник на трудови од научниот собир „Јазичната слика на светот“ одржан на 23-24 април 2015 година, 9786082200392. ⟨halshs-02614408⟩

Share

Metrics

Record views

104

Files downloads

82