Проблема автоматичного опрацювання нестандартного правопису в українському корпусі: написання разом, окремо і через дефіс у текстах желехівкою

Loading...
Thumbnail Image
Date
2023
Authors
Чемерис, Юрій
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
У статті описано проблеми, пов’язані з обробленням україномовних текстів, написаних західноукраїнським варіантом правопису (желехівкою) у період з 1880 до 1910 р. Желехівка мала значну варіативність, що показано на прикладі варіантів написань найчастотніших слів, частково спричинених впливом польського правопису. Це значно ускладнює завдання автоматичного опрацювання старих західноукраїнських текстів
Description
The article describes the problems associated with the processing of Ukrainian-language texts written in the Western Ukrainian spelling (zhelehivka) in the period from 1880 to 1910. Zhelekhivka was highly variable, as shown by the spelling variations of the most frequent words, partly under the influence of Polish spelling. This greatly complicates the task of automaticprocessing of old Western Ukrainian texts.
Keywords
український правопис, желехівка, ГРАК, варіантність, нормалізація, тези конференції, Ukrainian spelling, zelekhivka, GRAK, variation, normalization
Citation
Чемерис Ю. Проблема автоматичного опрацювання нестандартного правопису в українському корпусі: написання разом, окремо і через дефіс у текстах желехівкою / Юрій Чемерис // Мовний простір сучасного світу : тези доповідей VII Всеукраїнської наукової конференції студентів, аспірантів і молодих учених (м. Київ, 26 травня 2023 р.) / [орг. комітет: Куранова С. І. (голова) та ін.] ; Національний університет "Києво-Могилянська академія", Кафедра загального і слов'янського мовознавства [та ін.]. - Київ : НаУКМА, 2023. - С. 233-237.