Метод рекурсивної редукції як складова лінгвістичного забезпечення інформаційно-аналітичних систем

Loading...
Thumbnail Image
Date
2022
Authors
Приходнюк, Віталій
Горборуков, Вячеслав
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Наш час характеризується стрімким ростом кількості наявної інформації, що призводить до створення великих за обсягом масивів тематично та просторово розподіленої інформації. Обробка таких масивів вручну є надзвичайно складним процесом, що потребує значних трудозатрат. Такі масиви можуть бути оброблені з допомогою сучасних інформаційно-аналітичних систем, зокрема – лексикографічних. Однак значна частина інформації в таких масивах може бути слабко і неструктурованою (зокрема – в формі природномовних текстів), що створює потребу в якісному лінгвістичному забезпеченні таких систем, як елементу прикладної лінгвістики. Існує велика кількість методів та засобів для обробки природномовних текстів – на основі словників, машинного навчання, статистичних показників тощо. Однак результати роботи всіх цих методів потребують подальшої обробки і перетворення в формат, передбачений системою, що використовується. Саме для такої обробки пропонується метод рекурсивної редукції, що може використовуватись як складова лінгвістичного забезпечення інформаційно-аналітичних систем. Метод передбачає створення формалізованого опису потрібного системі формату даних, на основі якого відбувається перетворення результатів аналізу вхідного природномовного тексту, з подальшим формуванням онтології. Результуюча онтологія може бути використана для формування онтологокерованої лексикографічної системи.
Description
Our time is characterized by a rapid increase in the amount of available information, which leads to the creation of large-scale arrays of thematically and spatially distributed information. Manual processing of such arrays is an extremely complex process that requires significant labor costs. Such arrays can be processed with the help of modern information-analytical systems, in particular – lexicographic ones. However, a significant part of the information in such arrays may be weakly structured or unstructured (in particular, in the form of natural language texts), which creates a need for high-quality linguistic support for such systems as an element of applied linguistics. There is a large number of methods and tools for processing natural language texts – based on dictionaries, machine learning, statistical indicators, etc. However, the results of all these methods require further processing and conversion into the format required by the system in use. For such processing the method of recursive reduction is proposed, which can be used as a component of the linguistic support of information-analytical systems. The method involves the creation of a formalized description of the data format required by the system, based on which the results of the analysis of the input natural language text are transformed, with a creation of an ontology. The resulting ontology can be used to form an ontology-driven lexicographic system.
Keywords
прикладна лінгвістика, лінгвістичне забезпечення, інформаційно-аналітична система, онтологія, лексикографічна система, стаття, applied linguistics, linguistic support, information-analytical system, ontology, lexicographic system
Citation
Приходнюк В. В. Метод рекурсивної редукції як складова лінгвістичного забезпечення інформаційно-аналітичних систем / В. В. Приходнюк, В. В. Горборуков // Академічні студії. Серія "Гуманітарні науки". - 2022. - Вип. 2. - С. 98-103. - https://doi.org/10.52726/as.humanities/2022.2.14