Побудова лексико-синтаксичної моделі природної мови із застосуванням сучасних методів обробки великих текстових корпусів

Loading...
Thumbnail Image
Date
2013
Authors
Марченко, Олександр
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Статтю присвячено розробці алгоритму формування моделі лексико-синтаксичних структурних зв’язків природної мови на основі частотно-синтаксичного аналізу речень великого текстового корпусу. Для запису універсальних структур необмеженої складності та довжини використано модель керуючих просторів синтаксичних структур речень природної мови. Для ефективного та економного представлення даних розріджені масиви трансформовано за допомогою методів невід’ємної факторизації матриць та тензорів.
Paper considers the algorithm for building the model of lexical and syntactic structural relations of natural language based on frequency-syntactic analysis of sentences from large text corpora. During the analysis the obtained data are accumulated in large arrays. To record syntactic structures of unlimited complexity, depth and length the natural language syntactic structures control spaces were used. The obtained arrays are huge and sparse. For effective and compact storage of the data the arrays were transformed by using the methods of non-negative matrix and tensor factorization.
Description
Keywords
обробка текстів природною мовою, керуючі простори синтаксичних структур, невід’ємна факторизація тензорів, стаття, natural language text processing, syntactic structures control spaces, non-negative tensor factorization
Citation
Марченко О. О. Побудова лексико-синтаксичної моделі природної мови із застосуванням сучасних методів обробки великих текстових корпусів / Марченко О. О. // Наукові записки НаУКМА. - 2013. - Т. 151 : Комп'ютерні науки. - С. 36-43.