Марченко, Олександр2014-03-192014-03-192013Марченко О. О. Побудова лексико-синтаксичної моделі природної мови із застосуванням сучасних методів обробки великих текстових корпусів / Марченко О. О. // Наукові записки НаУКМА. - 2013. - Т. 151 : Комп'ютерні науки. - С. 36-43.https://ekmair.ukma.edu.ua/handle/123456789/2881Статтю присвячено розробці алгоритму формування моделі лексико-синтаксичних структурних зв’язків природної мови на основі частотно-синтаксичного аналізу речень великого текстового корпусу. Для запису універсальних структур необмеженої складності та довжини використано модель керуючих просторів синтаксичних структур речень природної мови. Для ефективного та економного представлення даних розріджені масиви трансформовано за допомогою методів невід’ємної факторизації матриць та тензорів.Paper considers the algorithm for building the model of lexical and syntactic structural relations of natural language based on frequency-syntactic analysis of sentences from large text corpora. During the analysis the obtained data are accumulated in large arrays. To record syntactic structures of unlimited complexity, depth and length the natural language syntactic structures control spaces were used. The obtained arrays are huge and sparse. For effective and compact storage of the data the arrays were transformed by using the methods of non-negative matrix and tensor factorization.ukобробка текстів природною мовоюкеруючі простори синтаксичних структурневід’ємна факторизація тензорівстаттяnatural language text processingsyntactic structures control spacesnon-negative tensor factorizationПобудова лексико-синтаксичної моделі природної мови із застосуванням сучасних методів обробки великих текстових корпусівDevelopment of lexical-syntactic model of natural language by using modern methods of large text corpora processingArticle