Семантичний пошук на основі представлень, отриманих за допомогою нейронних мереж

Крошин, Олександр

Семантичний пошук на основі представлень, отриманих за допомогою нейронних мереж

dc.contributor.advisor	Швай, Надія
dc.contributor.author	Крошин, Олександр
dc.date.accessioned	2024-04-10T10:59:11Z
dc.date.available	2024-04-10T10:59:11Z
dc.date.issued	2022
dc.description	This master’s thesis is dedicated to semantic search problem. It is focused on the task of re-ranking documents based on user query, particularly, by solving it via applying neural networks based on GPT-3 architecture. This work introduces GPT-3 implementation, OPT, to the re-ranking task, proposes best prompt for its zero-shot evaluation, introduces OPT-based cross-encoder that outperforms previous BERT-based SOTA approaches by a margin and experiments with different knowledge-distillation settings in order to additionally boost performance of smaller model. The work is split into three sections. The first section sets theoretical background of re-ranking problem, reviews metrics and industry-standard approaches. Second section explains usage of neural networks in semantic search and describes different solutions to re-ranking problem using networks of GPT-3 architecture. The third, experimental section, covers training an OPT-based Cross-Encoder, describes knowledge-distillation experiments and evaluates proposed solutions. Results of the experiments are discussed in conclusion section. All the used literature is in the References section.	en_US
dc.description.abstract	Магістерська робота присвячена задачі семантичного пошуку, зокрема, задачі ранжування документів за запитами користувачів. В роботі розглядається розв’язок задачі ранжування за допомогою нейронних мереж архітектури GPT-3. В роботі пропонується розв’язувати цю задачу за допомогою імплементації GPT-3 під назвою OPT. Розглядаються різні варіанти розв’язку задачі без додаткового тренування, зокрема, використання різних форматів вхідних текстів. В роботі пропонується модель Cross-Encoder на основі OPT, що демонструє кращі результати роботи на прийнятих в індустрії тестах в порівнянні з існуючими рішеннями, що вважаються стандартами. Розглядаються експерименти з дистиляцією моделей OPT задля подальшого покращення їхніх результатів в задачах семантичного пошуку. Робота складається з трьох розділів. Перший, теоретичний розділ присвячений постановці задачі ранжування, огляду існуючих метрик та класичних підходів. Другий розділ описує використання нейронних мереж в задачі ранжування а також демонструє рішення, побудовані на базі моделей архітектури GPT-3. Третій, практичний розділ присвячений побудові та тренуванню Cross-Encoder на основі моделей OPT, експериментам з дистиляцією моделей та обробці результатів. Результати експериментів демонструються у висновку.	uk_UA
dc.identifier.uri	https://ekmair.ukma.edu.ua/handle/123456789/28824
dc.language.iso	en	uk_UA
dc.relation.organisation	НаУКМА	uk_UA
dc.status	first published	uk_UA
dc.subject	classic retrieval approach. BM-25	uk_UA
dc.subject	training dataset: MS MARCO Passage	uk_UA
dc.subject	training a Cross-Encoder	uk_UA
dc.subject	магістерська робота	uk_UA
dc.title	Семантичний пошук на основі представлень, отриманих за допомогою нейронних мереж	uk_UA
dc.type	Other	uk_UA

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Kroshyn_Mahisterska_robota.pdf
Size:: 675.49 KB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

F1 Прикладна математика