Семантичний пошук на основі представлень, отриманих за допомогою нейронних мереж

dc.contributor.advisorШвай, Надія
dc.contributor.authorКрошин, Олександр
dc.date.accessioned2024-04-10T10:59:11Z
dc.date.available2024-04-10T10:59:11Z
dc.date.issued2022
dc.descriptionThis master’s thesis is dedicated to semantic search problem. It is focused on the task of re-ranking documents based on user query, particularly, by solving it via applying neural networks based on GPT-3 architecture. This work introduces GPT-3 implementation, OPT, to the re-ranking task, proposes best prompt for its zero-shot evaluation, introduces OPT-based cross-encoder that outperforms previous BERT-based SOTA approaches by a margin and experiments with different knowledge-distillation settings in order to additionally boost performance of smaller model. The work is split into three sections. The first section sets theoretical background of re-ranking problem, reviews metrics and industry-standard approaches. Second section explains usage of neural networks in semantic search and describes different solutions to re-ranking problem using networks of GPT-3 architecture. The third, experimental section, covers training an OPT-based Cross-Encoder, describes knowledge-distillation experiments and evaluates proposed solutions. Results of the experiments are discussed in conclusion section. All the used literature is in the References section.en_US
dc.description.abstractМагістерська робота присвячена задачі семантичного пошуку, зокрема, задачі ранжування документів за запитами користувачів. В роботі розглядається розв’язок задачі ранжування за допомогою нейронних мереж архітектури GPT-3. В роботі пропонується розв’язувати цю задачу за допомогою імплементації GPT-3 під назвою OPT. Розглядаються різні варіанти розв’язку задачі без додаткового тренування, зокрема, використання різних форматів вхідних текстів. В роботі пропонується модель Cross-Encoder на основі OPT, що демонструє кращі результати роботи на прийнятих в індустрії тестах в порівнянні з існуючими рішеннями, що вважаються стандартами. Розглядаються експерименти з дистиляцією моделей OPT задля подальшого покращення їхніх результатів в задачах семантичного пошуку. Робота складається з трьох розділів. Перший, теоретичний розділ присвячений постановці задачі ранжування, огляду існуючих метрик та класичних підходів. Другий розділ описує використання нейронних мереж в задачі ранжування а також демонструє рішення, побудовані на базі моделей архітектури GPT-3. Третій, практичний розділ присвячений побудові та тренуванню Cross-Encoder на основі моделей OPT, експериментам з дистиляцією моделей та обробці результатів. Результати експериментів демонструються у висновку.uk_UA
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/28824
dc.language.isoenuk_UA
dc.relation.organisationНаУКМАuk_UA
dc.statusfirst publisheduk_UA
dc.subjectclassic retrieval approach. BM-25uk_UA
dc.subjecttraining dataset: MS MARCO Passageuk_UA
dc.subjecttraining a Cross-Encoderuk_UA
dc.subjectмагістерська роботаuk_UA
dc.titleСемантичний пошук на основі представлень, отриманих за допомогою нейронних мережuk_UA
dc.typeOtheruk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Kroshyn_Mahisterska_robota.pdf
Size:
675.49 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: