Проблеми фрагментації контексту в RAG системах

Loading...
Thumbnail Image
Date
2025
Authors
Андрощук, Максим
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
Системи Retrieval-Augmented Generation (RAG) є поширеною архітектурною парадигмою, що інтегрує великі мовні моделі (LLM) із зовнішніми базами знань з метою підвищення фактологічної точності та мінімізації генерації необґрунтованої інформації ("галюцинацій")[2]. Функціонування цих систем обмежується основним архітектурним викликом — контекстною фрагментацією.
Description
This research focuses on context fragmentation in Retrieval-Augmented Generation (RAG) systems, a critical issue where conventional document chunking severs logical connections, leading to poor response quality. It proposes a proactive strategy to manage context by overcoming the conflict between retrieval precision and generation completeness. Key solutions include structured indexing via Semantic Chunking and Parent-Child hierarchies, dynamic methods like Sentence-Window and Auto-Merging retrieval, and post-retrieval optimization using rerankers. A comparative analysis shows that an optimized RAG architecture significantly outperforms Large-Context LLMs (LC-LLMs) by avoiding pitfalls such as the "lost in the middle" problem. The paper concludes that strategic architectural investment in solving fragmentation is a more robust and scalable approach for enterprise applications than simply relying on larger LLM context windows.
Keywords
системи Retrieval-Augmented Generation (RAG), контекстна фрагментація, архітектура Parent Document Retrieval (PDR), механізми переранжування (Re-ranking), матеріали конференції
Citation
Андрощук М. В. Проблеми фрагментації контексту в RAG системах / Андрощук М. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 72-73.