Андрощук, Максим2026-02-062026-02-062025Андрощук М. В. Проблеми фрагментації контексту в RAG системах / Андрощук М. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 72-73.https://ekmair.ukma.edu.ua/handle/123456789/38285This research focuses on context fragmentation in Retrieval-Augmented Generation (RAG) systems, a critical issue where conventional document chunking severs logical connections, leading to poor response quality. It proposes a proactive strategy to manage context by overcoming the conflict between retrieval precision and generation completeness. Key solutions include structured indexing via Semantic Chunking and Parent-Child hierarchies, dynamic methods like Sentence-Window and Auto-Merging retrieval, and post-retrieval optimization using rerankers. A comparative analysis shows that an optimized RAG architecture significantly outperforms Large-Context LLMs (LC-LLMs) by avoiding pitfalls such as the "lost in the middle" problem. The paper concludes that strategic architectural investment in solving fragmentation is a more robust and scalable approach for enterprise applications than simply relying on larger LLM context windows.Системи Retrieval-Augmented Generation (RAG) є поширеною архітектурною парадигмою, що інтегрує великі мовні моделі (LLM) із зовнішніми базами знань з метою підвищення фактологічної точності та мінімізації генерації необґрунтованої інформації ("галюцинацій")[2]. Функціонування цих систем обмежується основним архітектурним викликом — контекстною фрагментацією.ukсистеми Retrieval-Augmented Generation (RAG)контекстна фрагментаціяархітектура Parent Document Retrieval (PDR)механізми переранжування (Re-ranking)матеріали конференціїПроблеми фрагментації контексту в RAG системахProblems of context fragmentation in RAG systemsConference materials