Інтелектуальна система сегментації та стилізованого перекладу ієрогліфічного тексту у мультимедійних коміксах

Радзієвська, ОлександраНегруб, Андрій2025-09-102025-09-102025https://ekmair.ukma.edu.ua/handle/123456789/36563У роботі представлено модульну систему автоматизованої сегментації, розпізнавання та стилізованого перекладу ієрогліфічного тексту в азійських коміксах. Ключова інновація полягає у використанні закономірностей візуального подання тексту для збереження його емоційного та семантичного навантаження при перекладі. Навколо цієї інновації побудовано конвеєрну архітектуру з класифікацією текстових елементів за 13 категоріями, що вирішує проблему ручного опрацювання графічного контенту. Розроблений алгоритм візуальної класифікації автоматично інтегрує результати в процес перекладу, зберігаючи стилістичні особливості оригіналу. Технічна реалізація включає модуль YOLOv12 для детекції блоків (точність mAP50 86%), дуальну TrOCR-модель для розпізнавання ієрогліфів (помилка CER 4.8%) та механізм контекстно-адаптивного перекладу на основі LLM. Експериментальне порівняння з існуючими рішеннями продемонструвало високі показники якості перекладу (0.93) та стилістичної відповідності (0.89), а також підвищення BLEU-score до 0.92.ukкомп'ютерний зіроптичне розпізнавання символівстилізований перекладманхваOCRYOLOTrOCRмультимодальні системикурсова роботаІнтелектуальна система сегментації та стилізованого перекладу ієрогліфічного тексту у мультимедійних коміксахOther