Інтелектуальна система сегментації та стилізованого перекладу ієрогліфічного тексту у мультимедійних коміксах

Loading...
Thumbnail Image
Date
2025
Authors
Негруб, Андрій
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
У роботі представлено модульну систему автоматизованої сегментації, розпізнавання та стилізованого перекладу ієрогліфічного тексту в азійських коміксах. Ключова інновація полягає у використанні закономірностей візуального подання тексту для збереження його емоційного та семантичного навантаження при перекладі. Навколо цієї інновації побудовано конвеєрну архітектуру з класифікацією текстових елементів за 13 категоріями, що вирішує проблему ручного опрацювання графічного контенту. Розроблений алгоритм візуальної класифікації автоматично інтегрує результати в процес перекладу, зберігаючи стилістичні особливості оригіналу. Технічна реалізація включає модуль YOLOv12 для детекції блоків (точність mAP50 86%), дуальну TrOCR-модель для розпізнавання ієрогліфів (помилка CER 4.8%) та механізм контекстно-адаптивного перекладу на основі LLM. Експериментальне порівняння з існуючими рішеннями продемонструвало високі показники якості перекладу (0.93) та стилістичної відповідності (0.89), а також підвищення BLEU-score до 0.92.
Description
Keywords
комп'ютерний зір, оптичне розпізнавання символів, стилізований переклад, манхва, OCR, YOLO, TrOCR, мультимодальні системи, курсова робота
Citation