Методика тренування глибокої нейронної мережі DeepLabV3 для семантичної сегментації об'єктів на супутникових зображеннях
Loading...
Date
2025
Authors
Колінько, Павло
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
Семантична сегментація є фундаментальною та найобширнішою задачею комп'ютерного зору, що полягає у класифікації кожного пікселя зображення відповідно до його класу, на виході формуючи так звану “маску”. Застосування семантичної сегментації до супутникових знімків супроводжується специфічними викликами: надвисока роздільність зображень, велика варіативність масштабів об'єктів (для дерев - як поодинокі дерева, так і лісові масиви, для водойм - невеликі затоки або широкі озера), атмосферні перешкоди, сезонні зміни забарвлення рослинності, та значний дисбаланс класів.
Description
Semantic segmentation of satellite imagery remains one of the most challenging tasks in computer vision, requiring accurate pixel-level classification of diverse objects such as vegetation, buildings, and terrain features. DeepLab v3 is a state-of-the-art deep learning architecture with about 60-70M parameters to capture multi-scale contextual information. In this research, were proposed and tested a comprehensive training methodology for DeepLab integrated with PointRend head, utilizing ResNet-101 as backbone with layer-based learning rates and a gradual layer unfreezing strategy for the whole backbone. A composite loss function that is composed by weighted class-dependent loss metrics. Proposed approach allows to achive the optimal results, prevent model overfitting and accelerate model convergance.
Keywords
семантична сегментація, семантична сегментація супутникових зображень, згорткові нейронні мережі, мережа ResNet-101, матеріали конференції
Citation
Колінько П. В. Методика тренування глибокої нейронної мережі DeepLabV3 для семантичної сегментації об'єктів на супутникових зображеннях / Колінько П. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 51-53.