Аналіз методів машинного навчання в задачі класифікації документів

Loading...
Thumbnail Image
Date
2020
Authors
Жиркова, Анастасія
Ігнатенко, Олексій
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Публікація досліджує методи класифікації документів за наявністю печатки. Для цього, по-перше, проаналізовано вже існуючі методи вирішення поставленої проблеми; по-друге, запропоновано модель згорткової нейронної мережі для класифікації документів; по-третє, відображено залежність коректності роботи нейронної мережі від кількості вхідних даних, на яких навчається модель. В результаті отримано нейронну мережу, що класифікує документи за наявністю печатки з точністю трохи більше ніж 88 %.
Current situation with official documentary in the world, and especially in Ukraine, requires tools for electronical processing. One of the main tasks at this field is seal (or stamp) detection, which leads to documents classification based on mentioned criterion. Current article analyzes some of existed methods to resolve the problem, describes a new approach to classify documentary and reflects dependence of model accuracy to input data amount. As a result of this work is a convolutional neural network that classify 708 out of 804 images of official documents correctly. A corresponded percentage of model accuracy is 88.03, despite the fact of bias presence in input data.
Description
Keywords
машинне навчання, класифікація, згорткові нейронні мережі, послідовна модель, стаття, machine learning, classification, convolutional neural networks, stamp, seal
Citation
Жиркова А. П. Аналіз методів машинного навчання в задачі класифікації документів / А. П. Жиркова, О. П. Ігнатенко // Проблеми програмування. - 2020. - № 4. - С. 81-87.