ML-підхід до ідентифікації емоцій у звукових записах на базі MFCC
Loading...
Date
2025
Authors
Тимошевський, Данило
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
У сучасному світі, де взаємодія людини з комп’ютерними системами набуває все більш природного характеру, розпізнавання емоцій за голосом стає одним із ключових напрямів розвитку штучного інтелекту. Голос є одним із найвиразніших каналів передавання емоційного стану, тому аналіз аудіосигналів відкриває можливості для створення інтелектуальних систем, здатних розуміти не лише зміст висловлювань, а й їх емоційне забарвлення. Такі технології мають широкий спектр практичного застосування — від покращення роботи віртуальних асистентів, систем підтримки клієнтів і адаптивних освітніх платформ до психологічного моніторингу стану користувачів. Окремим напрямом, що набуває актуальності, є використання аналізу емоційного тону голосу для оцінювання ефективності ведення гри в настільних рольових іграх, де емоційна залученість та динаміка голосу відображають якість ігрового процесу та комунікації між учасниками.
Description
This research presents the development of a custom Ukrainian dataset of human voice recordings labeled by seven key emotional states: angry, disgust, fear, happy, neutral, sad, and surprise. Each audio sample was processed to extract Mel-Frequency Cepstral Coefficients (MFCCs), which serve as primary acoustic features representing emotional cues. A Random Forest classifier was trained on these features to identify emotional categories from speech. The model achieved reliable accuracy and demonstrated robustness against minor variations in tone and recording conditions. The study highlights the efficiency of classical ensemble methods for emotion recognition and provides a reproducible dataset for further research in affective computing and audio-based AI systems.
Keywords
розпізнавання емоцій за голосом, аналіз аудіосигналів, класифікація емоцій, MFCC, матеріали конференції
Citation
Тимошевський Д. С. ML-підхід до ідентифікації емоцій у звукових записах на базі MFCC / Тимошевський Д. С. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 31-33.