Використання машинного навчання для синтезу звуку та налаштування параметрів звукової доріжки на основі текстових описів
Loading...
Date
2025
Authors
Письменний, Антон
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Метою даної кваліфікаційної роботи було дослідження можливостей застосування алгоритмів машинного навчання для синтезу звуку та коригування параметрів звукової доріжки на основі текстового опису користувача з метою використання у сучасних музичних творах. Завданнями роботи були аналіз наявних засобів синтезу звуку з використанням машинного навчання та ступінь їхньої інтеграції в цифрові звукові робочі станції, розробка способів покращення теперішнього стану галузі, дослідження перспективності цих покращень шляхом створення демонстраційних програмних проєктів. У роботі розглянуто існуючі моделі text-to-sound (зокрема – моделі латентної дифузії), перспективи використання великих мовних моделей (LLM) для керування синтезаторами, досліджено можливості створення віртуальних інструментів для цифрових звукових робочих станцій на базі зазначених підходів, проблеми та обмеження, з якими доводиться стикатися в ході розробки й використання таких засобів кінцевими користувачами.
Description
Keywords
штучний інтелект, велика мовна модель, модель латентної дифузії, синтез звуку, цифрова звукова робоча станція, бакалаврська робота