Використання машинного навчання для синтезу звуку та налаштування параметрів звукової доріжки на основі текстових описів

Письменний, Антон

Використання машинного навчання для синтезу звуку та налаштування параметрів звукової доріжки на основі текстових описів

Files

Pysmennyi_Bakalavrska_robota.pdf (563.04 KB)

Pysmennyi_Bakalavrska_robota_1.pdf (741.03 KB)

Date

2025

Authors

Письменний, Антон

Abstract

Метою даної кваліфікаційної роботи було дослідження можливостей застосування алгоритмів машинного навчання для синтезу звуку та коригування параметрів звукової доріжки на основі текстового опису користувача з метою використання у сучасних музичних творах. Завданнями роботи були аналіз наявних засобів синтезу звуку з використанням машинного навчання та ступінь їхньої інтеграції в цифрові звукові робочі станції, розробка способів покращення теперішнього стану галузі, дослідження перспективності цих покращень шляхом створення демонстраційних програмних проєктів. У роботі розглянуто існуючі моделі text-to-sound (зокрема – моделі латентної дифузії), перспективи використання великих мовних моделей (LLM) для керування синтезаторами, досліджено можливості створення віртуальних інструментів для цифрових звукових робочих станцій на базі зазначених підходів, проблеми та обмеження, з якими доводиться стикатися в ході розробки й використання таких засобів кінцевими користувачами.

Keywords

штучний інтелект, велика мовна модель, модель латентної дифузії, синтез звуку, цифрова звукова робоча станція, бакалаврська робота

URI

https://ekmair.ukma.edu.ua/handle/123456789/36494

Collections

F3 Комп'ютерні науки

Full item page