Чорней, РусланВерещак, Олексавндр2025-09-042025-09-042025https://ekmair.ukma.edu.ua/handle/123456789/36423У дипломній роботі досліджуються оптимальні стратегії в багатокрокових процесах прийняття рішень зі скінченним горизонтом. Розглядається математична модель Марковського процесу прийняття рішень (МППР) як інструмент для моделювання систем, що еволюціонують у часі під впливом керованих дій в умовах стохастичної невизначеності. Основна увага приділяється задачам зі скінченною кількістю етапів прийняття рішень. У теоретичній частині роботи представлено формальний опис елементів МППР: станів, дій, функції винагороди та ймовірностей переходу. Детально проаналізовано рівняння Беллмана для скінченного горизонту як фундаментальне співвідношення для визначення оптимальної функції цінності. Описано алгоритм динамічного програмування, зокрема метод зворотної індукції, що дозволяє знаходити оптимальну нестаціонарну стратегію. Практична частина роботи включає розробку програмного засобу мовою C# для реалізації описаного алгоритму. Продемонстровано можливості програми на прикладах знаходження оптимальних стратегій та відповідних функцій цінності для модельних задач. Також реалізовано функціонал симуляції процесу за знайденою оптимальною стратегією для оцінки фактично отриманої винагороди та порівняння з теоретичними очікуваннями. Проведено аналіз отриманих результатів, що підтверджують коректність роботи алгоритму та програмної реалізації.ukоптимальні стратегіїМарковський процес прийняття рішеньмоделюваннякеровані діїрівняння Белманаскінчений горизонтнестаціонарна стратегіясимуляціябакалаврська роботаОптимальні стратегії в багатокроковій грі зі скінченним горизонтомOther