Оптимальні стратегії в багатокроковій грі зі скінченним горизонтом
Loading...
Date
2025
Authors
Верещак, Олексавндр
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
У дипломній роботі досліджуються оптимальні стратегії в багатокрокових процесах прийняття рішень зі скінченним горизонтом. Розглядається математична модель Марковського процесу прийняття рішень (МППР) як інструмент для моделювання систем, що еволюціонують у часі під впливом керованих дій в умовах стохастичної невизначеності. Основна увага приділяється задачам зі скінченною кількістю етапів прийняття рішень. У теоретичній частині роботи представлено формальний опис елементів МППР: станів, дій, функції винагороди та ймовірностей переходу. Детально проаналізовано рівняння Беллмана для скінченного горизонту як фундаментальне співвідношення для визначення оптимальної функції цінності. Описано алгоритм динамічного програмування, зокрема метод зворотної індукції, що дозволяє знаходити оптимальну нестаціонарну стратегію. Практична частина роботи включає розробку програмного засобу мовою C# для реалізації описаного алгоритму. Продемонстровано можливості програми на прикладах знаходження оптимальних стратегій та відповідних функцій цінності для модельних задач. Також реалізовано функціонал симуляції процесу за знайденою оптимальною стратегією для оцінки фактично отриманої винагороди та порівняння з теоретичними очікуваннями. Проведено аналіз отриманих результатів, що підтверджують коректність роботи алгоритму та програмної реалізації.
Description
Keywords
оптимальні стратегії, Марковський процес прийняття рішень, моделювання, керовані дії, рівняння Белмана, скінчений горизонт, нестаціонарна стратегія, симуляція, бакалаврська робота