Оптимальні стратегії в багатокроковій грі зі скінченним горизонтом

Верещак, Олексавндр

Оптимальні стратегії в багатокроковій грі зі скінченним горизонтом

Files

Vereshchak_Bakalavrska_robota.pdf (1.01 MB)

Vereshchak_Bakalavrska_robota_1.pdf (666.66 KB)

Date

2025

Authors

Верещак, Олексавндр

Abstract

У дипломній роботі досліджуються оптимальні стратегії в багатокрокових процесах прийняття рішень зі скінченним горизонтом. Розглядається математична модель Марковського процесу прийняття рішень (МППР) як інструмент для моделювання систем, що еволюціонують у часі під впливом керованих дій в умовах стохастичної невизначеності. Основна увага приділяється задачам зі скінченною кількістю етапів прийняття рішень. У теоретичній частині роботи представлено формальний опис елементів МППР: станів, дій, функції винагороди та ймовірностей переходу. Детально проаналізовано рівняння Беллмана для скінченного горизонту як фундаментальне співвідношення для визначення оптимальної функції цінності. Описано алгоритм динамічного програмування, зокрема метод зворотної індукції, що дозволяє знаходити оптимальну нестаціонарну стратегію. Практична частина роботи включає розробку програмного засобу мовою C# для реалізації описаного алгоритму. Продемонстровано можливості програми на прикладах знаходження оптимальних стратегій та відповідних функцій цінності для модельних задач. Також реалізовано функціонал симуляції процесу за знайденою оптимальною стратегією для оцінки фактично отриманої винагороди та порівняння з теоретичними очікуваннями. Проведено аналіз отриманих результатів, що підтверджують коректність роботи алгоритму та програмної реалізації.

Keywords

оптимальні стратегії, Марковський процес прийняття рішень, моделювання, керовані дії, рівняння Белмана, скінчений горизонт, нестаціонарна стратегія, симуляція, бакалаврська робота

URI

https://ekmair.ukma.edu.ua/handle/123456789/36423

Collections

F1 Прикладна математика

Full item page