Навчання в ітеративній дилемі в’язня

dc.contributor.advisorІгнатенко, Олексійuk_UA
dc.contributor.authorТерентьєв, Олександрuk_UA
dc.date.accessioned2025-09-10T14:35:50Z
dc.date.available2025-09-10T14:35:50Z
dc.date.issued2025
dc.description.abstractМагістерська робота присвячена порівнянню трьох підходів до навчання агентів у грі "ітеративна дилема в’язня" (ІДВ). Досліджено особливості методів навчання з підкріпленням (алгоритм PPO), еволюційної стратегії (алгоритм CMA-ES) та трансформерної моделі (Decision Transformer) для вироблення ігрової стратегії. Розроблено уніфіковане експериментальне середовище з параметрами: 100 раундів на гру, набір із 7 класичних стратегій-опонентів (Tit-for-Tat, Always Cooperate, Always Defect, Random, Pavlov, Grudger, Generous Tit-for-Tat). Реалізовано та навчено агентів за кожним із підходів: PPO-агент з нейронною мережею, еволюційний агент із 5-параметричною Memory-One стратегією, Decision Transformer для навчання на послідовностях ігрових траєкторій. Експериментальне порівняння показало такі результати (середній сумарний виграш): PPO-агент – 258.78 балів, еволюційний агент – 233.66 балів, трансформерний агент – 217.03 балів. PPO-підхід продемонстрував найвищу результативність завдяки адаптивній експлуатації опонентів. Еволюційний підхід забезпечив збалансовану стратегію з високою інтерпретованістю. Трансформерний підхід показав найвищий рівень кооперації з опонентами.uk_UA
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/36607
dc.language.isoukuk_UA
dc.statusfirst publisheduk_UA
dc.subjectітеративна дилема в’язняuk_UA
dc.subjectнавчання агентівuk_UA
dc.subjectнавчання з підкріпленнямuk_UA
dc.subjectеволюційна стратегіяuk_UA
dc.subjectтрансформерна модельuk_UA
dc.subjectігрова стратегіяuk_UA
dc.subjectмагістерська роботаuk_UA
dc.titleНавчання в ітеративній дилемі в’язняuk_UA
dc.typeOtheruk_UA
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
Terentiev_Mahisterska_robota.pdf
Size:
872.44 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
Terentiev_Mahisterska_robota_1.pdf
Size:
239.71 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: