Навчання в ітеративній дилемі в’язня
dc.contributor.advisor | Ігнатенко, Олексій | uk_UA |
dc.contributor.author | Терентьєв, Олександр | uk_UA |
dc.date.accessioned | 2025-09-10T14:35:50Z | |
dc.date.available | 2025-09-10T14:35:50Z | |
dc.date.issued | 2025 | |
dc.description.abstract | Магістерська робота присвячена порівнянню трьох підходів до навчання агентів у грі "ітеративна дилема в’язня" (ІДВ). Досліджено особливості методів навчання з підкріпленням (алгоритм PPO), еволюційної стратегії (алгоритм CMA-ES) та трансформерної моделі (Decision Transformer) для вироблення ігрової стратегії. Розроблено уніфіковане експериментальне середовище з параметрами: 100 раундів на гру, набір із 7 класичних стратегій-опонентів (Tit-for-Tat, Always Cooperate, Always Defect, Random, Pavlov, Grudger, Generous Tit-for-Tat). Реалізовано та навчено агентів за кожним із підходів: PPO-агент з нейронною мережею, еволюційний агент із 5-параметричною Memory-One стратегією, Decision Transformer для навчання на послідовностях ігрових траєкторій. Експериментальне порівняння показало такі результати (середній сумарний виграш): PPO-агент – 258.78 балів, еволюційний агент – 233.66 балів, трансформерний агент – 217.03 балів. PPO-підхід продемонстрував найвищу результативність завдяки адаптивній експлуатації опонентів. Еволюційний підхід забезпечив збалансовану стратегію з високою інтерпретованістю. Трансформерний підхід показав найвищий рівень кооперації з опонентами. | uk_UA |
dc.identifier.uri | https://ekmair.ukma.edu.ua/handle/123456789/36607 | |
dc.language.iso | uk | uk_UA |
dc.status | first published | uk_UA |
dc.subject | ітеративна дилема в’язня | uk_UA |
dc.subject | навчання агентів | uk_UA |
dc.subject | навчання з підкріпленням | uk_UA |
dc.subject | еволюційна стратегія | uk_UA |
dc.subject | трансформерна модель | uk_UA |
dc.subject | ігрова стратегія | uk_UA |
dc.subject | магістерська робота | uk_UA |
dc.title | Навчання в ітеративній дилемі в’язня | uk_UA |
dc.type | Other | uk_UA |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: