Чорней, РусланКржешевська, Анастасія2024-11-072024-11-072024https://ekmair.ukma.edu.ua/handle/123456789/32261В роботі розглянуто теоретичну основу навчання з підкріпленням, реалізовано методами машинного навчання з підкріпленням нейронну мережу, яка шукає оптимальну стратегію керування складом з товарами. Для опису середовища моделі використано багатопродуктову модель керування декількома запасами, описану Проценко І. Ю. Досліджено процес навчання моделі та показано ефективність навченої моделі в порівнянні з моделлю з випадковою політикою.ukReinforcement Learningагентнавчена нейронна мережабагатопродуктова модельбакалаврська роботаОптимальні стратегії для систем керування декількома запасамиOther