Федюков, Д.Рябчун, С.2018-05-222018-05-222010Федюков Д. Математична модель для побудови комплексу виявлення несправностей високопродуктивної обчислювальної системи / Федюков Д. А., Рябчун С. Г. // Наукові записки НаУКМА. Комп'ютерні науки. - 2010. - Т. 112. - С. 85-90.https://ekmair.ukma.edu.ua/handle/123456789/13018У роботі показано математичну модель на основі мереж Петрі для вирішення завдань виявлення, обробки та реакції на несправності кластера. На відміну від відомих моделей і підходів до моделювання, викладена концепція моделі дозволяє моделювати одиночні несправності та несправності будь-якої кратності для високопродуктивної обчислювальної системи. Модель дозволяє проаналізувати можливі наслідки роботи єдиного комплексу виявлення, обробки та реакції при появі несправності для виявлення слабких місць системи.The article describes the Petri Nets-based mathematical model that used as theoretical basis to build the uniform solution for problem detection, issues processing and system response (PD/IP/SS). In article it is shown that having such model is critical to built working solution, since it cannot be carried out by engineering-intuitive methods. Unlike known models and approaches to the modelling, the stated concept of model introduces modelling of faults of any multiplicity (including single faults) for both HPC system and PD/IP/SS itself. The model allows to provide the analysis of possible consequences of PD/IP/SS operation for revealing system’s weaknesses.ukмережі Петрівиявлення несправностей кластерасуперкомп’ютерстаттяsupercomputercluster systemPetri Netsmathematical modelfailuredenialalarm messagemonitoringМатематична модель для побудови комплексу виявлення несправностей високопродуктивної обчислювальної системиThe helper mathematical model to build hardware failure detector forhigh performance computing systemsArticle