Математична модель для побудови комплексу виявлення несправностей високопродуктивної обчислювальної системи

Loading...
Thumbnail Image
Date
2010
Authors
Федюков, Д.
Рябчун, С.
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
У роботі показано математичну модель на основі мереж Петрі для вирішення завдань виявлення, обробки та реакції на несправності кластера. На відміну від відомих моделей і підходів до моделювання, викладена концепція моделі дозволяє моделювати одиночні несправності та несправності будь-якої кратності для високопродуктивної обчислювальної системи. Модель дозволяє проаналізувати можливі наслідки роботи єдиного комплексу виявлення, обробки та реакції при появі несправності для виявлення слабких місць системи.
The article describes the Petri Nets-based mathematical model that used as theoretical basis to build the uniform solution for problem detection, issues processing and system response (PD/IP/SS). In article it is shown that having such model is critical to built working solution, since it cannot be carried out by engineering-intuitive methods. Unlike known models and approaches to the modelling, the stated concept of model introduces modelling of faults of any multiplicity (including single faults) for both HPC system and PD/IP/SS itself. The model allows to provide the analysis of possible consequences of PD/IP/SS operation for revealing system’s weaknesses.
Description
Keywords
мережі Петрі, виявлення несправностей кластера, суперкомп’ютер, стаття, supercomputer, cluster system, Petri Nets, mathematical model, failure, denial, alarm message, monitoring
Citation
Федюков Д. Математична модель для побудови комплексу виявлення несправностей високопродуктивної обчислювальної системи / Федюков Д. А., Рябчун С. Г. // Наукові записки НаУКМА. Комп'ютерні науки. - 2010. - Т. 112. - С. 85-90.