Кафедра математики
Permanent URI for this collection
Browse
Recent Submissions
Item A recommendation system with reinforcement for determining the price of a product(2023) Drin, Svitlana; Kriuchkova, AnastasiaRecommender systems belong to a fairly new concept with a wide scope of application and the property of adaptation to non-classical optimization problems. Thus, recommender systems can be used in e-commerce to predict demand and price for a new product in a chain of stores. LightGBM is a reinforcement recommendation system based on regression trees. The Boosting technology for the new tree ˆ f(x) ← ˆ f(x) + λfk(x) is selected with the specified parameter value λ. A typical value of λ is 0.001 to 0.1. But despite its simplicity and many obvious advantages, for many real big data with long-term dependence, classic Boosting techniques should not be used in real models. For example, if there are 900 stores and 7000 SKUs in the chain, then we have more than 6 million combinations per day in the event horizon. In the LightGBM technique, trees of different structure q are combined, where q : Rm → T. And in the known tree structure q(x), the optimal weight of each leaf is obtained by minimizing the loss function L′(t) = PT i=1 [ Gjwj + 1 2 (Hj + λ)w2 j ] + γT. It is worth noting that the LightGBM algorithm, which is characterized by its efficiency, accuracy and speed, creates histograms and uses the generated classes instead of the entire range of values of each variable, achieving a significant reduction in training time. The generated classes are the result of the Gradient One Side Sampling (GOSS) method. The main idea of the GOSS methodology focuses on the fact that not all observations contribute equally to the learning of the algorithm, since those with a small first derivative of the loss function learn better than those with a large first derivative of the loss function. In the case of forecasting the price of goods that do not have a sales history, we will use embedding in NLP in our model. The main purpose of using embedding is the distance between vectors of products to a new product that have a similar nature of sales, and this distance should be minimal. Results will be evaluated using the MAE performance metric.Item A test on the location of tangency portfolio for small sample size and singular covariance matrix(2023) Drin, Svitlana; Mazur, Stepan; Muhinyuza, StanislasIn this paper, we propose the test for the location of the tangency portfolio on the set of feasible portfolios when both the population and the sample covariance matrices of asset returns are singular. We derive the exact distribution of the test statistic under both the null and alternative hypotheses. Furthermore, we establish the high-dimensional asymptotic distribution of that test statistic when both the portfolio dimension and the sample size increase to infinity. We complement our theoretical findings by comparing the high-dimensional asymptotic test with an exact finite sample test in the numerical study. A good performance of the obtained results is documented.Item The analytical view of solution of the first boundary value problem for the nonlinear equation of heat conduction with deviation of the argument(2023) Drin, Yaroslav; Drin, Iryna; Drin, SvitlanaIn this article, for the first time, the first boundary value problem for the equation of thermal conductivity with a variable diffusion coefficient and with a nonlinear term, which depends on the sought function with the deviation of the argument, is solved. For such equations, the initial condition is set on a certain interval. Physical and technical reasons for delays can be transport delays, delays in information transmission, delays in decision-making, etc. The most natural are delays when modeling objects in ecology, medicine, population dynamics, etc. Features of the dynamics of vehicles in different environments (water, land, air) can also be taken into account by introducing a delay. Other physical and technical interpretations are also possible, for example, the molecular distribution of thermal energy in various media (solid bodies, liquids, etc.) is modeled by heat conduction equations. The Green’s function of the first boundary value problem is constructed for the nonlinear equation of heat conduction with a deviation of the argument, its properties are investigated, and the formula for the solution is established.Item The cauchy problem for quasilinear equation with nonstationary diffusion coefficient(2023) Drin, Yaroslav; Drin, Iryna; Drin, SvitlanaThe initial problem for the heat conduction equation with the inversion of the argument are considered and Green’s function are determined. The theorem declared that the Poisson’s formula determines the solution of the Cauchy problem considered and proved.Item Modeling of dynamic systems using Maple(2023) Avramenko, OlgaThis report presents the capabilities of the software product for building models of dynamic systems with subsequent computer simulation and conducting virtual experiments in Maple, as well as the results of its implementation in the educational process.Item Convolutional Neural Network Compression Based on Improved Fractal Decomposition Algorithm for Large Scale Optimization(2023) Llanza, Arcadi; Keddous, Fekhr Eddine; Shvai, Nadiya; Nakib, AmirDeep learning based methods have become the de-facto standard for various computer vision tasks. Nevertheless, they have repeatedly shown their vulnerability to various form of input perturbations such as pixels modification, region anonymization, etc. which are closely related to the adversarial attacks. This research particularly addresses the case of image anonymization, which is significantly important to preserve privacy and hence to secure digitized form of personal information from being exposed and potentially misused by different services that have captured it for various purposes. However, applying anonymization causes the classifier to provide different class decisions before and after applying it and therefore reduces the classifier’s reliability and usability. In order to achieve a robust solution to this problem we propose a novel anonymization procedure that allows the existing classifiers to become class decision invariant on the anonymized images without any modification requires to apply on the classification models. We conduct numerous experiments on the popular ImageNet benchmark as well as on a large scale industrial toll classification problem’s dataset. Obtained results confirm the efficiency and effectiveness of the proposed method as it obtained 0% rate of class decision change for both datasets compared to 15.95% on ImageNet and 0.18% on toll dataset obtained by applying the na¨ıve anonymization approaches. Moreover, it has shown a great potential to be applied to similar problems from different domains.Item Hybrid random fields(2024) Zhydok, Fedir; Chornei, RuslanHybrid Random Fields is a class of graphical probabilistic models and it combines Bayesian Networks and Markov Random Fields models. Due to certain assumptions and properties of Hybrid Random Fields, it can simplify the calculation of joint distribution for a certain set of random variables and conditional probability densities for each of the random variables.Item Вiдновлююче спектральне число графа 𝐾4(2024) Аверкiн, Олександр; Тимошкевич, ЛарисаРозглянемо наступну задачу вiдновлення для зважених графiв: нехай ми маємо граф 𝐺, нашою метою є однозначне вiдновлення вагової функцiї 𝑤 зваженого графа 𝐺 = (𝐺,𝑤) за спектрами певних його iндукованих пiдграфiв. Тобто нас цiкавить можливiсть визначення ваг на ребрах вихiдного графа за значеннями спектрiв цих пiдграфiв. Спектр пiдграфа будемо називати пiдспектром. Мiнiмальну кiлькiсть таких пiдспектрiв, за якими можна однозначно вiдновити вагову функцiю, будемо позначати як вiдновлююче спектральне число графа 𝐺, тобто 𝑆𝑟𝑛(𝐺). Кожен граф 𝐺 породжує двi задачi: наведення прикладiв пiдспектрiв, за якими можливе вiдновлення, та знаходження вiдновлюю- чого спектрального числа.Item Про блоки у графах iз парними та непарними вiдстанями мiж не точками з’єднання(2024) Антошина, Катерина; Козеренко, СергійВершина графа називається точкою з’єднання, якщо її видалення збiльшує кiлькiсть компонент зв’язностi. Наприклад, для зв’язного графа 𝐺 вершина 𝑢 ∈ 𝑉 (𝐺) є точкою з’єднання, якщо граф 𝐺 − 𝑢 незв’язний. Дерево – це зв’язний ациклiчний граф. Легко бачити, що не точками з’єднання дерева є в точностi вершини степеня 1, якi називаються висячими. У роботi [3] дослiджувався спецiальний клас графiв пiд назвою сильно унiкально незалежнi графи. Це такi графи 𝐺, в яких iснує єдина максимальна незалежна множина вершин 𝐴 ⊂ 𝑉 (𝐺), що її доповнення 𝑉 (𝐺)∖𝐴 теж незалежна в 𝐺. Зокрема, було показано, що сильно унiкально незалежнi дерева (надалi просто SUIT) характеризуються як дерева iз парними вiдстанями мiж їхнiми висячими вершинами. Узагальнюючи цей клас дерев, у роботi було розглянуто зв’язнi графи iз парними вiд- станями мiж їхнiми не точками з’єднання (NCE-графи) та графи з цими непарними вiдстанями (NCO-графи).Item Число загального положення для all-path опуклостi та новий алгоритм(2024) Гапоненко, Владислав; Козеренко, СергійЗастосування абстрактної теорiї опуклостi в теорiї графiв зробило значний внесок у вирiшення задач комп’ютерного зору та актуальних задач пов’язаних iз поширенням iнфекцiї. За допомогою концепцiй з теорiї опуклостi був представлений спосiб вiдновлення графа, який може бути використаним для застосувань пов’язаних зi збереженням даних.Item Конструкцiя знакового реберного графа(2024) Дехтяр, Богдан-Ярема; Козеренко, СергійУ цiй роботi ми введемо нову конструкцiю, яка разом iз реберним орграфом дозволить однозначно вiдновити початковий орграф. Спочатку нам знадобиться поняття знакового графа. Для графа 𝐺 знаковою функцiєю називається довiльне вiдображення вигляду 𝑠 : 𝐸(𝐺) → {+, −}, що переводить ребра 𝐺 у знаки + та −. Знаковий граф – це пара (𝐺, 𝑠), де 𝑠 є знаковою функцiєю на 𝐺.Item Когомоморфiзми графiв i метричнi вiдображення мiж їхнiми доповненнями(2024) Гак, Артем; Дехтяр, Юр-Любомисл; Козеренко, Сергій; Романюк, I.У роботi розглядаються лише простi неорiєнтованi скiнченнi графи. Вiдображення 𝑓 : 𝑉 (𝐺) → 𝑉 (𝐻) мiж множинами вершин двох графiв 𝐺, 𝐻 називається гомоморфiзмом, якщо для всiх ребер 𝑢𝑣 ∈ 𝐸(𝐺) виконується 𝑓(𝑢)𝑓(𝑣) ∈ 𝐸(𝐻). Для зв’язного графа 𝐺 через 𝑑𝐺 позначатимемо звичайну вiдстань на множинi вершин 𝑉 (𝐺), де 𝑑𝐺(𝑢, 𝑣) дорiвнює довжинi найкоротшого ланцюга мiж 𝑢 та 𝑣 у 𝐺. Вiдображення 𝑓 : 𝑉 (𝐺) → 𝑉 (𝐻) мiж двома зв’язними графами 𝐺 i 𝐻 називається метричним, якщо 𝑑𝐻(𝑓(𝑢), 𝑓(𝑣)) ≤ 𝑑𝐺(𝑢, 𝑣) для всiх пар вершин 𝑢, 𝑣 ∈ 𝑉 (𝐺). Наступний результат показує, що гомоморфiзми є метричними вiдображеннями.Item Класифiкацiя злiченних графiв Кокстера T4 2,𝑛+𝑚+1,∞ зi значеннями iндексу у промiжку √√5 + 2; 3 √2(2024) Лучка, Катерина ; Тимошкевич, ЛарисаIснує декiлька пiдходiв для розширення спектральної теорiї графiв зi скiнченного випадку на злiченний, у роботi прийнято пiдхiд B. Mohar . Iндекси графiв мають широке коло застосувань, наприклад, у теорiї представлень. Обмеження на iндекс графа впливають на структуру графа, часто можна навести повний перелiк можливих графiв, що задовольняють їм.Item Про 𝑇-групоїди на скiнченних деревах(2024) Антошина, Катерина; Козеренко, Сергій; Первушин, КирилоВ цiй роботi всi графи простi, неорiєнтованi, скiнченнi та зв’язнi. Граф називається геодетичним, якщо мiж кожною парою його вершин iснує єдиний найкоротший ланцюг. Наприклад, повнi графи, непарнi цикли та дерева є геодетичними графами.Item Верхня оцiнка вiдновлюючого спектрального числа для графiв-кактусiв(2024) Чернявська, Карина; Тимошкевич, ЛарисаРiзноманiтнi задачi вiдновлення для графiв посiдають значне мiсце в спектральнiй теорiї графiв. Для графiв-кактусiв розглянемо поставлену задачу i наведемо верхню оцiнку числа 𝑆𝑟𝑛. Граф-кактус — це зв’язний граф, в якому будь-якi два простi цикли мають не бiльше, нiж одну спiльну вершину. Еквiвалентно, будь- яке ребро в такому графi належить максимум одному простому циклу.Item Прогнозна цiноутворююча модель для товарiв з холодним стартом(2024) Величко, Ростислав; Дрiнь, СвітланаВ данiй роботi була розроблена цiноутворююча модель для товарiв з холодним стартом за допомогою моделей градiєнтного бустингу. Метод градiєнтного бустiнгу (Gradient Boosting Decision Trees, GBDT)- це ансамблевий метод машинного навчання, який використовується для вирiшення завдань регресiї, класифiкацiї та iнших задач. Даний метод вперше був запропонований Джеромом Фрiдманом в 1999 роцi. Дана модель може бути корисним iнструментом для вирiшення задач цiноутворення та прогнозування попиту на товари.Item Iтерацiйний пiдхiд до необумовленого оптимального вибору для певної категорiї в роздрiбнiй торгiвлi(2024) Мироненко, Роман; Дрiнь, СвітланаВ роботi використано iтерацiйний пiдхiд для управлiння базовим товарним асортиментом в умовах невизначеностi споживчих уподобань. В ходi роботи розглядаються та застосовуються пiдходи портфельної теорiї, задля оптимiзацiї кiлькостi базових SKU(товари базової необхiдностi). Це допоможе пiдвищити прибутки та зменшити витрати.Item All-path convexity: two characterizations, general position number, and one algorithm(2024) Haponenko, Vladyslav; Kozerenko, SergiyWe present two characterizations for the all-path convex sets in graphs. Using the first criterion, we obtain a new characterization of connected block graphs and compute the general position number in a graph with respect to the all-path convexity. The second criterion allows us to provide a new algorithm for testing a set on all-path convexity.Item Predictive model for a product without history using LightGBM. pricing model for a new product(2023) Drin, Svitlana; Kriuchkova, Anastasiia; Toloknova, VarvaraThe article focuses on developing a predictive product pricing model using LightGBM. Also, the goal was to adapt the LightGBM method for regression problems and, especially, in the problems of forecasting the price of a product without history, that is, with a cold start. The article contains the necessary concepts to understand the working principles of the light gradient boosting machine, such as decision trees, boosting, random forests, gradient descent, GBM (Gradient Boosting Machine), GBDT (Gradient Boosting Decision Trees). The article provides detailed insights into the algorithms used for identifying split points, with a focus on the histogram-based approach. LightGBM enhances the gradient boosting algorithm by introducing an automated feature selection mechanism and giving special attention to boosting instances characterized by more substantial gradients. This can lead to significantly faster training and improved prediction performance. The Gradient-based One-Side Sampling (GOSS) and Exclusive Feature Bundling (EFB) techniques used as enhancements to LightGBM are vividly described. The article presents the algorithms for both techniques and the complete LightGBM algorithm. This work contains an experimental result. To test the lightGBM, a real dataset of one Japanese C2C marketplace from the Kaggle site was taken. In the practical part, a performance comparison between LightGBM and XGBoost (Extreme Gradient Boosting Machine) was performed. As a result, only a slight increase in estimation performance (RMSE, MAE, R-squard) was found by applying LightGBM over XGBoost, however, there exists a notable contrast in the training procedure’s time efficiency. LightGBM exhibits an almost threefold increase in speed compared to XGBoost, making it a superior choice for handling extensive datasets. This article is dedicated to the development and implementation of machine learning models for product pricing using LightGBM. The incorporation of automatic feature selection, a focus on highgradient examples, and techniques like GOSS and EFB demonstrate the model’s versatility and efficiency. Such predictive models will help companies improve their pricing models for a new product. The speed of obtaining a forecast for each element of the database is extremely relevant at a time of rapid data accumulation.Item Моделювання очiкуваних кредитних збиткiв(2023) Дрінь, Світлана; Сердюк, ФедірУ цiй статтi запропоновано метод моделювання ймовiрностi дефолту, описано статистичну оцiнку моделi та представлено модель алгоритму програмної реалiзацiї. Алгоритм автоматично обирає з групи регресiйних моделей, де моделями є як лiнiйна регресiя, так i рiзнi модифiкацiї напiвлогарифмiчних моделей та лаговi моделi для макрофакторiв 𝑋𝑖,𝑡,𝑋𝑖,𝑡−1, ...,𝑋𝑖,𝑡−𝑇 Cтатистичний аналiз проводиться за використання коефiцiєнта детермiнацiї R-квадрат, p-value, VIF (variance inflation factor). Актуальнiсть цiєї теми визначається необхiднiстю дотримання банкiвськими органiзацiями мiжнародних стандартiв, таких як Мiжнароднi стандарти фiнансової звiтностi (МСФЗ 9) та Угода про банкiвський нагляд та капiтал (Базель 3). Цi стандарти визначають вимоги щодо оцiнки кредитного ризику та вимоги до розмiрiв капiталу. Дотримання цих стандартiв є важливим не тiльки для забезпечення стабiльностi та надiйностi фiнансової системи, а й для збереження довiри клiєнтiв та iнвесторiв. Вiдповiднiсть мiжнародним нормам також робить банки конкурентоспроможними на свiтовому ринку та сприяє припливу iнвестицiй та розвитку фiнансового сектору. МСФЗ 9 може бути iнтерпретований рiзними моделями. В статтi запропоновано пiдхiд щодо вибору вiдповiдної моделi для прогнозування ймовiрностi дефолту. Описана методика вибору моделi дає змогу банкам вибрати оптимальну модель оцiнки прогнозу дефолту в рамках наведеного стандарту. Це сприяє бiльш точнiй та надiйнiй оцiнцi кредитного ризику, вiдповiдно регуляторним вимогам, що забезпечить банки засобами для кращого прогнозування та управлiння фiнансовими ресурсами, а також зменшення ризикiв. Методологiя вибору моделi економить значну кiлькiсть часу та ресурсiв, оскiльки, пошук оптимальної моделi вiдбувається автоматично. Це дає змогу швидше реагувати на змiни в економiчному середовищi, вдосконалювати стратегiї прийняття рiшення та управляти кредитними ризиками, що має велике значення для фiнансових установ у конкурентному середовищi. В Українi в цей час триває вiйна, i прогнозування за допомогою чинних методiв стає складним завданням через непередбачуванi стресовi ситуацiї для економiки. У таких умовах стандартнi моделi можуть бути недостатньо адаптованими для врахування пiдвищеного ризику та нестабiльностi. Запропонований пiдхiд допоможе знайти бiльш консервативнi моделi прогнозування, якi можуть бути корисними в умовах нестабiльних перiодiв i вiйни.