Механіка міркування великих мовних моделей: філософський аналіз
Loading...
Date
2024
Authors
Маєвський, Олександр
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
У статті показано і філософськи пояснено природу, механіку міркування і фундаментальні засади епістемічної обмеженості сучасних діалогових великих мовних моделей на основі архітектури Transformer. Великі мовні моделі представлено як функціоналістський механістичний проєкт статистичного моделювання мови і мовлення як моделі знання як смислової моделі дійсності — 1) модель 2) моделі 3) моделі дійсності. Показано, що через цю значну дистанцію опосередкування дійсності внутрішньомодельні зв'язки втрачають свій фактологічний потенціал. Також продемонстровано, що великі мовні моделі є продуктом машинного навчання певній мовній поведінці з метою і цінностями, кардинально відмінними від мети і цінності людського пізнання. Їхньою метою є принцип задоволення оператора функції винагороди шляхом обману за будь-яку встановлену ціну і будь-якими наявними засобами на етапі навчання. Останнє не дає змоги користувачам моделі бути упевненими в доцільності моделі людським очікуванням і в безпечності будь-яких її міркувань на етапі її експлуатації. Крім цього обґрунтовано, що фундаментальні обмеження самої здатності до міркування у цих моделей є не лише фактологічними, а й алгоритмічними та онтологічними: ці моделі є обмеженими лінійними скінченними автоматами без тіла у дійсності, загалом позбавленими інших джерел знань і досвіду, крім синтаксису і контексту. Через це модель на рівні конструкції вдається до грубої імітації рефлексії через нечітку авторегресію, якою, фактично, відображається результат пошуку по корпусу текстів, кожен з яких потенційно міг бути створений і самим автором запиту до моделі. З огляду на зазначене власне епістемічна цінність продуктів великої мовної моделі визначається передусім їхньою пошуковою цінністю для користувача і обмежується проблематичністю їхньої атрибуції, валідації, а також необхідністю зовнішньої відповідальної верифікації й оцінки самим користувачем.
Description
The article demonstrates and philosophically expounds the nature, mechanics of reasoning and the fundamental principles of epistemic limitation of modern dialogue large language models based on the Transformer architecture. Large language models are presented as a functionalist mechanistic project of statistical modeling of language and speech as a model of knowledge as a semantic model of reality – 1) a model 2) of a model 3) of a model of reality. It is shown that because of this substantial distance of mediating reality, the intra-model connections tend to lose on their factual capacity. It is also demonstrated that large language models are a product of machine learning of a certain linguistic behavior with a pur-pose and values radically different from the purpose and values of human cognition. Their goal is the principle of satisfying the operator of the reward function by cheating at any set price and by any available means at the training stage, which does not let model users be sure of the alignment of the model with human expectations and of the safety of any its reasoning at the stage of its exploitation. In addition, it is substantiated that the fundamental limitations of the very ability to reason in these models are not only factual, but also algorithmic and ontological: these models are limited linear finite automata without a body in reality, generally devoid of other sources of knowledge and experience, except for syntax and context. Due to this, the model by its design resorts to a rough imitation of reflection through fuzzy autoregression, which, in fact, displays the result of a search on a corpus of texts, each of which could potentially have been created by the author of the request to the model. In connection with the above, the actual epistemic value of the products of a large language model is determined primarily by their search value for the user and is limited by the problematic nature of their attribution, validation, as well as the need for external responsible verification and evaluation by the user themself.
Keywords
гносеологія, епістемологія, механіцизм, фізикалізм, функціоналізм, філософська логіка, філософія мови, філософія техніки, філософія штучного інтелекту, велика мовна модель, стаття, gnoseology, epistemology, mechanical philosophy, physicalism, functionalism, philosophical logic, philosophy of language, philosophy of technology, philosophy of artificial intelligence, large language model
Citation
Маєвський О. Л. Механіка міркування великих мовних моделей: філософський аналіз / Маєвський О. Л. // Наукові записки НаУКМА. Філософія та релігієзнавство. - 2024. - Т. 14. - C. 31-39. - https://doi.org/10.18523/2617-1678.2024.14.31-39