Механіка міркування великих мовних моделей: філософський аналіз

dc.contributor.authorМаєвський, Олександрuk_UA
dc.date.accessioned2025-01-21T09:02:55Z
dc.date.available2025-01-21T09:02:55Z
dc.date.issued2024
dc.descriptionThe article demonstrates and philosophically expounds the nature, mechanics of reasoning and the fundamental principles of epistemic limitation of modern dialogue large language models based on the Transformer architecture. Large language models are presented as a functionalist mechanistic project of statistical modeling of language and speech as a model of knowledge as a semantic model of reality – 1) a model 2) of a model 3) of a model of reality. It is shown that because of this substantial distance of mediating reality, the intra-model connections tend to lose on their factual capacity. It is also demonstrated that large language models are a product of machine learning of a certain linguistic behavior with a pur-pose and values radically different from the purpose and values of human cognition. Their goal is the principle of satisfying the operator of the reward function by cheating at any set price and by any available means at the training stage, which does not let model users be sure of the alignment of the model with human expectations and of the safety of any its reasoning at the stage of its exploitation. In addition, it is substantiated that the fundamental limitations of the very ability to reason in these models are not only factual, but also algorithmic and ontological: these models are limited linear finite automata without a body in reality, generally devoid of other sources of knowledge and experience, except for syntax and context. Due to this, the model by its design resorts to a rough imitation of reflection through fuzzy autoregression, which, in fact, displays the result of a search on a corpus of texts, each of which could potentially have been created by the author of the request to the model. In connection with the above, the actual epistemic value of the products of a large language model is determined primarily by their search value for the user and is limited by the problematic nature of their attribution, validation, as well as the need for external responsible verification and evaluation by the user themself.en_US
dc.description.abstractУ статті показано і філософськи пояснено природу, механіку міркування і фундаментальні засади епістемічної обмеженості сучасних діалогових великих мовних моделей на основі архітектури Transformer. Великі мовні моделі представлено як функціоналістський механістичний проєкт статистичного моделювання мови і мовлення як моделі знання як смислової моделі дійсності — 1) модель 2) моделі 3) моделі дійсності. Показано, що через цю значну дистанцію опосередкування дійсності внутрішньомодельні зв'язки втрачають свій фактологічний потенціал. Також продемонстровано, що великі мовні моделі є продуктом машинного навчання певній мовній поведінці з метою і цінностями, кардинально відмінними від мети і цінності людського пізнання. Їхньою метою є принцип задоволення оператора функції винагороди шляхом обману за будь-яку встановлену ціну і будь-якими наявними засобами на етапі навчання. Останнє не дає змоги користувачам моделі бути упевненими в доцільності моделі людським очікуванням і в безпечності будь-яких її міркувань на етапі її експлуатації. Крім цього обґрунтовано, що фундаментальні обмеження самої здатності до міркування у цих моделей є не лише фактологічними, а й алгоритмічними та онтологічними: ці моделі є обмеженими лінійними скінченними автоматами без тіла у дійсності, загалом позбавленими інших джерел знань і досвіду, крім синтаксису і контексту. Через це модель на рівні конструкції вдається до грубої імітації рефлексії через нечітку авторегресію, якою, фактично, відображається результат пошуку по корпусу текстів, кожен з яких потенційно міг бути створений і самим автором запиту до моделі. З огляду на зазначене власне епістемічна цінність продуктів великої мовної моделі визначається передусім їхньою пошуковою цінністю для користувача і обмежується проблематичністю їхньої атрибуції, валідації, а також необхідністю зовнішньої відповідальної верифікації й оцінки самим користувачем.uk_UA
dc.identifier.citationМаєвський О. Л. Механіка міркування великих мовних моделей: філософський аналіз / Маєвський О. Л. // Наукові записки НаУКМА. Філософія та релігієзнавство. - 2024. - Т. 14. - C. 31-39. - https://doi.org/10.18523/2617-1678.2024.14.31-39uk_UA
dc.identifier.issn2617-1678
dc.identifier.issn2617-5703
dc.identifier.urihttps://doi.org/10.18523/2617-1678.2024.14.31-39
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/33257
dc.language.isoukuk_UA
dc.publisherНаціональний університет "Києво-Могилянська академія"uk_UA
dc.relation.sourceНаукові записки НаУКМА. Філософія та релігієзнавствоuk_UA
dc.statusfirst publisheduk_UA
dc.subjectгносеологіяuk_UA
dc.subjectепістемологіяuk_UA
dc.subjectмеханіцизмuk_UA
dc.subjectфізикалізмuk_UA
dc.subjectфункціоналізмuk_UA
dc.subjectфілософська логікаuk_UA
dc.subjectфілософія мовиuk_UA
dc.subjectфілософія технікиuk_UA
dc.subjectфілософія штучного інтелектуuk_UA
dc.subjectвелика мовна модельuk_UA
dc.subjectстаттяuk_UA
dc.subjectgnoseologyen_US
dc.subjectepistemologyen_US
dc.subjectmechanical philosophyen_US
dc.subjectphysicalismen_US
dc.subjectfunctionalismen_US
dc.subjectphilosophical logicen_US
dc.subjectphilosophy of languageen_US
dc.subjectphilosophy of technologyen_US
dc.subjectphilosophy of artificial intelligenceen_US
dc.subjectlarge language modelen_US
dc.titleМеханіка міркування великих мовних моделей: філософський аналізuk_UA
dc.title.alternativeReasoning mechanics of large language models: a philosophical analysis
dc.typeArticleuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Maievskyi_Mekhanika_mirkuvannia_velykykh_movnykh_modelei_filosofskyi_analiz.pdf
Size:
381.03 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections