Дослідження методів розпізнавання українських текстів, згенерованих великими мовними моделями (Large Language Models)
| dc.contributor.advisor | Кундік, Кирило | uk_UA |
| dc.contributor.author | Гоголь, Антон | uk_UA |
| dc.date.accessioned | 2025-09-05T06:13:08Z | |
| dc.date.available | 2025-09-05T06:13:08Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Дипломна робота присвячена дослідженню та адаптації методів детекції українськомовних текстів, згенерованих великими мовними моделями. Мета роботи – розробка ефективного алгоритму для розпізнавання походження українського тексту: написаного людиною чи згенерованого штучним інтелектом. У дослідженні проаналізовано сучасні підходи до виявлення згенерованого мовними моделями тексту та здійснено їх адаптацію для української мови. Методи детекції систематизовано на дві категорії: ті, що не потребують попереднього навчання (black-box та white-box варіанти алгоритму DNA-GPT), та ті, що базуються на машинному навчанні. Для експериментальної перевірки сформовано збалансований набір даних українських текстів, що включає як оригінальні людські тексти, так і синтезовані за допомогою мовних моделей. На цьому наборі даних проведено оцінку ефективності реалізованих алгоритмів, включаючи донавчання класифікатора на базі моделі BERT. Валідацію результатів здійснено на текстах, згенерованих двома провідними мовними моделями: GPT-4o-mini та Llama 3:70B. | uk_UA |
| dc.identifier.uri | https://ekmair.ukma.edu.ua/handle/123456789/36454 | |
| dc.language.iso | uk | uk_UA |
| dc.status | first published | uk_UA |
| dc.subject | великі мовні моделі | uk_UA |
| dc.subject | машинне навчання | uk_UA |
| dc.subject | DNA-GPT | uk_UA |
| dc.subject | Llama | uk_UA |
| dc.subject | GPT-4o-mini | uk_UA |
| dc.subject | BERT | uk_UA |
| dc.subject | детекція AI-тексту | uk_UA |
| dc.subject | бакалаврська робота | uk_UA |
| dc.title | Дослідження методів розпізнавання українських текстів, згенерованих великими мовними моделями (Large Language Models) | uk_UA |
| dc.title.alternative | Exploring Methods for Detecting Ukrainian Texts Generated by Large Language Models | en_US |
| dc.type | Other | uk_UA |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: