Rule–based NLP approaches for architectural monuments documents' extraction

dc.contributor.advisorСмиш, Олег
dc.contributor.authorКирилін, Єгор
dc.date.accessioned2024-03-28T13:49:27Z
dc.date.available2024-03-28T13:49:27Z
dc.date.issued2023
dc.description.abstractМетою роботи є детальний аналіз методів обробки природної мови для використання їх для дослідження та роботи з українськомовним набором даних з реєстру пам'яток культури України. Досліджено географічний та хронологічний розподіли пам'яток, а також способи написання датувань у реєстрі. У процесі роботи виявлено, що існує значна невиправдана варіативність у написанні дат та інших атрибутів пам'яток, що створює складнощі у подальшій обробці та аналізі. Також, опрацьовано найпоширеніші типи пам'яток культури в реєстрі. Кінцевим продуктом є парсер, створений для розв’язання проблеми різноманіття в написанні даних, з використанням методів обробки природної української мови, що дає змогу єдиним та стандартизованим способом вводити інформацію в реєстр, що полегшує подальший аналіз та обробку і забезпечує точність даних. Для створення застосунку використано мову програмування Python, оскільки вона має бібліотеки для аналізу та візуалізації даних, обробки геоданих та інших задач.uk_UA
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/28461
dc.language.isoukuk_UA
dc.statusfirst publisheduk_UA
dc.subjectмодель UDPipeuk_UA
dc.subjectбібліотека статистичної візуалізації Vega-Altairuk_UA
dc.subjectформування інтерактивної мапиuk_UA
dc.subjectрозробка методів для парсераuk_UA
dc.subjectкурсова роботаuk_UA
dc.titleRule–based NLP approaches for architectural monuments documents' extractionuk_UA
dc.typeOtheruk_UA
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
Kyrylin_Kursova_robota.pdf
Size:
899.08 KB
Format:
Adobe Portable Document Format
Loading...
Thumbnail Image
Name:
Kyrylin_Kursova_robota 2.pdf
Size:
1.19 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: