Rule–based NLP approaches for architectural monuments documents' extraction
dc.contributor.advisor | Смиш, Олег | |
dc.contributor.author | Кирилін, Єгор | |
dc.date.accessioned | 2024-03-28T13:49:27Z | |
dc.date.available | 2024-03-28T13:49:27Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Метою роботи є детальний аналіз методів обробки природної мови для використання їх для дослідження та роботи з українськомовним набором даних з реєстру пам'яток культури України. Досліджено географічний та хронологічний розподіли пам'яток, а також способи написання датувань у реєстрі. У процесі роботи виявлено, що існує значна невиправдана варіативність у написанні дат та інших атрибутів пам'яток, що створює складнощі у подальшій обробці та аналізі. Також, опрацьовано найпоширеніші типи пам'яток культури в реєстрі. Кінцевим продуктом є парсер, створений для розв’язання проблеми різноманіття в написанні даних, з використанням методів обробки природної української мови, що дає змогу єдиним та стандартизованим способом вводити інформацію в реєстр, що полегшує подальший аналіз та обробку і забезпечує точність даних. Для створення застосунку використано мову програмування Python, оскільки вона має бібліотеки для аналізу та візуалізації даних, обробки геоданих та інших задач. | uk_UA |
dc.identifier.uri | https://ekmair.ukma.edu.ua/handle/123456789/28461 | |
dc.language.iso | uk | uk_UA |
dc.status | first published | uk_UA |
dc.subject | модель UDPipe | uk_UA |
dc.subject | бібліотека статистичної візуалізації Vega-Altair | uk_UA |
dc.subject | формування інтерактивної мапи | uk_UA |
dc.subject | розробка методів для парсера | uk_UA |
dc.subject | курсова робота | uk_UA |
dc.title | Rule–based NLP approaches for architectural monuments documents' extraction | uk_UA |
dc.type | Other | uk_UA |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: