Структурований оптимізований пошук у неструктурованих даних для задачі аналізу меню

dc.contributor.authorСмиш, Олегuk_UA
dc.contributor.authorЧижова, Анастасіяuk_UA
dc.date.accessioned2025-05-21T09:25:53Z
dc.date.available2025-05-21T09:25:53Z
dc.date.issued2024
dc.descriptionThe article describes the development of a dish search engine for digital restaurant menus in Kyiv, focusing on Ukrainian-speaking users. The system integrates modern Natural Language Processing (NLP) methods such as lemmatization, text classification, and data filtering, alongside Retrieval-Augmented Generation (RAG), specialized ingredient dictionaries, a database, and an ontological knowledge base designed in Protégé. Using rules from the Semantic Web Rule Language (SWRL) and logical inference through the Pellet reasoning engine, the system performs semantic analysis of user queries, automatically identifying relationships between dish components, and improving search relevance. The search algorithm utilizes a multi-layered approach that combines machine learning, logical reasoning, and rule-based filtering. User queries, often containing informal or varied phrasing, are first processed by a large language model (LLM) to identify and standardize key terms. The LLM is enhanced with predefined dictionaries (e.g., for cheese types like “mascarpone”, “brie,” or “cheddar”) and connected to an ontological knowledge base, which enriches the query with semantic relationships. RAG extends this functionality by automatically expanding search terms to include synonyms or related concepts, such as linking “pasta” to “macaroni” or “spaghetti.” The study incorporates principles of computational social science to analyze semi-structured data from digital restaurant menus, such as the popularity of dishes and their ingredients, as well as the impact of restaurant location on pricing. The data highlights trends in customer preferences and provides actionable insights for optimizing restaurant menus. The developed system successfully integrates NLP techniques, logical reasoning, and structured data storage, achieving high accuracy and relevance in search results. By incorporating an LLM, RAG, and ontological reasoning, the system demonstrates the potential for significantly enhancing customer-oriented services in the restaurant industry through advanced data analysis and semantic search tools.en_US
dc.description.abstractУ статті представлено розроблення пошукової системи для цифрових меню закладів харчування Києва українською мовою. Проєкт реалізовано з використанням сучасних методів обробки природної української мови, зокрема для завдань лематизації, класифікації текстів і фільтрації даних. Основну увагу приділено розробленню алгоритмів, які забезпечують пошук інформації про складники страв, харчові обмеження, алергени та інші ключові характеристики. У рамках дослідження здійснено аналіз цифрових меню київських закладів, що надало змогу сформувати цілісну картину сучасного стану ресторанного бізнесу в Україні. Результати роботи демонструють можливість структурованого та оптимізованого пошуку в неструктурованих даних меню українською мовою, що дає змогу користувачам легко обирати страви, які розміщено ресторанами.uk_UA
dc.identifier.citationСмиш О. Р. Структурований оптимізований пошук у неструктурованих даних для задачі аналізу меню / Смиш О. Р., Чижова А. О. // Наукові записки НаУКМА. Комп'ютерні науки. - 2024. - Т. 7. - С. 63-69. - https://doi.org/10.18523/2617-3808.2024.7.63-69uk_UA
dc.identifier.issn2617-3808
dc.identifier.issn2617-7323
dc.identifier.urihttps://doi.org/10.18523/2617-3808.2024.7.63-69
dc.identifier.urihttps://ekmair.ukma.edu.ua/handle/123456789/34784
dc.language.isoukuk_UA
dc.relation.sourceНаукові записки НаУКМА. Комп'ютерні науки. Том 7uk_UA
dc.statusfirst publisheduk_UA
dc.subjectобробка природної мовиuk_UA
dc.subjectцифрове менюuk_UA
dc.subjectзаклад харчуванняuk_UA
dc.subjectмісто Київuk_UA
dc.subjectпошуковикuk_UA
dc.subjectресторанний бізнесuk_UA
dc.subjectкласифікація текстівuk_UA
dc.subjectвидобування інформаціїuk_UA
dc.subjectфільтрація данихuk_UA
dc.subjectструктурований пошукuk_UA
dc.subjectбаза данихuk_UA
dc.subjectбаза знаньuk_UA
dc.subjectонтологіяuk_UA
dc.subjectProtégéen_US
dc.subjectOWLen_US
dc.subjectSWRLen_US
dc.subjectPelleten_US
dc.subjectрізонерuk_UA
dc.subjectRetrieval-Augmented Generationen_US
dc.subjectінформаційні технологіїuk_UA
dc.subjectінформаційна системаuk_UA
dc.subjectвеликі мовні моделіuk_UA
dc.subjectстаттяuk_UA
dc.subjectnatural language processingen_US
dc.subjectdigital menuen_US
dc.subjectrestauranten_US
dc.subjectKyiv cityen_US
dc.subjectsearch engineen_US
dc.subjectrestaurant businessen_US
dc.subjecttext classificationen_US
dc.subjectinformation extractionen_US
dc.subjectdata filtrationen_US
dc.subjectstructured searchen_US
dc.subjectdatabaseen_US
dc.subjectknowledge baseen_US
dc.subjectontologyen_US
dc.subjectProtégéen_US
dc.subjectOWLen_US
dc.subjectSWRLen_US
dc.subjectPelleten_US
dc.subjectreasoneren_US
dc.subjectRetrieval-Augmented Generationen_US
dc.subjectinformation technologiesen_US
dc.subjectinformation systemen_US
dc.subjectlarge language modelsen_US
dc.titleСтруктурований оптимізований пошук у неструктурованих даних для задачі аналізу менюuk_UA
dc.title.alternativeStructured Optimized Search in Unstructured Data for Menu Analysis Tasksen_US
dc.typeArticleuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Smysh_Strukturovanyi_optymizovanyi_poshuk_u_nestrukturovanykh_danykh_dlia_zadachi_analizu_meniu.pdf
Size:
3.56 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: