Глибовець, АндрійПолінчук, Кирило2024-11-082024-11-082024https://ekmair.ukma.edu.ua/handle/123456789/32285Ця дипломна робота присвячена вивченню та впровадженню методів валідації великих даних (Big Data) з використанням сучасних технологій, таких як машинне навчання, та інструментів, таких як Apache Spark. Робота охоплює теоретичні аспекти валідації даних, розглядає ключові характеристики та проблеми, пов'язані з великими даними, а також описує практичні підходи до їх обробки та забезпечення якості.ukApache SparkBig DataDataBricksELTETLEtLTPandasParquetPySparkVeracityвалідаціявеликі даніверифікаціякласифікаціякластеризаціямашинне навчаннямагістерська роботаЗастосування PySpark для забезпечення якості та валідації Вig DataOther