eONPUIR

Framework for Systematization of Data Science Methods

Показать сокращенную информацию

dc.contributor.author Liubchenko, Vira
dc.contributor.author Любченко, Віра Вікторівна
dc.contributor.author Любченко, Вера Викторовна
dc.contributor.author Komleva, Nataliia
dc.contributor.author Комлева, Наталія Олегівна
dc.contributor.author Комлева, Наталья Олеговна
dc.contributor.author Zinovatna, Svitlana
dc.contributor.author Зіноватна, Світлана Леонідівна
dc.contributor.author Зиноватна, Светлана Леонидовна
dc.contributor.author Pysarenko, Katherine
dc.contributor.author Писаренко, Катерина Олександрівна
dc.contributor.author Писаренко, Екатерина Александровна
dc.date.accessioned 2021-04-10T21:10:06Z
dc.date.available 2021-04-10T21:10:06Z
dc.date.issued 2021-04-10
dc.identifier.citation Liubchenko, V. V., Komleva, N. O., Zinovatna, S. L., Pysarenko, K. O. (2021). Framework for Systematization of Data Science Methods. Applied Aspects of Information Technology, Vol. 4, N 1, p. 80–90. en
dc.identifier.citation Framework for Systematization of Data Science Methods / V. V. Liubchenko, N. O. Komleva, S. L. Zinovatna, K. O. Pysarenko // Applied Aspects of Information Technology = Прикладні аспекти інформ. технологій. – Оdesa, 2021. – Vol. 4, N 1. – P. 80–90. en
dc.identifier.issn 2617-4316
dc.identifier.issn 2663-7723
dc.identifier.uri http://dspace.opu.ua/jspui/handle/123456789/11540
dc.description.abstract The rapid development of data science has led to the accumulation of many models, methods, and techniques that had been successfully applied. As the analysis of publications has shown, the systematization of data science methods and techniques is an urgent task. However, in most cases, the results are relevant to applications in a particular problem domain. The paper develops the framework for the systematization of data science methods, neither domain-oriented nor task-oriented. The metamodel-method- technique hierarchy organizes the relationships between existing methods and techniques and reduces the complexity of their under- standing. The first level of the hierarchy consists of metamodels of data preprocessing, data modeling, and data visualization. The second level comprises methods corresponded to metamodels. The third level collects the main techniques grouped according to methods. The authors describe the guiding principles of the framework use. It provides a possibility to define the typical process of problem-solving with data science methods. A case study is used to verify the framework’s appropriateness. Four cases of applying data science methods to solve practical problems described in publications are examined. It is shown that the described solutions are entirely agreed with the proposed framework. The recommended directions for applying the framework are defined. The constraint of the framework applying is structured or semi-structured data that should be analyzed. Finally, the ways of further research are given. en
dc.description.abstract Бурхливий розвиток науки про дані призвів до накопичення великої кількості моделей, методів і технік, які показали доцільність свого застосування. Як показав аналіз публікацій, систематизація методів і технік науки про дані є актуальною задачею, але в більшості результати релевантні до вирішення конкретної прикладної задачі. В роботі розроблено не орієнто- ваний на конкретну предметну область та задачу фреймворк для систематизації методів науки про дані. Трирівнева ієрархія метамодель-метод-техніка впорядковує залежності між існуючими методами та техніками та знижує складність їх розумін- ня. Перший рівень структури складають три метамоделі: препроцесингу, моделювання та візуалізації даних. На другому рівні розташовані методи, які відповідають метамоделям. На третьому рівні зібрані основні техніки, згруповані відповідно до методів. Також описано принципи використання ієрархії. Для цього формально визначено типовий процес вирішення завдання з залученням методів науки про дані та сформульовано алгоритм використання фреймворку. Метод ситуаційного аналізу застосовано для того, щоб пересвідчитися в працездатності фреймворку. Розглянуто чотири кейси застосування методів науки про дані для вирішення практичних завдань, які описані в сучасних публікаціях. Показано, що описані рі- шення повністю узгоджуються з запропонованою ієрархією методів фреймворку. Визначено рекомендовані напрямки засто- сування фреймворку та його обмеження: об’єкти обраної галузі повинні бути описані лише структурованими або напівстру- ктурованими ознаками. На завершення наведено шляхи подальших досліджень. en
dc.language.iso en en
dc.publisher Odessa National Polytechnic University en
dc.subject Data science; en
dc.subject framework; en
dc.subject data preprocessing; en
dc.subject data modeling; en
dc.subject data visualization; en
dc.subject case study en
dc.subject наука про дані; en
dc.subject фреймворк; en
dc.subject попередня обробка даних; en
dc.subject моделювання даних; en
dc.subject візуалізація даних; en
dc.subject ситуаційний аналіз en
dc.title Framework for Systematization of Data Science Methods en
dc.title.alternative Фреймворк для систематизації методів науки про дані en
dc.type Article en
opu.citation.journal Applied Aspects of Information Technology en
opu.citation.volume 1 en
opu.citation.firstpage 80 en
opu.citation.lastpage 90 en
opu.citation.issue 4 en


Файлы, содержащиеся в элементе

Этот элемент содержится в следующих коллекциях

Показать сокращенную информацию