Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/13469
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorKhlevna, Iuliia-
dc.contributor.authorХлевна, Юлія Леонідівна-
dc.contributor.authorKoval, Bohdan-
dc.contributor.authorКоваль, Богдан Сергійович-
dc.contributor.authorКоваль, Богдан Сергеевич-
dc.date.accessioned2023-05-03T21:20:16Z-
dc.date.available2023-05-03T21:20:16Z-
dc.date.issued2022-12-28-
dc.identifier.citationKhlevna, Iu., Koval, В. (2022). Development of infrastructure for anomalies detectionin big data. Аpplied Aspects of Information Technology, Vol. 5, N 4, р. 348–358.еn
dc.identifier.citationKhlevna, Iu. Development of infrastructure for anomalies detectionin big data / Iu. Khlevna, В. Koval // Аpplied Aspects of Information Technology = Прикладні аспекти інформ. технологій. – Оdesa, 2022. – Vol. 5, N 4. – P. 348–358.еn
dc.identifier.issn2617-4316-
dc.identifier.issn2663-7723-
dc.identifier.urihttp://dspace.opu.ua/jspui/handle/123456789/13469-
dc.description.abstractThe work describes the conducted analysis of models, methods, and technologies for detecting anomalies in data. It concludes that, based on the analysis, the solution to the problem of anomaly detection in data should be considered as a complex technology, which consists of the formation and application of mathematical models in combination with the research of data processing approaches. The article analyses the current state of big data stream processing technologies and reflects the peculiarities of the most commonly used and advanced of them, e.g. Apache Hadoop, Apache Spark, Apache Cassandra, Apache Kafka, Apache Storm, and Apache Beam. On top of these, it pays attention to the infrastructure, in which the created software models can be deployed and used, taking into account the high-load real-time nature of the data. The article proposes to form an infrastructure for anomaly detection in data as an applied example of big data processing cloud infrastructure. The paper demonstrates the developed infrastructure model for anomaly detection in real-time stream data, which is based on an expert method of forming requirements for a software component, choosing an algorithm for detecting anomalies, selecting tools, and improving the algorithm. The highlighted anomaly detection tools allow us to create a secure real-time anomaly detection solution using Dataflow, BigQuery ML, and Cloud DLP. The paper presents the applied implementation of anomaly detection in real-time using GCP and Apache Beam -data stream analysis of software logs in the information system and detection of fraudulent ones among them, which will help improve the cyber security of the system. In the end, the work demonstrates possible improvements to the basic model that could help to speed it up.en
dc.description.abstractУ роботі представлено аналіз моделей, методів і технологій виявлення аномалій у даних. Зроблено висновок, що на основі проведеного аналізу рішення проблеми виявлення аномалій у даних слід розглядати як комплексну технологію, яка складається з формування та застосування математичних моделей у поєднанні з дослідженням підходів до обробки даних. У статті проаналізовано сучасний стан технологій обробки потоків великих даних та відображено особливості найбільш поширених і прогресивних з них, напр. Apache Hadoop, Apache Spark, Apache Cassandra, Apache Kafka, Apache Storm і Apache Beam. Окрім цього, увага приділяється інфраструктурі, у якій створені моделі програмного забезпечення можуть бути розгорнуті та використані, беручи до уваги високий характер даних у режимі реального часу. У статті запропоновано сформувати інфраструктуру для виявлення аномалій у даних як прикладний приклад хмарної інфраструктури обробки великих даних. У роботі продемонстровано розроблену модель інфраструктури для виявлення аномалій у потокових даних реального часу, яка базується на експертному методі формування вимог до програмної складової, вибору алгоритму виявлення аномалій, вибору інструментів та удосконалення алгоритму. Виділені інструменти виявлення аномалій дозволяють створити безпечне рішення для виявлення аномалій у реальному часі за допомогою Dataflow, BigQueryMLі CloudDLP. У статті представлено прикладну реалізацію виявлення аномалій у режимі реального часу за допомогою GCPта ApacheBeam–аналіз потоку даних програмних журналів в інформаційній системі та виявлення серед них шахрайських, що допоможе підвищити кібербезпеку системи. Робота демонструє можливі вдосконалення базової моделі, які можуть допомогти її прискоритиen
dc.language.isoenen
dc.publisherOdessа Polytechnic National Universityen
dc.subjectBig dataen
dc.subjectanomaly detectionen
dc.subjectcloud computingen
dc.subjectdata processingen
dc.subjectdata ingestionen
dc.subjectвеликі даніen
dc.subjectвиявлення аномалійen
dc.subjectхмарні обчисленняen
dc.subjectобробка данихen
dc.subjectспоживання данихen
dc.titleDevelopment of infrastructure for anomalies detectionin big dataen
dc.title.alternativeРозробка інфраструктури виявлення аномалійу наборах великих данихen
dc.typeArticleen
opu.citation.journalApplied Aspects of Information Technologyen
opu.citation.volume4en
opu.citation.firstpage348en
opu.citation.lastpage358en
opu.citation.issue5en
Располагается в коллекциях:2022, Vol. 5, № 4

Файлы этого ресурса:
Файл Описание РазмерФормат 
154-Article Text-369-1-10-20230103.pdf741.74 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.