Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/14785
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.authorYarema, Oleg R.-
dc.contributor.authorЯрема, Олег Романович-
dc.contributor.authorBabichev, Sergii A.-
dc.contributor.authorБабічев, Сергій Анатолійович-
dc.date.accessioned2024-12-15T16:33:41Z-
dc.date.available2024-12-15T16:33:41Z-
dc.date.issued2024-12-04-
dc.identifier.issn2663-0176-
dc.identifier.issn2663-7731-
dc.identifier.urihttp://dspace.opu.ua/jspui/handle/123456789/14785-
dc.description.abstractThe analysis of gene expression data has grown increasingly complex with the expansion of high-throughput techniques like bulk RNA-seq and scRNA-seq. These datasets challenge traditional clustering methods, which often struggle with the high dimensionality, noise, and variability in biological data. Consequently, biclustering methods, which group genes and conditions simultaneously, have gained popularity in bioinformatics. Biclustering is valuable for identifying co-regulated gene subsets under specific conditions, aiding in the exploration of transcriptional modules and gene-disease links. This review examines both traditional clustering and biclustering methods for gene expression analysis, covering applications such as patient stratification, gene network identification, and drug-gene interaction studies. Key biclustering algorithms are discussed, focusing on their strengths and challenges in handling complex profiles. The article highlights significant issues like hyperparameter optimization, scalability, and the need for biologically interpretable results. Emerging trends are also reviewed, such as consensus clustering and distance metrics for high-dimensional data, with attention to the limitations of evaluation metrics. The potential for these methods in diagnostic systems for diseases like cancer and neurodegenerative disorders is also considered. Finally, we outline future directions for enhancing clustering and biclustering algorithms to create a personalized medicine system based on gene expression data.en
dc.description.abstractАналіз даних експресії генів стає дедалі складнішим через розширення високопродуктивних технологій, таких як bulk RNA-seq та одноядерне секвенування РНК (scRNA-seq). Ці набори даних створюють значні виклики для традиційних методів кластеризації, які часто не здатні справлятися з високою вимірністю, шумом та варіабельністю, властивими біологічним даним. Як результат, у біоінформатиці набувають популярності методи бікластеризації, що дозволяють одночасно групувати гени та умови. Бікластеризація є корисною для ідентифікації підмножин співрегульованих генів за певних умов, сприяючи дослідженню транскрипційних модулів та зв’язків між генами та хворобами. Цей огляд охоплює як традиційні методи кластеризації, так і методи бікластеризації для аналізу експресії генів, розглядаючи їх застосування для стратифікації пацієнтів, ідентифікації генних мереж та дослідження взаємодії між генами та ліками. Обговорено ключові алгоритми бікластеризації з акцентом на їхні сильні сторони та виклики у роботі зі складними профілями. Стаття висвітлює важливі питання, такі як оптимізація гіперпараметрів, масштабованість та необхідність біологічно інтерпретованих результатів. Розглянуто новітні тенденції, такі як консенсусна кластеризація та метрики відстані для високовимірних даних, а також обмеження поточних метрик оцінки. Розглядається потенціал цих методів у діагностичних системах для таких захворювань, як рак та нейродегенеративні розлади. Нарешті, ми окреслюємо перспективні напрями для вдосконалення алгоритмів кластеризації та бікластеризації з метою створення системи персоналізованої медицини на основі даних експресії генів..en
dc.language.isoenen
dc.publisherOdessа Polytechnic National Universityen
dc.subjectData miningen
dc.subjectgene expression dataen
dc.subjectclusteringen
dc.subjectbiclusteringen
dc.subjectdecision-making systemen
dc.subjectensemble-based methodsen
dc.subjectalternative votingen
dc.subjectінтелектуальний аналіз данихen
dc.subjectдані експресії генівen
dc.subjectкластеризаціяen
dc.subjectбікластеризаціяen
dc.subjectсистема прийняття рішеньen
dc.subjectметоди на основі ансамблівen
dc.subjectальтернативне голосуванняen
dc.subjectперсоналізована медицинаen
dc.titleCurrent state of methods and algorithms for gene expression data clustering and biclustering: A surveyen
dc.title.alternativeСучасний стан методів і алгоритмів кластеризації та бікластеризації для аналізу даних експресії генівen
dc.typeArticleen
opu.citation.journalHerald of Advanced Information Technologyen
opu.citation.volume4en
opu.citation.firstpage347en
opu.citation.lastpage360en
opu.citation.issue7en
Располагается в коллекциях:2024, Vol. 7, № 4

Файлы этого ресурса:
Файл Описание РазмерФормат 
1_Yarema.pdf861.94 kBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.