The work is dedicated to the solution of an important scientific and technical problem: building a diagnostic decision-support
system in medicine. The foundation of this system is a model developed as a heterogeneous ensemble classifier, which implements
two primary approaches to formulating a diagnostic conclusion through basic models. The first of these approaches is probabilistic. It
is based on the analysis of a training sample of patients with a confirmed diagnosis, which enables estimation of the probability of the
presence of a particular disease based on available data. The second approach is expert-based, relying on expert information about
the structure of symptom complexes that characterize each individual disease. It is important to note that both of these approaches
address the same problem from different perspectives, and their combined use holds great promise for developing effective
diagnostic systems. The purpose of this study is to synthesize a heterogeneous ensemble classifier that integrates both expert and
probabilistic components into the diagnostic process. An analysis of various diagnostic methods used by doctors in alignment with
the current requirements of evidence-based medicine was carried out as part of the study. Methods of constructing diagnostic
decision rules in medical decision-support systems were also considered. Based on these studies, a mathematical model of a
heterogeneous ensemble classifier was developed, with the choice of its constituent parts being justified. Widely used classification
methods were selected as the probabilistic component in this system, particularly the standard comparison method, the k-nearest
neighbors method, and the potential functions method. Expert knowledge concerning the structure of symptom complexes is
formalized by expressing the symptom complexes of each disease in the form of numerical intervals. In this framework, linguistic
variables are used, which can indicate “below the norm”, “norm”, or “above the norm”. Various strategies for aggregating different
types of basic models within the heterogeneous ensemble classifier are reviewed. This approach preserves the advantages of each
method and enhances the overall classification accuracy. Requirements for the developed system's functionality were formulated,
design tools and the main development platform (Java) were defined, and the database management system (MySQL). The decisionsupport system was designed, and a comprehensive evaluation of the developed system was conducted on real medical data. The
results of these tests confirmed the effectiveness of the system.
Робота присвячена вирішенню актуальної науково-технічної задачі побудови діагностичної системи підтримки
прийняття рішень в медицині. . Основою даної системи є модель розробленого гетерогенного ансамблевого класифікатора,
який в якості базових моделей реалізує два підходи до формулювання діагностичного висновку. Перший з цих підходів є
ймовірнісним. Він ґрунтується на аналізі навчальної вибірки з пацієнтів з підтвердженим діагнозом, що дозволяє оцінити
імовірність наявності того чи іншого захворювання на основі наявних даних. Другий підхід – експертний, який базується на
наявній експертній інформації про структуру симптомокомплексів, які характеризують кожне окреме захворювання.
Важливо зазначити, що обидва ці підходи розглядають одну і ту ж проблему з різних точок зору, і їх спільне використання є
надзвичайно перспективним для розвитку ефективних діагностичних систем. Мета цього дослідження полягає в синтезі
гетерогенного ансамблевого класифікатора, який інтегрує як експертну, так і ймовірнісну складову процесу постановки
діагнозу. У рамках дослідження було проведено аналіз різних методів діагностики, що використовуються лікарями
відповідно до сучасних вимог доказової медицини. Також було розглянуто методи побудови діагностичних вирішальних
правил у системах підтримки прийняття медичних рішень. На основі цих досліджень була розроблена математична модель
гетерогенного ансамблевого класифікатора, і було обґрунтовано вибір його складових частин. У якості ймовірнісної
складової в даній системі були обрані широко вживані методи класифікації, зокрема метод порівняння з еталоном, метод Кнайближчих сусідів та метод потенційних функцій. Експертні знання, які стосуються структури симптомокомплексів,
формалізуються шляхом вираження симптомокомплексів кожного захворювання у вигляді числових інтервалів. При цьому
використовуються лінгвістичні змінні, що можуть мати значення “нижче норми”, “норма” або “вище норми”. Розглянуті
різноманітні варіанти агрегації різнотипних базових моделей в межах гетерогенного ансамблевого класифікатора. Це
дозволяє зберігати переваги кожного з методів та підвищувати загальну точність класифікації. Були сформульовані вимоги
до функціональних можливостей розробленої системи, визначено засоби проектування, а також основну платформу для
розробки – Java, і систему управління базами даних – MySQL. Виконано проектування системи підтримки прийняття
рішень та виконано комплексну перевірку розробленої системи на реальних медичних даних. Результати цих перевірок
підтвердили ефективність роботи системи.