Гетерогенний ансамблевий класифікатор у комп’ютерних системах медичної діагностики
DOI:
https://doi.org/10.15276/hait.07.2024.26Ключові слова:
медична діагностика, ансамблевий класифікатор, базова модель, ймовірнісний класифікатор, симптомокомплекс, експертна інформація, агрегації моделей, система підтримки прийняття рішеньАнотація
Робота присвячена вирішенню актуальної науково-технічної задачі побудови діагностичної системи підтримки прийняття рішень в медицині. . Основою даної системи є модель розробленого гетерогенного ансамблевого класифікатора, який в якості базових моделей реалізує два підходи до формулювання діагностичного висновку. Перший з цих підходів є ймовірнісним. Він ґрунтується на аналізі навчальної вибірки з пацієнтів з підтвердженим діагнозом, що дозволяє оцінити імовірність наявності того чи іншого захворювання на основі наявних даних. Другий підхід – експертний, який базується на наявній експертній інформації про структуру симптомокомплексів, які характеризують кожне окреме захворювання. Важливо зазначити, що обидва ці підходи розглядають одну і ту ж проблему з різних точок зору, і їх спільне використання є надзвичайно перспективним для розвитку ефективних діагностичних систем. Мета цього дослідження полягає в синтезі гетерогенного ансамблевого класифікатора, який інтегрує як експертну, так і ймовірнісну складову процесу постановки діагнозу. У рамках дослідження було проведено аналіз різних методів діагностики, що використовуються лікарями відповідно до сучасних вимог доказової медицини. Також було розглянуто методи побудови діагностичних вирішальних правил у системах підтримки прийняття медичних рішень. На основі цих досліджень була розроблена математична модель гетерогенного ансамблевого класифікатора, і було обґрунтовано вибір його складових частин. У якості ймовірнісної складової в даній системі були обрані широко вживані методи класифікації, зокрема метод порівняння з еталоном, метод К-найближчих сусідів та метод потенційних функцій. Експертні знання, які стосуються структури симптомокомплексів, формалізуються шляхом вираження симптомокомплексів кожного захворювання у вигляді числових інтервалів. При цьому використовуються лінгвістичні змінні, що можуть мати значення “нижче норми”, “норма” або “вище норми”. Розглянуті різноманітні варіанти агрегації різнотипних базових моделей в межах гетерогенного ансамблевого класифікатора. Це дозволяє зберігати переваги кожного з методів та підвищувати загальну точність класифікації. Були сформульовані вимоги до функціональних можливостей розробленої системи, визначено засоби проектування, а також основну платформу для розробки – Java, і систему управління базами даних – MySQL. Виконано проектування системи підтримки прийняття рішень та виконано комплексну перевірку розробленої системи на реальних медичних даних. Результати цих перевірок підтвердили ефективність роботи системи.