Класифікація патернів білків на мікроскопічних зображеннях з використанням глибоких нейронних мереж
DOI:
https://doi.org/10.15276/hait.01.2019.3Ключові слова:
Human Protein Atlas, глибоке навчання, нейронні мережі, класифікація, розпізнавання образівАнотація
В наш час точна діагностика захворювань, їх лікування та прогноз є гострою проблемою сучасної медицини. Вивчаючи інформацію про людські протеїни, можливо ідентифікувати диференційно експресовані білки. Ці протеїни є потенційно цікавими біомаркерами, які слід використовувати для точного діагнозу, прогнозу або вибору індивідуального лікування, особливо в разі онкологічних захворювань. Результати досліджень показують, що відносно мало білків мало білків в людському тілі є тканеспеціфічнимі. Майже половина всіх білків класифікується як допоміжні білки, що експресуються в усіх клітинах. Тільки 2300 білків в організмі людини були ідентифіковані як тканеспеціфічні, що означає, що вони мають підвищені рівні експресії в певних тканинах. Завдяки досягненням в області високопродуктивної мікроскопії зображення генеруються занадто швидко для ручної оцінки. Отже, потреба в автоматизації аналізу біомедичних зображень як ніколи велика, щоб прискорити розуміння людських клітин і захворювань. Історично класифікація білків обмежувалася індивідуальними паттернами в одному або декількох типах клітин, але для повного розуміння складності людської клітини моделі повинні класифікувати змішані па терни відповідно до кількості різних типів людських клітин. У статті сформульована проблема класифікації зображень в медичних дослідженнях. У цій області активно використовуються методи класифікації з використанням глибоких загортальних нейронних мереж. Представлена стаття дає короткий огляд різних підходів і методів подібного дослідження. Як набору даних було взято «Human Protein Atlas», що представляє тканинну карту протеома людини, складену в 2014 році після 11 років досліджень. Всі дані профілювання експресії протеїнів загальнодоступні в інтерактивній базі даних, що дозволяє досліджувати протеом людини на тканинній основі. Було проведено аналіз робіт і методів, які були використані в ході дослідження. Для вирішення цієї завдані запропонована модель глибокої нейронної мережі з урахуванням характеристик домену і досліджуваної вибірки. Модель нейронної мережі заснована на архітектурі Inception-v3. Процедура оптимізації містить комбінацію декількох методів для швидкої збіжності: стохастичний градієнтний спуск з перезапуском (зміна швидкості навчання для вивчення різних локальних мінімумів), прогресивне зміна розміру зображення (навчання починається з невеликої роздільної здатності і послідовно збільшує її кожен цикл SGDR). Ми пропонуємо новий метод вибору порогу для заходи F1. Розроблена модель може бути використана для створення приладу, інтегрованого в медичну систему інтелектуальної мікроскопії, для визначення місця розташування білка по високоефективному зображенню.