Разработка алгоритмов Федеративного обучение и интеграция методов обучения с малым числом примеров для классификации болезней грудной клетки в рентген снимках

Руководитель проекта: Маханов Н.М.​

Источник финансирования: ГФ молодых ученых по проекту «Жас ғалым»

Цель проекта: Разработать архитектуру диагностики Covid-19 и других патологий на основе рентгеновских снимков легких используя Федеративное Обучение и методы обучения с малым числом примеров.​

Годы реализации: 2024  – 2026   ​

Объем финансирования:  29 858 850 тенге​

Задачи проекта

  1. Интеграция федеративного обучения (ФО)
  2. Разработка облегченных моделей
  3. Реализация алгоритмов обучения с малым числом примеров в рамках федеративного обучения

Ожидаемые результаты

  • Федеративное обучение с обучением в несколько этапов будет способствовать развитию научных знаний в области классификации медицинских изображений грудной клетки. Кроме того, в рамках проекта будет создан небольшой прототип веб-ресурса, который будет использоваться для масштабирования и коммерциализации технологии.
  • Результаты проекта «Разработка алгоритмов Федеративного обучение и интеграция методов обучения с малым числом примеров для классификации болезней грудной клетки в рентген снимках.» в первую очередь ориентированы на различные частные и государственные медицинские организации, занимающиеся выявлением заболеваний органов грудной клетки с использованием рентгеновских снимков. Они будут представлять более широкий интерес для приоритетных направлений научного развития: Интеллектуальный потенциал страны, Наука о жизни и здоровье, Национальная безопасность и оборона, а также для ученых и учреждений, занимающихся проектированием и развитием исследований ИИ, применяемых в работе с медицинскими изображениями.
  • Результатом исследования являются публикации как минимум в двух в журналах из первых трех квартилей по импакт-фактору в базе данных Web of Science или имеющих процентиль по CiteScore в базе данных Scopus не менее 50 в областях компьютерного зрения, медицины и искусственного интеллекта. В AITU будет организован семинар с участием ученых и представителей промышленности для распространения основных результатов исследований. Заявка на патент на новую компоновку также будет рассмотрена после успеха запланированных испытаний. Результаты и данные исследования будут заархивированы на серверах, предоставленных AITU. Для распространения результатов исследований, повышения вероятности реализации и коммерциализации проекта на сайте AITU будет создана веб-страница, которая будет содержать краткую информацию о проекте, включая актуальность, цель, ожидаемые и достигнутые результаты, имя и фамилию членов исследовательской группы.

Предварительные результаты

  • Собраны данные рентген снимков легких с многоклассовой классификацией и классификации по нескольким меткам в одном снимке.​
  • Разработаны алгоритмы и натренированы модели глубокого обучения.​
  • Реализована рабочая архитектура федеративного обучения для рентген снимков на популярных фрейворках как Pytorch, Flower, timm.​
  • Применен алгоритм Дирихле (Latent Dirichlet Allocation) для превращения данных с классовым дисбалансом.​
  • Применены наказания (penalties) L1 и L2, вероятность отключения (dropout), аугментация данных, и пакетная нормализация.​
  • Получены результаты оценки точности, расчет чувствительности, F1-оценка, специфичность, анализ рабочих характеристик приемника, анализ матрицы неточностей.​

Команда проекта

Nursultan Makhanov

PI, PhD in Computer Science. Department of Computer Engineering