Все новости

Виды медицинских данных для обучения ИИ

17.02.2021
Статьи

Без сбора, хранения и передачи медицинских данных немыслимо развитие медицины. Врачи начали собирать и структурировать их с давних пор – как только заметили, что пациенты обращаются повторно или жалуются на одни и те же симптомы. Информация о пациенте, истории его болезни, методах, длительности и результате лечения стали бесценным кладезем знаний, на который врачи опираются в своей работе.

Сегодня, в эпоху развития технологий машинного обучения, медицинские данные играют особенно важную роль, ведь для создания хорошей модели медицинского искусственного интеллекта требуются большие наборы качественных данных. Благодаря их накоплению и использованию во всём мире плавно происходит модернизация медицины. Искусственный интеллект совершенствует процесс постановки диагноза, прогнозирует возникновение и ход течения заболеваний, помогает врачу в подборе наиболее эффективных методов лечения.

Поскольку наша компания «Медицинские Скрининг Системы» (Цельс) занимается разработкой и внедрением сервиса на базе технологий искусственного интеллекта, работа с медицинскими данными – это большая и очень важная часть нашей деятельности, в которой мы накопили много опыта и компетенции. В этой статье мы расскажем о видах медицинских данных, а заодно приведём примеры российских ИИ-систем, при разработке которых эти данные использовались.

Табличные данные

Пожалуй, самый большой пласт медицинских данных составляют именно табличные данные – текстовые или численные. Как правило, они взяты из:

  • анамнеза пациента;
  • его анкеты (пол, возраст, дата и место рождения, группа крови, резус-фактор и др.);
  • результатов анализов (уровень глюкозы в крови, количество эритроцитов, тромбоцитов, уровень СОЭ и др.).

Стоит отметить, что медицинские данные, в том числе и табличные, не существуют в статическом виде (кроме случаев, когда пациент здоров и не наблюдается в поликлинике). Они накапливаются и отражаются в динамике: это может быть и динамика стадий развития заболевания, и динамика результатов анализов, и динамика состояния пациента.

Благодаря большому объёму и разнообразию табличных медицинских данных, на их основе разрабатывается наибольшее количество ИИ-решений (в сравнение с другими видами медицинских данных).

Яркий пример российской разработки – система предиктивной аналитики Webiomed. Она анализирует данные из электронной медицинской карты пациента, выявляет факторы риска, прогнозирует возможные осложнения и формирует индивидуальные рекомендации врачу и пациенту. Безусловно, одной из главных задач, которые стоят перед Webiomed, является профилактика и контроль течения сердечно-сосудистых заболеваний – поскольку они являются основной причиной смерти людей во всём мире.

Изображение

Ещё один важный вид медицинских данных – изображения. В клинической практике они, как правило, представлены результатами диагностических исследований тех или иных органов – такими как рентген, флюорография, маммография, оцифрованный гистологический препарат. Направление в машинном обучении, в котором используются медицинские изображения, называется «компьютерное зрение» (Computer Vision). В этом направлении работает и наша компания.

Разработанная нами система искусственного интеллекта Цельс анализирует цифровые медицинские снимки и выявляет на них признаки различных патологий, в том числе онкологии на ранней стадии. На данный момент Цельс работает по четырём направлениям диагностики: маммография, флюорография, КТ лёгких и гистологические исследования.

Система «подсвечивает» на снимке именно те области, которые требуют пристального внимания врача, и выполняет триаж списка исследований – ранжирование от наибольшей вероятности наличия патологии до наименьшей. Это минимизирует риски пропуска патологий, а также позволяет быстрее поставить диагноз и начать лечение – а значит, сделать его более эффективным.

Видео

Видеоданные составляют отдельный вид медицинских данных, который также может использоваться при обучении моделей искусственного интеллекта.

Например, такой вид исследований как компьютерная томография (КТ) можно одновременно отнести как к изображениям, так и к видео. Он представляет собой серию слайсов – снимков того или иного органа. На выходе исследуемый орган может быть восстановлен в трёхмерном изображении на основании от нескольких десятков до нескольких тысяч таких слайсов. А видео и есть не что иное как быстро чередующиеся картинки.

Однако в медицинских организациях могут использоваться и другие ИИ-разработки, обученные на видеоданных – и не всегда они напрямую связаны с медициной. Примером могут служить системы аутентификации персонала и управления доступами, разработанные российским «гигантом» компьютерного зрения, компанией Visionlabs.

Звук

И последний вид медицинских данных, который хотелось бы упомянуть – это звук. Прежде всего, сюда относятся записи человеческой речи (например, на приёме врача), которые используются разработчиками для обучения моделей искусственного интеллекта.

Примером такой разработки в области машинного обучения является программа Voice2Med, которая использует технологию распознавания естественной слитной русской речи и служит для голосового заполнения медицинской документации. Система особенно полезна для врачей, руки которых заняты во время осмотра или лечения пациентов: хирургов, стоматологов, специалистов ультразвуковой диагностики.

Таким образом, для обучения систем искусственного интеллекта могут использоваться самые разные виды данных – всё зависит от задачи, которую разработчики ставят перед системой. И поскольку технологии машинного обучения развиваются с огромной скоростью, медицинские данные приобретают всё большую ценность и значимость для прогресса всей мировой медицины.