ИИ в здравоохранении

ИИ в здравоохранении

Сервис унифицированной оцифровки медицинских документов – генерация цифрового профиля документов на основе использования Базы медицинских знаний (БМЗ), технологий обработки естественного языка.

НАПРАВЛЕНИЯ ПРОЕКТА

  1. Системы поддержки принятия решения врачом;
  2. Телемедицинские системы и цифровые платформы для медицинских сервисов;
  3. Информационные технологии и решения для обучения специалистов здравоохранения.

Краткое резюме проекта, имеющиеся наработки

  • Создана База медицинских знаний (Knowledge Base) на основе обработки 20 млн медицинских статей из Pubmed и интеграции российских и международных справочников и классификаторов.
  • Разработаны сервисы выделения объектов и связей из медицинских мультиязычных текстов.
  • Разработаны сервисы оцифровки медицинских текстов объектами БМЗ.
  • Разработаны наборы сервисов СППВР, охватывающие множество направлений врачебной деятельности.
  • Создан семантический корпоративный поисковик медицинских текстов.
Принцип организации системы поддержки принятия клинических решений на основе БМЗ

ПРОБЛЕМА. ТЕХНОЛОГИЧЕСКИЕ БАРЬЕРЫ

Проблема, на решение которой направлен проект

Опсание проблемы:

  • До 80% клинически-значимой информации хранится в ЭМК в неструктурированных текстовых записях.
    • Врачебные осмотры
    • Лабораторные исследования
    • Инструментальные исследования
    • Прошлые эпизоды, связанные с заболеваниями
    • Другие данные пациента
  • Врачи перегружены. Времени на прием и внимательный анализ данных пациента не хватает (12 минут на прием), поток пациентов большой.
  • Неравномерность профессионального уровня врачей – молодые специалисты опасаются ставить диагнозы.

Технологические барьеры

В России с развитием проектов ЕГИСЗ и его составляющей СЭМД, стандартизуется (HL7 CDA R2) обмен медицинскими данными ЭМК (EHR) по системе здравоохранения:

  • горизонтальный обмен: ЛПУ – ЛПУ;
  • вертикальный обмен: ЛПУ – страховые медицинские организации – ФОМС – органы здравоохранения – органы статистики.

Регионы начали серию тендеров на модернизацию стандартами обмена с ВИМИС эксплуатируемых в ЛПУ медицинских информационных систем.

Стандарт обмена HL7 CDA R2 подразумевает наличие, как полей, содержащий данные (пол, возраст, вес и т.п.), так и полей, содержащих текстовую информацию, – «Общие сведения о госпитализации», «Анамнез заболевания», «Состояние при поступлении» методы диагностики, лечения и т.д.

Передача информации между субъектами здравоохранения в виде совокупностиданных (не текстовых блоков) могло бы повысить эффективность оказания медицинской помощи.

Однако, все функционирующие в России медицинские информационные системы (МИС) кодируют и хранят в своих базах «холеру» и «ОРВИ» со своими локальными идентификаторами.

Общей задачей «интеллектуализации» функций сопровождения лечебно-диагностического процесса является создание формализованного описания медицинских текстов. Формализация означает, что всем медицинским понятиям и сущностям в медицинских текстах должны быть присвоены идентификаторы из единого централизованного источника.

Выделенные из текстов протоколов лечения, выписных эпикризов, оцифрованные понятия и сущности могут быть использованы в качестве входных данных в существующие компьютерные алгоритмы, реализующие функции систем поддержки принятия врачебных решений: диагностики состояний пациентов, алгоритмы назначения лечения, статистического и экономического анализа. Выделенные понятия и сущности должны быть синхронизированы с кодами российских и международных справочников.

Выделенные из опубликованных на сайте Минздрава и из общепризнанных текстов международных клинических рекомендаций понятия и сущности могут быть использованы для проверки качества медицинской помощи на соответствие принятым стандартам.

Также примером может служить востребованность сервиса разметки выписных эпикризов из стационара кодами МКБ-10. В структуре здравоохранения России назначение кодов МКБ-10 сегодня производят вручную на уровнях:

  • ЛПУ, скорая помощь – коды МКБ-10 являются основой для формирования счетов на оплату по тарифам ОМС/ДМС, статистической отчетности.
  • Страховые медицинские организации – экспертиза счетов по оплате ОМС/ДМС от ЛПУ.
  • Территориальные фонды ОМС – экспертиза счетов от страховых компаний по оплате ОМС.
  • Минздрав и региональные департаменты здравоохранения – статистический учет.
  • Медицинские университеты (53) и исследовательские центры.

Оцифрованные в медицинских документах понятия и сущности могут быть также использованы для реализации функций категоризации, поиска и фильтрации медицинской литературы в больших электронных хранилищах документов, - семантических информационно-поисковых систем.

Большое количество стартапов и ИТ-компаний разрабатывающих решения на основе искусственного интеллекта сконцентрировались на применениях технологий интеллектуальной обработки изображений. Одной из целей этих решений является автоматическая генерация клинических заключений (текстовых) по выявленным на изображениях патологиям. При интеграции этих решений на основе ИИ с существующими МИС, из текстов этих документов должны быть выделены медицинские сущности для загрузки в базу данных МИС.

К сожалению, ни в одном проекте до сих пор не реализовано внедрение функций, которыми бы единообразно кодировались в медицинских текстах все признаки, симптомы и синдромы, результаты лабораторной диагностики, диагнозы, характеризующие состояние пациента, назначения и рекомендации, – в соответствии с принятыми российскими и международными классификаторами и справочниками.

РЕШЕНИЕ

Проблема повышения эффективности информационного обмена по принятым Минздравом РФ стандартам ЕГИСЗ и СЭМД:

  • Сервис разметки медицинских документов предполагается к применению в развёртываемой Минздравом РФ «Платформе для работы с обезличенными медицинскими данными для их разметки, машинного обучения и тестирования математических моделей» (см. «Ведомственная Программа цифровой трансформации Министерства здравоохранения Российской Федерации на 2021 год и на плановый период 2022 и 2023 годов» от 31.08.2021г.).
  • По данным статистики, каждый россиянин в среднем посещает медицинские организации примерно восемь раз в год. Каждое обращение фиксируется в эксплуатируемой в ЛПУ в медицинской информационной системе (МИС) в ЭМК пациента.
  • При обмене информацией о пациенте с другими субъектами системы здравоохранения принятый Минздравом РФ XML-протокол стандарта обмена электронными документами – «HL7 CDA R2» может быть дополнен оцифрованными сущностями ЭМК.
  • Сервис разметки позволяет генерировать:
    • Цифровые профили клинических случаев;
    • Цифровые профили пациента;
    • Цифровые профили заболеваний / состояний / симптомов / синдромов / рекомендованных Минздравом РФ протоколов лечения;
    • Цифровые профили лечебно-профилактических учреждений (необходимы статистике).
Нейронные сети. Разметка поля Клинрека объектами и связями → ГРАФ

В рамках Проекта на основе созданных цифровых профилей созданы пользовательские интерфейсы позволяющие размечать принятые Минздравом РФ клинические рекомендации и представлять эти текстовые документы в виде xml-файлов со структурой «Заболевания – Клинические признаки – Сопутствующие заболевания – Методы диагностики – Методы лечения – Методы профилактики».

Сравнение сгенерированных из текстовых полей электронной медицинской карты пациента (ЭМК) цифровых профилей с цифровыми профилями клинических рекомендаций позволит избежать ошибок при определении диагнозов, назначении процедур диагностики, лечения и профилактики пациентов.

Проблема: врачи перегружены, неравномерность профессионального уровня врачей

Сервис генерации СППВР по отдельным медицинским направлениям (кардиология, урология и т.п.), учитывающий взаимосвязь и взаимозависимость сопутствующих заболеваний, относящихся к различным направлениям. В Базе медицинских знаний (Knowledge Graph) проекта хранится структура, основанная на 200+ российских и международных справочниках, и содержащая 4.4 млн. медицинских сущностей по 100+ типовым группам. Эти сущности объединены в граф, содержащий 1,4 млрд. связей по 950+ типовым группам связей.

Медитека – Информационно-справочная система поддержки принятия врачебных решений

Генерация СППВР по отдельным медицинским направлениям означает фильтрацию и рескоринг выдачи результатов из Базы медицинских знаний, соответствующие данному медицинскому направлению.

В отличие от существующих информационно-справочных медицинских систем, предлагающих врачам читать и осмысливать текстовые выдержки из рекомендуемых протоколов лечения и клинических рекомендаций, сервис может предложить врачу:

  • По введенным признакам состояния пациента – соответствующие им симптомокомплексы. БМЗ содержит 323 тыс. симптомов, признаков и обнаружений, перевязанных заболеваниями, патологиями и анатомией;
  • По предполагаемым диагнозам – сопутствующие диагнозы и осложнения. БМЗ содержит 114 тыс. связанных диагнозов заболеваний и синдромов;
  • По предполагаемым диагнозам – необходимые лабораторные, и диагностические процедуры. БМЗ содержит 98 тыс. подобных процедур;
  • По предполагаемым диагнозам – необходимые лечебные процедуры. БМЗ содержит 307 тыс. терапевтических и профилактических процедур;
  • Лекарственное взаимодействие при различных расстройствах. БМЗ содержит 170 тыс. лекарственных препаратов, химических элементов, а также 1.7 млн. парных взаимодействий (увеличивает /уменьшает воздействие, противопоказан совместное применение и т.п.).

Граф знаний - взаимодействие препаратов

Проблема поддержки научно-исследовательских работ и учебного процесса.

Сервис создания семантических хранилища научных медицинских статей, монографий. Аннотирование медицинских текстов сущностями из Базы медицинских знаний позволяет на хранилищах текстовых документов реализовать не только функции поиска по ключевым словам, но также и функции семантического поиска.

Семантические хранилища, базирующиеся на онтологиях, позволяют гибко подстраивать «на лету» библиографические структуры поиска документов в зависимости от специфических запросов пользователя.

Сервис осуществляет перевод «на-лету» семантически подобранных по запросу пользователя абстрактов англоязычных статей PubMed с выделением в тексте похожих по смыслу запроса сущностей.

Созданный репозиторий семантического хранилища документов медицинской тематики решает проблемы:

  • повышения эффективного семантического поиска информации и данных – исследователи;
  • повышения эффективности учебного процесса в медицинских вузах и училищах.

Доказательная медицина. Нейронные сети – перевод текстов, разметка объектами и связями англо-русскоязычных текстов.

ТЕХНОЛОГИЯ

Описание базовой технологии

При оцифровке медицинских документов необходимо выделять в текстах и идентифицировать объекты и связи между ними используя объекты онтологической базы медицинских знаний. Это требует наличия технологий:

  • Онтологического инжиниринга – необходимо связать в единый граф большое количество российских и международных словарей и справочников;
  • Графовой аналитики – необходимо реализовать эффективные функции навигации по графу и графового изоморфизма (поиска в графе похожих подграфов и узлов);
  • • Функционала обработки естественного языка – выделения в текстах объектов (Name Entity Recognition), выделения связей (Relation Extraction), кластеризации и категоризации объектов и текстов, семантического поиска похожих объектов и текстов.

Технологическая схема решения

Проект базируется на Аналитической интеграционной платформе DataMonitor – системе класса «семантический BI/OLAP», (собственная разработка, в реестре отечественного ПО № 5609 от 26.07.2019).

DataMonitor – окно в Базу медицинских знаний (БМЗ)

Цифровые профили создаются нейронными сетями, анализирующими медицинские тексты алгоритмами NLP. Нейронные сети натренированы, после извлечения из текстов объектов (Name Entity Recognition, NER), «заглядывать» в онтологический граф (Knowledge Graph) для извлечения и классификации фактов (NER + Relation Extraction), упомянутых в этом тексте. Факты извлекаются, как семантические тройки «субъект–предикат–объект», моделирующие практически любые отношения между сущностями.

Использование Knowledge Graph для задачи извлечения фактов позволяет избежать огромной работы по ручной разметке медицинских текстов лингвистами и медицинскими экспертами, требуемой при использованию алгоритмов rule-based modeling.

ТРЕБОВАНИЯ

Минимальные системные требования:

  • ОЗУ не менее 64 GB;
  • SSD - 1Tb
  • операционная система Ubuntu, версии не ниже 18.04;
  • СУБД PostgreSQL, версия не ниже 9.6

Запрос стоимости ПО и инсталяции

Стоимость продукта определяется на основе выбранного функционала, конфигурации программно-аппаратного решения и выполняемых задач. Стоимость рассчитывается менеджером компании и предоставляется клиенту по запросу.

  *

  *

  *

  *

  *

  *

  *

Я подтверждаю правильность введенных данных и даю свое согласие на обработку персональных данных

Либо направьте письмо в произвольной форме на адрес request@avicomp.ru


ЗАГРУЗКИ

  1. Руководство системного программиста
  2. Руководство оператора