Алгоритмы и программное обеспечение извлечения значимых предикторов из электронных медицинских записей
В работе решается задача извлечения предикторов из электронных медицинских записей первичного осмотра. Для этого был спроектирован и разработан алгоритм на основе контекстно-свободной грамматики с помощью парсера Yargy. Результаты тестирования алгоритма показали, что алгоритм эффективен: 44 из 49 предикторов были определены с высокой точностью. Также был разработан предназначенный для использования врачами веб-сервис, который отображает структурированный список извлеченных предикторов.
Введение 14
1 Обработка естественного языка 16
1.1 Обработка медицинских текстов . . . . . . . . . . . . . . . . . . 16
1.1.1 Специфика задачи извлечения информации . . . . . . . . 16
1.1.2 Подзадачи извлечения информации . . . . . . . . . . . . 18
1.1.3 Медицинские тексты и их специфика . . . . . . . . . . . 19
1.2 Методы извлечения фактов из медицинских текстов . . . . . . . 21
1.2.1 Методы статистического моделирования . . . . . . . . . . 21
1.2.2 Методы, основанные на эвристических правилах . . . . . 22
1.2.3 Принципы работы методов, основанных на эвристиче-
ских правилах . . . . . . . . . . . . . . . . . . . . . . . . 24
1.3 Контекстно-свободная грамматика . . . . . . . . . . . . . . . . . 25
1.3.1 Парсеры на основе контекстно-свободных грамматик . . 26
1.3.2 Томита-парсер . . . . . . . . . . . . . . . . . . . . . . . . 27
1.3.3 Yargy-парсер . . . . . . . . . . . . . . . . . . . . . . . . . 28
2 Проектирование алгоритма 29
2.1 Структура первичного осмотра . . . . . . . . . . . . . . . . . . . 29
2.2 Подход к извлечению предикторов из первичного осмотра . . . 31
2.2.1 Выбор парсера контекстно-свободных грамматик . . . . . 31
2.3 Составление грамматик . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.1 Правила для извлечения числовых предикторов . . . . . 34
2.3.2 Правила для извлечения температурных предикторов . . 34
2.3.3 Правила для извлечения временных предикторов . . . . 35
2.3.4 Правила для извлечения полового предиктора . . . . . . 37
2.3.5 Правила для извлечения симптоматических предикторов 37
2.3.6 Правила для определения анамнестических предикторов 38
2.3.7 Правила для определения объективно-диагностических
предикторов . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.3.8 Принцип работы алгоритма извлечения предикторов . . 40
2.4 Результаты работы алгоритма . . . . . . . . . . . . . . . . . . . 41
3 Разработка веб-сервиса 44
3.1 Принцип работы . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Программно-аппаратная часть . . . . . . . . . . . . . . . . . . . 45
3.3 Описание базы данных . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4 Клиентская сторона пользовательского интерфейса . . . . . . . 48
Заключение 49
4 Финансовый менеджмент, ресурсоэффективность и ресурсо-
сбережение 50
4.1 Предпроектный анализ . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.1 Потенциальные потребители результатов исследования . 51
4.1.2 Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения . . . . . . . 52
4.1.3 SWOT-анализ . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2 Инициация проекта . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2.1 Цели и результат проекта . . . . . . . . . . . . . . . . . . 55
4.2.2 Организационная структура проекта . . . . . . . . . . . . 55
4.2.3 Ограничения и допущения проекта . . . . . . . . . . . . . 56
4.3 Планирование управления проектом . . . . . . . . . . . . . . . . 56
4.3.1 Бюджет проекта . . . . . . . . . . . . . . . . . . . . . . . 60
4.3.2 Реестр рисков проекта . . . . . . . . . . . . . . . . . . . . 65
4.4 Определение экономической эффективности . . . . . . . . . . . 66
Заключение по разделу . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5 Социальная Ответственность 68
5.1 Правовые и организационные вопросы обеспечения безопасности 68
5.1.1 Специальные правовые нормы трудового законодатель-
ства . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.1.2 Организационные мероприятия при компоновке рабочей
зоны . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
5.2 Производственная безопасность . . . . . . . . . . . . . . . . . . . 70
5.2.1 Недостаточная освещенность рабочей зоны . . . . . . . . 72
5.2.2 Отклонение показателей микроклимата . . . . . . . . . . 75
5.2.3 Превышение уровня шума . . . . . . . . . . . . . . . . . . 76
5.2.4 Перенапряжение анализаторов . . . . . . . . . . . . . . . 77
5.2.5 Статические перегрузки, связанные с рабочей позой . . . 79
5.2.6 Повышенное значение напряжения в электрической цепи 79
5.3 Экологическая безопасность . . . . . . . . . . . . . . . . . . . . . 81
5.4 Безопасность в чрезвычайных ситуациях . . . . . . . . . . . . . 82
Заключение по разделу . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Список публикаций 85
Список литературы 86
Приложение А Natural language processing 94
Приложение Б Дипломы конференций и конкурсов 105
Приложение В Скриншоты веб-севриса 108
Врачи в наше время сталкиваются с напряженной умственной нагруз-
кой. Помимо приемов и осмотров пациентов им приходится иметь дело с элек-
тронными медицинскими записями, из которых нужно находить необходимые
факты о том или ином пациенте. Кроме того, с 1 февраля 2021 года вступил
в силу приказ Минздрава здравоохранения России №947н о полном переходе
медицинской документации в электронные формы [1], что еще больше увели-
чит нагрузку на врачей при таком формате.
Электронная запись первичного осмотр хоть и и разбита на семанти-
ческие блоки, но тем не менее набирается сплошным текстом. А поиск кон-
кретного факта о пациенте требует беглого просмотра всего документа. Эти
факты играют ключевую роль при назначении лечения, а также могут по-
служить обучающими данными при создании различных моделей машинного
обучения для оценки эффективности лечения и прогноза выздоровления.
Данная работа посвящена разработке алгоритма по извлечению зна-
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!