Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах

Журман, Дмитрий Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа направлена на повышение эффективности анализа электронных медицинских карт (ЭМК) с помощью разработки инструментов автоматического извлечения временных конструкций из медицинской документации. Полученные инструменты позволят перенести данные конструкции на временную шкалу и представить их в удобном для медицинских сотрудников виде.

Обозначения и сокращения ……………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 17
1. Системы извлечения временных конструкций из медицинских
текстов ……………………………………………………………………………………….. 18
1.1 Гибридная система извлечения временной информации из
клинического текста …………………………………………………………………………… 18

1.2 Комплексное обнаружение временной информации из
клинического текста: медицинские события, время и идентификация
TLINK ……………………………………………………………………………………….. 19

1.3 Сквозная система для определения временных отношений в
выписках ……………………………………………………………………………………….. 20

1.4 Выводы ……………………………………………………………………………. 21

2. Проектирование программного обеспечения идентификации
временных конструкций ………………………………………………………………………… 23
2.1 Архитектура разрабатываемого программного обеспечения .. 23

2.2 Выбор синтаксического парсера для русского языка …………… 24

2.3 Выбор парсера контекстно-свободных грамматик для русского
языка ……………………………………………………………………………………….. 26

2.4 Выводы ……………………………………………………………………………. 28

3. Разработка алгоритмов и программного обеспечения
идентификации временных конструкций ………………………………………………… 29
3.1 Создание правил контекстно-свободных грамматик для поиска
временных конструкций и нормализации …………………………………………….. 29

3.2 Алгоритм поиска событий, связанных с временными
конструкциями ………………………………………………………………………………….. 31

3.3 Разработка модуля поиска отрицаний ………………………………… 34

3.4 Обработка неопределенностей ………………………………………….. 36
3.5 Тестирование разработанного программного обеспечения ….. 40

3.6 Результат работы модуля ………………………………………………….. 42

3.7 Выводы ……………………………………………………………………………. 43

4. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение………………………………………………………………………………… 44
4.1 Предпроектный анализ ……………………………………………………… 44

4.1.1 Анализ конкурентоспособности технического решения………. 45
4.1.2 Диаграмма Исикавы …………………………………………………………. 46
4.1.3 SWOT-анализ …………………………………………………………………… 47
4.2 Инициация проекта…………………………………………………………… 48

4.2.1 Цели и результаты проекта ……………………………………………….. 48
4.2.2 Организационная структура проекта ………………………………….. 49
4.3 Планирование управления научно-техническим проектом ….. 50

4.3.1 Структура работы в рамках проекта …………………………………… 50
4.3.2 Структура работы в рамках проекта …………………………………… 51
4.3.3 Разработка графика проведения научного исследования ……… 53
4.4 Бюджет научного и исследования ……………………………………… 54

4.4.1 Расчет материальных затрат ……………………………………………… 54
4.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ ………………………………………………. 55
4.4.3 Основная заработная плата ……………………………………………….. 55
4.4.4 Дополнительная заработная плата исполнителей темы ……….. 57
4.4.5 Отчисление во внебюджетные фонды ………………………………… 57
4.4.6 Накладные расходы ………………………………………………………….. 58
4.4.7 Прямые затраты ……………………………………………………………….. 58
4.4.8 Формирование бюджета затрат научно-исследовательского
проекта ……………………………………………………………………………. 59
4.5 Риски ………………………………………………………………………………. 59

4.6 Выводы ……………………………………………………………………………. 60

5. Социальная ответственность …………………………………………….. 61
5.1 Правовые и организационные вопросы обеспечения
безопасности ……………………………………………………………………………………… 61

5.1.1 Специальные (характерные для проектируемой рабочей зоны)
правовые нормы трудового законодательства …………………….. 61
5.1.2 Организационные мероприятия при компоновке рабочей зоны .
…………………………………………………………………………………. 62
5.2 Производственная безопасность ………………………………………… 63

5.2.1 Анализ вредных и опасных факторов, которые может создать
объект исследования ………………………………………………………… 63
5.2.2 Перенапряжение анализаторов, в том числе вызванное
информационной нагрузкой ………………………………………………. 65
5.2.3 Отсутствие или недостаток естественного света и
недостаточная освещенность рабочей зоны. ……………………….. 65
5.2.4 Статические перегрузки, связанные с рабочей позой ………….. 68
5.2.5 Превышение уровня шума на рабочем месте ……………………… 69
5.2.6 Повышенный уровень электромагнитных излучений ………….. 70
5.2.7 Повышенное значение напряжения в электрической цепи,
замыкание которой может произойти через тело человека ….. 71
5.2.8 Обоснование мероприятий по защите исследователя от
действия опасных и вредных факторов ………………………………. 72
5.3 Экологическая безопасность ……………………………………………… 73

5.3.1 Анализ влияния объекта и процесса исследования на
окружающую среду ………………………………………………………….. 73
5.3.2 Обоснование мероприятий по защите окружающей среды ….. 74
5.4 Безопасность в чрезвычайных ситуациях …………………………… 75

5.4.1 Анализ вероятных ЧС, которые может инициировать объект
исследований …………………………………………………………………… 75
5.4.2 Анализ вероятных ЧС, которые могут возникнуть в
лаборатории при проведении исследований ……………………….. 75
5.4.3 Обоснование мероприятий по предотвращению ЧС и
разработка порядка действия в случае возникновения ЧС …… 76
5.5 Выводы ……………………………………………………………………………. 77

Заключение …………………………………………………………………………………………… 79
Список используемых источников ………………………………………………………….. 81
ПРИЛОЖЕНИЕ А Раздел на английском языке ………………………………………. 86
ПРИЛОЖЕНИЕ Б Диаграмма Ганта ……………………………………………………… 104
ПРИЛОЖЕНИЕ В Реестр рисков ………………………………………………………….. 105
Обозначения и сокращения

В данной работе используются следующие определения и обозначения:

ПО – программное обеспечение;

ВК – временная конструкция;

ЭМК – электронные медицинские карты;

SVM – support vector machine;

LSTM – Long short-term memory;

GRU – Gated Recurrent Units;

CRF – Conditional random field.

Во время заболевания или нахождения в больнице с пациентом
происходят различные события. Например, пациент получает лечение,
появляются новые симптомы, выполнятся операции и т.д. Если переложить
вышеперечисленные события из анамнеза на временную шкалу, врач сможет
наглядно видеть, что и когда происходило с пациентом. Также это позволит
подготовить набор данных для предиктивных моделей в медицине и
здравоохранении. Информацию о данных событиях можно получить из
анамнеза Электронных Медицинских Карт. К сожалению, анамнез пациента
имеет неструктурированную форму. Усложняет задачу то, что для русского
языка отсутствует размеченный набор медицинских данных. Следовательно,
решение данной задачи возможно только при помощи синтаксического и
морфологического анализа, а также грамматических правил.
Таким образом, цель работы – повышение эффективности анализа
электронных медицинских карт с помощью разработки инструментов
автоматического извлечения временных конструкций из медицинской
документации. Полученные инструменты позволят перенести данные
конструкции на временную шкалу и представить их в удобном для
медицинских сотрудников виде. Также результаты работы могут быть
востребованы научными центрами, занимающимися применением машинного
обучения в области медицины, так как полученные инструменты позволяют
собрать необходимые для обучения данные. Теоретическая значимость данной
работы заключается в разработке алгоритмов и методов по извлечению
значимой информации из ЭМК, не прибегая к методам машинного обучения.

В ходе выполнения данной работы были выполнены следующие
задачи:
1. Проведен обзор и сравнение основных синтаксических парсеров
для русского языка на последней версии корпуса тестов syntagrus. Наилучшую
точность показал парсер qbic, но из-за отсутствия подробной документации
для разработки ПО использован парсер DeepPavlov.
2. Разработан модуль для извлечения временных конструкций.
Данный модуль использует контекстно-грамматический парсер Spacy.
Точность работы данного модуля составляет 95.5% на тестовом наборе
данных. Также данный модуль способен выполнять нормализацию ВК, то есть
преобразования даты к формату ГГГГ-ММ-ДД при помощи стандартной
библиотеки datetime языка Python и библиотеки dateutil.
3. Разработан модуль для извлечения событий, связанных с ними,
работающий с точностью 70%. Данный модуль на основе результатов
синтаксического парсинга прокладывает маршрут в древе зависимостей от
найденной ВК к связанному с ней событию.
4. Для решения возникшей проблемы пропущенных отрицательных
частиц был разработан модуль поиска отрицаний, который работает с
точностью 78,4%. Данный модуль на основе результатов синтаксического
парсинга ищет связь в древе зависимостей от отрицательной частицы,
найденной при помощи контекстно-грамматического парсинга, к связанной с
ней сущности.
5. Добавлена обработка неопределенностей, объединяющая
нечеткую логику и метод интервалов с расширяющимися границами.
Данная работа поможет переложить события из анамнеза на временную
шкалу и собрать данные для последующей обработки и моделирования.
В дальнейшем могут быть произведены следующие улучшения
системы:
1. Нормализация временных конструкций, которые зависят от
других событий в анамнезе.
2. Добавление темпоральной логики.
3. Поддержка немедицинских данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    user1250010 Омский государственный университет, 2010, преподаватель,...
    4 (15 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    21 Выполненная работа
    Оксана М. Восточноукраинский национальный университет, студент 4 - ...
    4.9 (37 отзывов)
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политоло... Читать все
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политологии.
    #Кандидатские #Магистерские
    68 Выполненных работ
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы
    Анастасия Б.
    5 (145 отзывов)
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическо... Читать все
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическому и гуманитарному направлениях свыше 8 лет на различных площадках.
    #Кандидатские #Магистерские
    224 Выполненных работы
    AleksandrAvdiev Южный федеральный университет, 2010, преподаватель, канд...
    4.1 (20 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    28 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)