Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах

Журман, Дмитрий Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа направлена на повышение эффективности анализа электронных медицинских карт (ЭМК) с помощью разработки инструментов автоматического извлечения временных конструкций из медицинской документации. Полученные инструменты позволят перенести данные конструкции на временную шкалу и представить их в удобном для медицинских сотрудников виде.

Обозначения и сокращения ……………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 17
1. Системы извлечения временных конструкций из медицинских
текстов ……………………………………………………………………………………….. 18
1.1 Гибридная система извлечения временной информации из
клинического текста …………………………………………………………………………… 18

1.2 Комплексное обнаружение временной информации из
клинического текста: медицинские события, время и идентификация
TLINK ……………………………………………………………………………………….. 19

1.3 Сквозная система для определения временных отношений в
выписках ……………………………………………………………………………………….. 20

1.4 Выводы ……………………………………………………………………………. 21

2. Проектирование программного обеспечения идентификации
временных конструкций ………………………………………………………………………… 23
2.1 Архитектура разрабатываемого программного обеспечения .. 23

2.2 Выбор синтаксического парсера для русского языка …………… 24

2.3 Выбор парсера контекстно-свободных грамматик для русского
языка ……………………………………………………………………………………….. 26

2.4 Выводы ……………………………………………………………………………. 28

3. Разработка алгоритмов и программного обеспечения
идентификации временных конструкций ………………………………………………… 29
3.1 Создание правил контекстно-свободных грамматик для поиска
временных конструкций и нормализации …………………………………………….. 29

3.2 Алгоритм поиска событий, связанных с временными
конструкциями ………………………………………………………………………………….. 31

3.3 Разработка модуля поиска отрицаний ………………………………… 34

3.4 Обработка неопределенностей ………………………………………….. 36
3.5 Тестирование разработанного программного обеспечения ….. 40

3.6 Результат работы модуля ………………………………………………….. 42

3.7 Выводы ……………………………………………………………………………. 43

4. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение………………………………………………………………………………… 44
4.1 Предпроектный анализ ……………………………………………………… 44

4.1.1 Анализ конкурентоспособности технического решения………. 45
4.1.2 Диаграмма Исикавы …………………………………………………………. 46
4.1.3 SWOT-анализ …………………………………………………………………… 47
4.2 Инициация проекта…………………………………………………………… 48

4.2.1 Цели и результаты проекта ……………………………………………….. 48
4.2.2 Организационная структура проекта ………………………………….. 49
4.3 Планирование управления научно-техническим проектом ….. 50

4.3.1 Структура работы в рамках проекта …………………………………… 50
4.3.2 Структура работы в рамках проекта …………………………………… 51
4.3.3 Разработка графика проведения научного исследования ……… 53
4.4 Бюджет научного и исследования ……………………………………… 54

4.4.1 Расчет материальных затрат ……………………………………………… 54
4.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ ………………………………………………. 55
4.4.3 Основная заработная плата ……………………………………………….. 55
4.4.4 Дополнительная заработная плата исполнителей темы ……….. 57
4.4.5 Отчисление во внебюджетные фонды ………………………………… 57
4.4.6 Накладные расходы ………………………………………………………….. 58
4.4.7 Прямые затраты ……………………………………………………………….. 58
4.4.8 Формирование бюджета затрат научно-исследовательского
проекта ……………………………………………………………………………. 59
4.5 Риски ………………………………………………………………………………. 59

4.6 Выводы ……………………………………………………………………………. 60

5. Социальная ответственность …………………………………………….. 61
5.1 Правовые и организационные вопросы обеспечения
безопасности ……………………………………………………………………………………… 61

5.1.1 Специальные (характерные для проектируемой рабочей зоны)
правовые нормы трудового законодательства …………………….. 61
5.1.2 Организационные мероприятия при компоновке рабочей зоны .
…………………………………………………………………………………. 62
5.2 Производственная безопасность ………………………………………… 63

5.2.1 Анализ вредных и опасных факторов, которые может создать
объект исследования ………………………………………………………… 63
5.2.2 Перенапряжение анализаторов, в том числе вызванное
информационной нагрузкой ………………………………………………. 65
5.2.3 Отсутствие или недостаток естественного света и
недостаточная освещенность рабочей зоны. ……………………….. 65
5.2.4 Статические перегрузки, связанные с рабочей позой ………….. 68
5.2.5 Превышение уровня шума на рабочем месте ……………………… 69
5.2.6 Повышенный уровень электромагнитных излучений ………….. 70
5.2.7 Повышенное значение напряжения в электрической цепи,
замыкание которой может произойти через тело человека ….. 71
5.2.8 Обоснование мероприятий по защите исследователя от
действия опасных и вредных факторов ………………………………. 72
5.3 Экологическая безопасность ……………………………………………… 73

5.3.1 Анализ влияния объекта и процесса исследования на
окружающую среду ………………………………………………………….. 73
5.3.2 Обоснование мероприятий по защите окружающей среды ….. 74
5.4 Безопасность в чрезвычайных ситуациях …………………………… 75

5.4.1 Анализ вероятных ЧС, которые может инициировать объект
исследований …………………………………………………………………… 75
5.4.2 Анализ вероятных ЧС, которые могут возникнуть в
лаборатории при проведении исследований ……………………….. 75
5.4.3 Обоснование мероприятий по предотвращению ЧС и
разработка порядка действия в случае возникновения ЧС …… 76
5.5 Выводы ……………………………………………………………………………. 77

Заключение …………………………………………………………………………………………… 79
Список используемых источников ………………………………………………………….. 81
ПРИЛОЖЕНИЕ А Раздел на английском языке ………………………………………. 86
ПРИЛОЖЕНИЕ Б Диаграмма Ганта ……………………………………………………… 104
ПРИЛОЖЕНИЕ В Реестр рисков ………………………………………………………….. 105
Обозначения и сокращения

В данной работе используются следующие определения и обозначения:

ПО – программное обеспечение;

ВК – временная конструкция;

ЭМК – электронные медицинские карты;

SVM – support vector machine;

LSTM – Long short-term memory;

GRU – Gated Recurrent Units;

CRF – Conditional random field.

Во время заболевания или нахождения в больнице с пациентом
происходят различные события. Например, пациент получает лечение,
появляются новые симптомы, выполнятся операции и т.д. Если переложить
вышеперечисленные события из анамнеза на временную шкалу, врач сможет
наглядно видеть, что и когда происходило с пациентом. Также это позволит
подготовить набор данных для предиктивных моделей в медицине и
здравоохранении. Информацию о данных событиях можно получить из
анамнеза Электронных Медицинских Карт. К сожалению, анамнез пациента
имеет неструктурированную форму. Усложняет задачу то, что для русского
языка отсутствует размеченный набор медицинских данных. Следовательно,
решение данной задачи возможно только при помощи синтаксического и
морфологического анализа, а также грамматических правил.
Таким образом, цель работы – повышение эффективности анализа
электронных медицинских карт с помощью разработки инструментов
автоматического извлечения временных конструкций из медицинской
документации. Полученные инструменты позволят перенести данные
конструкции на временную шкалу и представить их в удобном для
медицинских сотрудников виде. Также результаты работы могут быть
востребованы научными центрами, занимающимися применением машинного
обучения в области медицины, так как полученные инструменты позволяют
собрать необходимые для обучения данные. Теоретическая значимость данной
работы заключается в разработке алгоритмов и методов по извлечению
значимой информации из ЭМК, не прибегая к методам машинного обучения.

В ходе выполнения данной работы были выполнены следующие
задачи:
1. Проведен обзор и сравнение основных синтаксических парсеров
для русского языка на последней версии корпуса тестов syntagrus. Наилучшую
точность показал парсер qbic, но из-за отсутствия подробной документации
для разработки ПО использован парсер DeepPavlov.
2. Разработан модуль для извлечения временных конструкций.
Данный модуль использует контекстно-грамматический парсер Spacy.
Точность работы данного модуля составляет 95.5% на тестовом наборе
данных. Также данный модуль способен выполнять нормализацию ВК, то есть
преобразования даты к формату ГГГГ-ММ-ДД при помощи стандартной
библиотеки datetime языка Python и библиотеки dateutil.
3. Разработан модуль для извлечения событий, связанных с ними,
работающий с точностью 70%. Данный модуль на основе результатов
синтаксического парсинга прокладывает маршрут в древе зависимостей от
найденной ВК к связанному с ней событию.
4. Для решения возникшей проблемы пропущенных отрицательных
частиц был разработан модуль поиска отрицаний, который работает с
точностью 78,4%. Данный модуль на основе результатов синтаксического
парсинга ищет связь в древе зависимостей от отрицательной частицы,
найденной при помощи контекстно-грамматического парсинга, к связанной с
ней сущности.
5. Добавлена обработка неопределенностей, объединяющая
нечеткую логику и метод интервалов с расширяющимися границами.
Данная работа поможет переложить события из анамнеза на временную
шкалу и собрать данные для последующей обработки и моделирования.
В дальнейшем могут быть произведены следующие улучшения
системы:
1. Нормализация временных конструкций, которые зависят от
других событий в анамнезе.
2. Добавление темпоральной логики.
3. Поддержка немедицинских данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Анастасия Б.
    5 (145 отзывов)
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическо... Читать все
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическому и гуманитарному направлениях свыше 8 лет на различных площадках.
    #Кандидатские #Магистерские
    224 Выполненных работы
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Шиленок В. КГМУ 2017, Лечебный , выпускник
    5 (20 отзывов)
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертац... Читать все
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертационной работ. Помогу в медицинских науках и прикладных (хим,био,эколог)
    #Кандидатские #Магистерские
    13 Выполненных работ
    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ
    Оксана М. Восточноукраинский национальный университет, студент 4 - ...
    4.9 (37 отзывов)
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политоло... Читать все
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политологии.
    #Кандидатские #Магистерские
    68 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)