Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах

Журман, Дмитрий Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа направлена на повышение эффективности анализа электронных медицинских карт (ЭМК) с помощью разработки инструментов автоматического извлечения временных конструкций из медицинской документации. Полученные инструменты позволят перенести данные конструкции на временную шкалу и представить их в удобном для медицинских сотрудников виде.

Обозначения и сокращения ……………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 17
1. Системы извлечения временных конструкций из медицинских
текстов ……………………………………………………………………………………….. 18
1.1 Гибридная система извлечения временной информации из
клинического текста …………………………………………………………………………… 18

1.2 Комплексное обнаружение временной информации из
клинического текста: медицинские события, время и идентификация
TLINK ……………………………………………………………………………………….. 19

1.3 Сквозная система для определения временных отношений в
выписках ……………………………………………………………………………………….. 20

1.4 Выводы ……………………………………………………………………………. 21

2. Проектирование программного обеспечения идентификации
временных конструкций ………………………………………………………………………… 23
2.1 Архитектура разрабатываемого программного обеспечения .. 23

2.2 Выбор синтаксического парсера для русского языка …………… 24

2.3 Выбор парсера контекстно-свободных грамматик для русского
языка ……………………………………………………………………………………….. 26

2.4 Выводы ……………………………………………………………………………. 28

3. Разработка алгоритмов и программного обеспечения
идентификации временных конструкций ………………………………………………… 29
3.1 Создание правил контекстно-свободных грамматик для поиска
временных конструкций и нормализации …………………………………………….. 29

3.2 Алгоритм поиска событий, связанных с временными
конструкциями ………………………………………………………………………………….. 31

3.3 Разработка модуля поиска отрицаний ………………………………… 34

3.4 Обработка неопределенностей ………………………………………….. 36
3.5 Тестирование разработанного программного обеспечения ….. 40

3.6 Результат работы модуля ………………………………………………….. 42

3.7 Выводы ……………………………………………………………………………. 43

4. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение………………………………………………………………………………… 44
4.1 Предпроектный анализ ……………………………………………………… 44

4.1.1 Анализ конкурентоспособности технического решения………. 45
4.1.2 Диаграмма Исикавы …………………………………………………………. 46
4.1.3 SWOT-анализ …………………………………………………………………… 47
4.2 Инициация проекта…………………………………………………………… 48

4.2.1 Цели и результаты проекта ……………………………………………….. 48
4.2.2 Организационная структура проекта ………………………………….. 49
4.3 Планирование управления научно-техническим проектом ….. 50

4.3.1 Структура работы в рамках проекта …………………………………… 50
4.3.2 Структура работы в рамках проекта …………………………………… 51
4.3.3 Разработка графика проведения научного исследования ……… 53
4.4 Бюджет научного и исследования ……………………………………… 54

4.4.1 Расчет материальных затрат ……………………………………………… 54
4.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ ………………………………………………. 55
4.4.3 Основная заработная плата ……………………………………………….. 55
4.4.4 Дополнительная заработная плата исполнителей темы ……….. 57
4.4.5 Отчисление во внебюджетные фонды ………………………………… 57
4.4.6 Накладные расходы ………………………………………………………….. 58
4.4.7 Прямые затраты ……………………………………………………………….. 58
4.4.8 Формирование бюджета затрат научно-исследовательского
проекта ……………………………………………………………………………. 59
4.5 Риски ………………………………………………………………………………. 59

4.6 Выводы ……………………………………………………………………………. 60

5. Социальная ответственность …………………………………………….. 61
5.1 Правовые и организационные вопросы обеспечения
безопасности ……………………………………………………………………………………… 61

5.1.1 Специальные (характерные для проектируемой рабочей зоны)
правовые нормы трудового законодательства …………………….. 61
5.1.2 Организационные мероприятия при компоновке рабочей зоны .
…………………………………………………………………………………. 62
5.2 Производственная безопасность ………………………………………… 63

5.2.1 Анализ вредных и опасных факторов, которые может создать
объект исследования ………………………………………………………… 63
5.2.2 Перенапряжение анализаторов, в том числе вызванное
информационной нагрузкой ………………………………………………. 65
5.2.3 Отсутствие или недостаток естественного света и
недостаточная освещенность рабочей зоны. ……………………….. 65
5.2.4 Статические перегрузки, связанные с рабочей позой ………….. 68
5.2.5 Превышение уровня шума на рабочем месте ……………………… 69
5.2.6 Повышенный уровень электромагнитных излучений ………….. 70
5.2.7 Повышенное значение напряжения в электрической цепи,
замыкание которой может произойти через тело человека ….. 71
5.2.8 Обоснование мероприятий по защите исследователя от
действия опасных и вредных факторов ………………………………. 72
5.3 Экологическая безопасность ……………………………………………… 73

5.3.1 Анализ влияния объекта и процесса исследования на
окружающую среду ………………………………………………………….. 73
5.3.2 Обоснование мероприятий по защите окружающей среды ….. 74
5.4 Безопасность в чрезвычайных ситуациях …………………………… 75

5.4.1 Анализ вероятных ЧС, которые может инициировать объект
исследований …………………………………………………………………… 75
5.4.2 Анализ вероятных ЧС, которые могут возникнуть в
лаборатории при проведении исследований ……………………….. 75
5.4.3 Обоснование мероприятий по предотвращению ЧС и
разработка порядка действия в случае возникновения ЧС …… 76
5.5 Выводы ……………………………………………………………………………. 77

Заключение …………………………………………………………………………………………… 79
Список используемых источников ………………………………………………………….. 81
ПРИЛОЖЕНИЕ А Раздел на английском языке ………………………………………. 86
ПРИЛОЖЕНИЕ Б Диаграмма Ганта ……………………………………………………… 104
ПРИЛОЖЕНИЕ В Реестр рисков ………………………………………………………….. 105
Обозначения и сокращения

В данной работе используются следующие определения и обозначения:

ПО – программное обеспечение;

ВК – временная конструкция;

ЭМК – электронные медицинские карты;

SVM – support vector machine;

LSTM – Long short-term memory;

GRU – Gated Recurrent Units;

CRF – Conditional random field.

Во время заболевания или нахождения в больнице с пациентом
происходят различные события. Например, пациент получает лечение,
появляются новые симптомы, выполнятся операции и т.д. Если переложить
вышеперечисленные события из анамнеза на временную шкалу, врач сможет
наглядно видеть, что и когда происходило с пациентом. Также это позволит
подготовить набор данных для предиктивных моделей в медицине и
здравоохранении. Информацию о данных событиях можно получить из
анамнеза Электронных Медицинских Карт. К сожалению, анамнез пациента
имеет неструктурированную форму. Усложняет задачу то, что для русского
языка отсутствует размеченный набор медицинских данных. Следовательно,
решение данной задачи возможно только при помощи синтаксического и
морфологического анализа, а также грамматических правил.
Таким образом, цель работы – повышение эффективности анализа
электронных медицинских карт с помощью разработки инструментов
автоматического извлечения временных конструкций из медицинской
документации. Полученные инструменты позволят перенести данные
конструкции на временную шкалу и представить их в удобном для
медицинских сотрудников виде. Также результаты работы могут быть
востребованы научными центрами, занимающимися применением машинного
обучения в области медицины, так как полученные инструменты позволяют
собрать необходимые для обучения данные. Теоретическая значимость данной
работы заключается в разработке алгоритмов и методов по извлечению
значимой информации из ЭМК, не прибегая к методам машинного обучения.

В ходе выполнения данной работы были выполнены следующие
задачи:
1. Проведен обзор и сравнение основных синтаксических парсеров
для русского языка на последней версии корпуса тестов syntagrus. Наилучшую
точность показал парсер qbic, но из-за отсутствия подробной документации
для разработки ПО использован парсер DeepPavlov.
2. Разработан модуль для извлечения временных конструкций.
Данный модуль использует контекстно-грамматический парсер Spacy.
Точность работы данного модуля составляет 95.5% на тестовом наборе
данных. Также данный модуль способен выполнять нормализацию ВК, то есть
преобразования даты к формату ГГГГ-ММ-ДД при помощи стандартной
библиотеки datetime языка Python и библиотеки dateutil.
3. Разработан модуль для извлечения событий, связанных с ними,
работающий с точностью 70%. Данный модуль на основе результатов
синтаксического парсинга прокладывает маршрут в древе зависимостей от
найденной ВК к связанному с ней событию.
4. Для решения возникшей проблемы пропущенных отрицательных
частиц был разработан модуль поиска отрицаний, который работает с
точностью 78,4%. Данный модуль на основе результатов синтаксического
парсинга ищет связь в древе зависимостей от отрицательной частицы,
найденной при помощи контекстно-грамматического парсинга, к связанной с
ней сущности.
5. Добавлена обработка неопределенностей, объединяющая
нечеткую логику и метод интервалов с расширяющимися границами.
Данная работа поможет переложить события из анамнеза на временную
шкалу и собрать данные для последующей обработки и моделирования.
В дальнейшем могут быть произведены следующие улучшения
системы:
1. Нормализация временных конструкций, которые зависят от
других событий в анамнезе.
2. Добавление темпоральной логики.
3. Поддержка немедицинских данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Дмитрий М. БГАТУ 2001, электрификации, выпускник
    4.8 (17 отзывов)
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал стать... Читать все
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал статьи, патенты, кандидатскую диссертацию, преподавал. Занимаюсь этим с 2003.
    #Кандидатские #Магистерские
    19 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Дарья С. Томский государственный университет 2010, Юридический, в...
    4.8 (13 отзывов)
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.
    #Кандидатские #Магистерские
    18 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)