+7 (800) 505-67-97

Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Журман, Дмитрий Александрович Отделение информационных технологий (ОИТ)
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа направлена на повышение эффективности анализа электронных медицинских карт (ЭМК) с помощью разработки инструментов автоматического извлечения временных конструкций из медицинской документации. Полученные инструменты позволят перенести данные конструкции на временную шкалу и представить их в удобном для медицинских сотрудников виде.

Обозначения и сокращения ……………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 17
1. Системы извлечения временных конструкций из медицинских
текстов ……………………………………………………………………………………….. 18
1.1 Гибридная система извлечения временной информации из
клинического текста …………………………………………………………………………… 18

1.2 Комплексное обнаружение временной информации из
клинического текста: медицинские события, время и идентификация
TLINK ……………………………………………………………………………………….. 19

1.3 Сквозная система для определения временных отношений в
выписках ……………………………………………………………………………………….. 20

1.4 Выводы ……………………………………………………………………………. 21

2. Проектирование программного обеспечения идентификации
временных конструкций ………………………………………………………………………… 23
2.1 Архитектура разрабатываемого программного обеспечения .. 23

2.2 Выбор синтаксического парсера для русского языка …………… 24

2.3 Выбор парсера контекстно-свободных грамматик для русского
языка ……………………………………………………………………………………….. 26

2.4 Выводы ……………………………………………………………………………. 28

3. Разработка алгоритмов и программного обеспечения
идентификации временных конструкций ………………………………………………… 29
3.1 Создание правил контекстно-свободных грамматик для поиска
временных конструкций и нормализации …………………………………………….. 29

3.2 Алгоритм поиска событий, связанных с временными
конструкциями ………………………………………………………………………………….. 31

3.3 Разработка модуля поиска отрицаний ………………………………… 34

3.4 Обработка неопределенностей ………………………………………….. 36
3.5 Тестирование разработанного программного обеспечения ….. 40

3.6 Результат работы модуля ………………………………………………….. 42

3.7 Выводы ……………………………………………………………………………. 43

4. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение………………………………………………………………………………… 44
4.1 Предпроектный анализ ……………………………………………………… 44

4.1.1 Анализ конкурентоспособности технического решения………. 45
4.1.2 Диаграмма Исикавы …………………………………………………………. 46
4.1.3 SWOT-анализ …………………………………………………………………… 47
4.2 Инициация проекта…………………………………………………………… 48

4.2.1 Цели и результаты проекта ……………………………………………….. 48
4.2.2 Организационная структура проекта ………………………………….. 49
4.3 Планирование управления научно-техническим проектом ….. 50

4.3.1 Структура работы в рамках проекта …………………………………… 50
4.3.2 Структура работы в рамках проекта …………………………………… 51
4.3.3 Разработка графика проведения научного исследования ……… 53
4.4 Бюджет научного и исследования ……………………………………… 54

4.4.1 Расчет материальных затрат ……………………………………………… 54
4.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ ………………………………………………. 55
4.4.3 Основная заработная плата ……………………………………………….. 55
4.4.4 Дополнительная заработная плата исполнителей темы ……….. 57
4.4.5 Отчисление во внебюджетные фонды ………………………………… 57
4.4.6 Накладные расходы ………………………………………………………….. 58
4.4.7 Прямые затраты ……………………………………………………………….. 58
4.4.8 Формирование бюджета затрат научно-исследовательского
проекта ……………………………………………………………………………. 59
4.5 Риски ………………………………………………………………………………. 59

4.6 Выводы ……………………………………………………………………………. 60

5. Социальная ответственность …………………………………………….. 61
5.1 Правовые и организационные вопросы обеспечения
безопасности ……………………………………………………………………………………… 61

5.1.1 Специальные (характерные для проектируемой рабочей зоны)
правовые нормы трудового законодательства …………………….. 61
5.1.2 Организационные мероприятия при компоновке рабочей зоны .
…………………………………………………………………………………. 62
5.2 Производственная безопасность ………………………………………… 63

5.2.1 Анализ вредных и опасных факторов, которые может создать
объект исследования ………………………………………………………… 63
5.2.2 Перенапряжение анализаторов, в том числе вызванное
информационной нагрузкой ………………………………………………. 65
5.2.3 Отсутствие или недостаток естественного света и
недостаточная освещенность рабочей зоны. ……………………….. 65
5.2.4 Статические перегрузки, связанные с рабочей позой ………….. 68
5.2.5 Превышение уровня шума на рабочем месте ……………………… 69
5.2.6 Повышенный уровень электромагнитных излучений ………….. 70
5.2.7 Повышенное значение напряжения в электрической цепи,
замыкание которой может произойти через тело человека ….. 71
5.2.8 Обоснование мероприятий по защите исследователя от
действия опасных и вредных факторов ………………………………. 72
5.3 Экологическая безопасность ……………………………………………… 73

5.3.1 Анализ влияния объекта и процесса исследования на
окружающую среду ………………………………………………………….. 73
5.3.2 Обоснование мероприятий по защите окружающей среды ….. 74
5.4 Безопасность в чрезвычайных ситуациях …………………………… 75

5.4.1 Анализ вероятных ЧС, которые может инициировать объект
исследований …………………………………………………………………… 75
5.4.2 Анализ вероятных ЧС, которые могут возникнуть в
лаборатории при проведении исследований ……………………….. 75
5.4.3 Обоснование мероприятий по предотвращению ЧС и
разработка порядка действия в случае возникновения ЧС …… 76
5.5 Выводы ……………………………………………………………………………. 77

Заключение …………………………………………………………………………………………… 79
Список используемых источников ………………………………………………………….. 81
ПРИЛОЖЕНИЕ А Раздел на английском языке ………………………………………. 86
ПРИЛОЖЕНИЕ Б Диаграмма Ганта ……………………………………………………… 104
ПРИЛОЖЕНИЕ В Реестр рисков ………………………………………………………….. 105
Обозначения и сокращения

В данной работе используются следующие определения и обозначения:

ПО – программное обеспечение;

ВК – временная конструкция;

ЭМК – электронные медицинские карты;

SVM – support vector machine;

LSTM – Long short-term memory;

GRU – Gated Recurrent Units;

CRF – Conditional random field.

Во время заболевания или нахождения в больнице с пациентом
происходят различные события. Например, пациент получает лечение,
появляются новые симптомы, выполнятся операции и т.д. Если переложить
вышеперечисленные события из анамнеза на временную шкалу, врач сможет
наглядно видеть, что и когда происходило с пациентом. Также это позволит
подготовить набор данных для предиктивных моделей в медицине и
здравоохранении. Информацию о данных событиях можно получить из
анамнеза Электронных Медицинских Карт. К сожалению, анамнез пациента
имеет неструктурированную форму. Усложняет задачу то, что для русского
языка отсутствует размеченный набор медицинских данных. Следовательно,
решение данной задачи возможно только при помощи синтаксического и
морфологического анализа, а также грамматических правил.
Таким образом, цель работы – повышение эффективности анализа
электронных медицинских карт с помощью разработки инструментов
автоматического извлечения временных конструкций из медицинской
документации. Полученные инструменты позволят перенести данные
конструкции на временную шкалу и представить их в удобном для
медицинских сотрудников виде. Также результаты работы могут быть
востребованы научными центрами, занимающимися применением машинного
обучения в области медицины, так как полученные инструменты позволяют
собрать необходимые для обучения данные. Теоретическая значимость данной
работы заключается в разработке алгоритмов и методов по извлечению
значимой информации из ЭМК, не прибегая к методам машинного обучения.

В ходе выполнения данной работы были выполнены следующие
задачи:
1. Проведен обзор и сравнение основных синтаксических парсеров
для русского языка на последней версии корпуса тестов syntagrus. Наилучшую
точность показал парсер qbic, но из-за отсутствия подробной документации
для разработки ПО использован парсер DeepPavlov.
2. Разработан модуль для извлечения временных конструкций.
Данный модуль использует контекстно-грамматический парсер Spacy.
Точность работы данного модуля составляет 95.5% на тестовом наборе
данных. Также данный модуль способен выполнять нормализацию ВК, то есть
преобразования даты к формату ГГГГ-ММ-ДД при помощи стандартной
библиотеки datetime языка Python и библиотеки dateutil.
3. Разработан модуль для извлечения событий, связанных с ними,
работающий с точностью 70%. Данный модуль на основе результатов
синтаксического парсинга прокладывает маршрут в древе зависимостей от
найденной ВК к связанному с ней событию.
4. Для решения возникшей проблемы пропущенных отрицательных
частиц был разработан модуль поиска отрицаний, который работает с
точностью 78,4%. Данный модуль на основе результатов синтаксического
парсинга ищет связь в древе зависимостей от отрицательной частицы,
найденной при помощи контекстно-грамматического парсинга, к связанной с
ней сущности.
5. Добавлена обработка неопределенностей, объединяющая
нечеткую логику и метод интервалов с расширяющимися границами.
Данная работа поможет переложить события из анамнеза на временную
шкалу и собрать данные для последующей обработки и моделирования.
В дальнейшем могут быть произведены следующие улучшения
системы:
1. Нормализация временных конструкций, которые зависят от
других событий в анамнезе.
2. Добавление темпоральной логики.
3. Поддержка немедицинских данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах»

    Последние выполненные заказы

    Внешнеэкономическая деятельность Магистерская диссертация
    17 000 ₽
    Перспективы внешнеэкономического сотрудничества России и КНР
    Спасибо огромное! Защитилась на отлично!
    Международные отношения Магистерская диссертация
    2 500 ₽
    т2732 речь и презентация к заказу Перспективы внешнеэкономического сотрудничества России и КНР
    Спасибо огромное за качественную работу!
    Менеджмент организации Магистерская диссертация
    2 500 ₽
    "Стратегия внедрения цифровых технологий в управление цепями поставок на примере ПАО "Транснефть""
    Большое спасибо автору! В установленные сроки полностью выполнен объем работы - магистерская диссертация по менеджменту, отчет по преддипломной пра...
    Государственное и муниципальное управление Магистерская диссертация
    11 370 ₽
    Новое задание по государственному и муниципальному управлению
    Добрый день! Очень доволен работой, большое спасибо, что помогаете в написании работ, дальнейших успехов Вам!
    Право и юриспруденция Магистерская диссертация
    20 520 ₽
    Особенности пересмотра судебных актов в арбитражном суде апелляционной инстанции
    Доволен работой автора
    Право и юриспруденция Магистерская диссертация
    14 210 ₽
    "Наследование по закону в романо-германской и англо-саксонской правовых семьях: сравнительно-правовые аспекты"
    Хочу сказать огромное спасибо Вячеславу! Отвечал на все вопросы, вносил правки и всегда был на связи. Рекомендую данного автора если хотите качеств...

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019 год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)