Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Журман, Дмитрий Александрович Отделение информационных технологий (ОИТ)
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа направлена на повышение эффективности анализа электронных медицинских карт (ЭМК) с помощью разработки инструментов автоматического извлечения временных конструкций из медицинской документации. Полученные инструменты позволят перенести данные конструкции на временную шкалу и представить их в удобном для медицинских сотрудников виде.

Обозначения и сокращения ……………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 17
1. Системы извлечения временных конструкций из медицинских
текстов ……………………………………………………………………………………….. 18
1.1 Гибридная система извлечения временной информации из
клинического текста …………………………………………………………………………… 18

1.2 Комплексное обнаружение временной информации из
клинического текста: медицинские события, время и идентификация
TLINK ……………………………………………………………………………………….. 19

1.3 Сквозная система для определения временных отношений в
выписках ……………………………………………………………………………………….. 20

1.4 Выводы ……………………………………………………………………………. 21

2. Проектирование программного обеспечения идентификации
временных конструкций ………………………………………………………………………… 23
2.1 Архитектура разрабатываемого программного обеспечения .. 23

2.2 Выбор синтаксического парсера для русского языка …………… 24

2.3 Выбор парсера контекстно-свободных грамматик для русского
языка ……………………………………………………………………………………….. 26

2.4 Выводы ……………………………………………………………………………. 28

3. Разработка алгоритмов и программного обеспечения
идентификации временных конструкций ………………………………………………… 29
3.1 Создание правил контекстно-свободных грамматик для поиска
временных конструкций и нормализации …………………………………………….. 29

3.2 Алгоритм поиска событий, связанных с временными
конструкциями ………………………………………………………………………………….. 31

3.3 Разработка модуля поиска отрицаний ………………………………… 34

3.4 Обработка неопределенностей ………………………………………….. 36
3.5 Тестирование разработанного программного обеспечения ….. 40

3.6 Результат работы модуля ………………………………………………….. 42

3.7 Выводы ……………………………………………………………………………. 43

4. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение………………………………………………………………………………… 44
4.1 Предпроектный анализ ……………………………………………………… 44

4.1.1 Анализ конкурентоспособности технического решения………. 45
4.1.2 Диаграмма Исикавы …………………………………………………………. 46
4.1.3 SWOT-анализ …………………………………………………………………… 47
4.2 Инициация проекта…………………………………………………………… 48

4.2.1 Цели и результаты проекта ……………………………………………….. 48
4.2.2 Организационная структура проекта ………………………………….. 49
4.3 Планирование управления научно-техническим проектом ….. 50

4.3.1 Структура работы в рамках проекта …………………………………… 50
4.3.2 Структура работы в рамках проекта …………………………………… 51
4.3.3 Разработка графика проведения научного исследования ……… 53
4.4 Бюджет научного и исследования ……………………………………… 54

4.4.1 Расчет материальных затрат ……………………………………………… 54
4.4.2 Расчет затрат на специальное оборудование для научных
(экспериментальных) работ ………………………………………………. 55
4.4.3 Основная заработная плата ……………………………………………….. 55
4.4.4 Дополнительная заработная плата исполнителей темы ……….. 57
4.4.5 Отчисление во внебюджетные фонды ………………………………… 57
4.4.6 Накладные расходы ………………………………………………………….. 58
4.4.7 Прямые затраты ……………………………………………………………….. 58
4.4.8 Формирование бюджета затрат научно-исследовательского
проекта ……………………………………………………………………………. 59
4.5 Риски ………………………………………………………………………………. 59

4.6 Выводы ……………………………………………………………………………. 60

5. Социальная ответственность …………………………………………….. 61
5.1 Правовые и организационные вопросы обеспечения
безопасности ……………………………………………………………………………………… 61

5.1.1 Специальные (характерные для проектируемой рабочей зоны)
правовые нормы трудового законодательства …………………….. 61
5.1.2 Организационные мероприятия при компоновке рабочей зоны .
…………………………………………………………………………………. 62
5.2 Производственная безопасность ………………………………………… 63

5.2.1 Анализ вредных и опасных факторов, которые может создать
объект исследования ………………………………………………………… 63
5.2.2 Перенапряжение анализаторов, в том числе вызванное
информационной нагрузкой ………………………………………………. 65
5.2.3 Отсутствие или недостаток естественного света и
недостаточная освещенность рабочей зоны. ……………………….. 65
5.2.4 Статические перегрузки, связанные с рабочей позой ………….. 68
5.2.5 Превышение уровня шума на рабочем месте ……………………… 69
5.2.6 Повышенный уровень электромагнитных излучений ………….. 70
5.2.7 Повышенное значение напряжения в электрической цепи,
замыкание которой может произойти через тело человека ….. 71
5.2.8 Обоснование мероприятий по защите исследователя от
действия опасных и вредных факторов ………………………………. 72
5.3 Экологическая безопасность ……………………………………………… 73

5.3.1 Анализ влияния объекта и процесса исследования на
окружающую среду ………………………………………………………….. 73
5.3.2 Обоснование мероприятий по защите окружающей среды ….. 74
5.4 Безопасность в чрезвычайных ситуациях …………………………… 75

5.4.1 Анализ вероятных ЧС, которые может инициировать объект
исследований …………………………………………………………………… 75
5.4.2 Анализ вероятных ЧС, которые могут возникнуть в
лаборатории при проведении исследований ……………………….. 75
5.4.3 Обоснование мероприятий по предотвращению ЧС и
разработка порядка действия в случае возникновения ЧС …… 76
5.5 Выводы ……………………………………………………………………………. 77

Заключение …………………………………………………………………………………………… 79
Список используемых источников ………………………………………………………….. 81
ПРИЛОЖЕНИЕ А Раздел на английском языке ………………………………………. 86
ПРИЛОЖЕНИЕ Б Диаграмма Ганта ……………………………………………………… 104
ПРИЛОЖЕНИЕ В Реестр рисков ………………………………………………………….. 105
Обозначения и сокращения

В данной работе используются следующие определения и обозначения:

ПО – программное обеспечение;

ВК – временная конструкция;

ЭМК – электронные медицинские карты;

SVM – support vector machine;

LSTM – Long short-term memory;

GRU – Gated Recurrent Units;

CRF – Conditional random field.

Во время заболевания или нахождения в больнице с пациентом
происходят различные события. Например, пациент получает лечение,
появляются новые симптомы, выполнятся операции и т.д. Если переложить
вышеперечисленные события из анамнеза на временную шкалу, врач сможет
наглядно видеть, что и когда происходило с пациентом. Также это позволит
подготовить набор данных для предиктивных моделей в медицине и
здравоохранении. Информацию о данных событиях можно получить из
анамнеза Электронных Медицинских Карт. К сожалению, анамнез пациента
имеет неструктурированную форму. Усложняет задачу то, что для русского
языка отсутствует размеченный набор медицинских данных. Следовательно,
решение данной задачи возможно только при помощи синтаксического и
морфологического анализа, а также грамматических правил.
Таким образом, цель работы – повышение эффективности анализа
электронных медицинских карт с помощью разработки инструментов
автоматического извлечения временных конструкций из медицинской
документации. Полученные инструменты позволят перенести данные
конструкции на временную шкалу и представить их в удобном для
медицинских сотрудников виде. Также результаты работы могут быть
востребованы научными центрами, занимающимися применением машинного
обучения в области медицины, так как полученные инструменты позволяют
собрать необходимые для обучения данные. Теоретическая значимость данной
работы заключается в разработке алгоритмов и методов по извлечению
значимой информации из ЭМК, не прибегая к методам машинного обучения.

В ходе выполнения данной работы были выполнены следующие
задачи:
1. Проведен обзор и сравнение основных синтаксических парсеров
для русского языка на последней версии корпуса тестов syntagrus. Наилучшую
точность показал парсер qbic, но из-за отсутствия подробной документации
для разработки ПО использован парсер DeepPavlov.
2. Разработан модуль для извлечения временных конструкций.
Данный модуль использует контекстно-грамматический парсер Spacy.
Точность работы данного модуля составляет 95.5% на тестовом наборе
данных. Также данный модуль способен выполнять нормализацию ВК, то есть
преобразования даты к формату ГГГГ-ММ-ДД при помощи стандартной
библиотеки datetime языка Python и библиотеки dateutil.
3. Разработан модуль для извлечения событий, связанных с ними,
работающий с точностью 70%. Данный модуль на основе результатов
синтаксического парсинга прокладывает маршрут в древе зависимостей от
найденной ВК к связанному с ней событию.
4. Для решения возникшей проблемы пропущенных отрицательных
частиц был разработан модуль поиска отрицаний, который работает с
точностью 78,4%. Данный модуль на основе результатов синтаксического
парсинга ищет связь в древе зависимостей от отрицательной частицы,
найденной при помощи контекстно-грамматического парсинга, к связанной с
ней сущности.
5. Добавлена обработка неопределенностей, объединяющая
нечеткую логику и метод интервалов с расширяющимися границами.
Данная работа поможет переложить события из анамнеза на временную
шкалу и собрать данные для последующей обработки и моделирования.
В дальнейшем могут быть произведены следующие улучшения
системы:
1. Нормализация временных конструкций, которые зависят от
других событий в анамнезе.
2. Добавление темпоральной логики.
3. Поддержка немедицинских данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Алгоритмы и программное обеспечение идентификации временных конструкций в слабоструктурированных электронных медицинских текстах»

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Олег Н. Томский политехнический университет 2000, Инженерно-эконо...
    4.7 (96 отзывов)
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Явл... Читать все
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Являюсь действующим преподавателем одного из ВУЗов.
    #Кандидатские #Магистерские
    177 Выполненных работ
    Елена С. Таганрогский институт управления и экономики Таганрогский...
    4.4 (93 отзыва)
    Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на напис... Читать все
    Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на написании курсовых и дипломных работ, а также диссертационных исследований.
    #Кандидатские #Магистерские
    158 Выполненных работ
    Александр О. Спб государственный университет 1972, мат - мех, преподав...
    4.9 (66 отзывов)
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ
    #Кандидатские #Магистерские
    117 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Анна С. СФ ПГУ им. М.В. Ломоносова 2004, филологический, преподав...
    4.8 (9 отзывов)
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания... Читать все
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания и проверки (в качестве преподавателя) контрольных и курсовых работ.
    #Кандидатские #Магистерские
    16 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Евгения Р.
    5 (188 отзывов)
    Мой опыт в написании работ - 9 лет. Я специализируюсь на написании курсовых работ, ВКР и магистерских диссертаций, также пишу научные статьи, провожу исследования и со... Читать все
    Мой опыт в написании работ - 9 лет. Я специализируюсь на написании курсовых работ, ВКР и магистерских диссертаций, также пишу научные статьи, провожу исследования и создаю красивые презентации. Сопровождаю работы до сдачи, на связи 24/7 ?
    #Кандидатские #Магистерские
    359 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019 год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)