Алгоритмическое и программное обеспечение анализа и визуализации результатов медицинских осмотров
Настоящая работа посвящена разработке алгоритмического и программного обеспечения анализа и визуализации результатов медицинских осмотров. Проведен аналитический обзор литературных источников с целью выявления достижений мировой науки техники в области аналитики данных; построен классификатор степеней тяжести заболевания пациентов с рожистым воспалением; определены наиболее важные для классификации признаки. Работа рассмотрена со стороны финансовой эффективности и социальной безопасности. Применение разработанной системы позволит сократить время работы специалистов по определению степени тяжести заболевания.
Введение……………………………………………………………………………………………………….. 9
1 Обзор литературы …………………………………………………………………………………….. 11
2 Объект и методы исследования …………………………………………………………………. 14
2.1 Объект исследования ……………………………………………………………………………… 14
2.2 Методы исследования…………………………………………………………………………….. 16
2.2.1 Метод определения нормальной формы слова ……………………………………… 16
2.2.2 Метод определения веса признаков документа «TF-IDF»……………………… 16
2.2.3 Метод дерева решений ………………………………………………………………………… 18
2.2.4 Метод градиентного бустинга ……………………………………………………………… 19
3 Расчеты и аналитика …………………………………………………………………………………. 21
3.1 Выбор программного обеспечения …………………………………………………………. 21
3.2 Загрузка и предварительный анализ данных …………………………………………… 21
3.3 Предварительная подготовка, построение «TF-IDF» матрицы и определение
значений меток классов……………………………………………………………………………….. 24
3.4 Разделение набора данных на тестовую и тренировочную выборки ………… 25
3.5 Построение классификатора …………………………………………………………………… 25
3.5.1 Выбор модели классификации……………………………………………………………… 25
3.5.2 Подбор оптимальных параметров классификатора……………………………….. 26
3.5.3 Построение классификатора с оптимальными параметрами …………………. 27
4 Результаты………………………………………………………………………………………………… 28
4.1 Классификатор степеней тяжести рожистого воспаления………………………… 28
4.2 Определение важности признаков ………………………………………………………….. 29
5 Финансовый менеджмент, ресурсоэффективность и ресурсосбережение……. 33
5.1 Предпроектный анализ …………………………………………………………………………… 34
5.1.1 Технология «QuaD» …………………………………………………………………………….. 34
5.1.2 Диаграмма Исикавы…………………………………………………………………………….. 35
5.1.3 Оценка готовности научно-исследовательского проекта к
коммерциализации ………………………………………………………………………………………. 36
5.2 Инициация научно-исследовательского проекта……………………………………… 38
5.2.1 Цели и результаты научно-исследовательского проекта……………………….. 38
5.2.2 Организационная структура научно-исследовательского проекта…………. 39
5.3 Планирование управления научно-исследовательским проектом…………….. 39
5.3.1 План научно-исследовательского проекта ……………………………………………. 39
5.3.2 Бюджет научно-исследовательского проекта ……………………………………….. 40
5.3.2.1 Расчет материальных затрат ……………………………………………………………… 41
5.3.2.2 Расчет затрат на электроэнергию, мобильную связь и интернет…………. 41
5.3.2.3 Амортизационные затраты………………………………………………………………… 42
5.3.2.4 Заработная плата исполнителей ………………………………………………………… 42
5.3.2.5 Отчисления во внебюджетные фонды (страховые отчисления)………….. 44
5.3.2.6 Накладные расходы…………………………………………………………………………… 44
5.3.2.7. Формирование бюджета затрат научно-исследовательского проекта … 44
5.3.3 Риски научно-исследовательского проекта…………………………………………… 45
5.3.4 Описание потенциального эффекта ……………………………………………………… 45
6 Социальная ответственность …………………………………………………………………….. 49
Введение……………………………………………………………………………………………………… 49
6.1 Правовые и организационные вопросы обеспечения безопасности …………. 49
6.1.1 Специальные правовые нормы трудового законодательства…………………. 49
6.1.2 Эргономические требования к рабочему месту оператора ПЭВМ…………. 52
6.2 Производственная безопасность……………………………………………………………… 53
6.2.1 Анализ вредных и опасных факторов, которые может создать объект
исследования……………………………………………………………………………………………….. 53
6.2.2 Обоснование мероприятий по снижению воздействия вредных и опасных
факторов ……………………………………………………………………………………………………… 54
6.2.2.1 Микроклимат ……………………………………………………………………………………. 54
6.2.2.2 Уровень шума …………………………………………………………………………………… 56
6.2.2.3 Отсутствие или недостаток естественного света………………………………… 57
6.2.2.4 Повышенная напряженность магнитного поля…………………………………… 62
6.2.2.5 Психофизиологический фактор…………………………………………………………. 62
6.2.2.6 Электрический ток ……………………………………………………………………………. 63
6.3 Экологическая безопасность…………………………………………………………………… 64
6.4 Безопасность в чрезвычайных ситуациях………………………………………………… 66
6.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований
……………………………………………………………………………………………………………………. 66
6.4.2 Меры по предотвращению и ликвидации ЧС и их последствий ……………. 67
6.5 Выводы ………………………………………………………………………………………………….. 67
Заключение …………………………………………………………………………………………………. 69
Список научных достижений и публикаций …………………………………………………. 70
Список использованных источников и литературы ………………………………………. 71
Приложение А …………………………………………………………………………………………….. 74
Приложение Б – Пример документа «Осмотр пациента лечащим врачом» ……. 88
Приложение В – Пример документа «Температурный лист» ………………………… 90
Многие сферы деятельности человека претерпевают различного рода
изменения, это связано с совершенствованием, оптимизацией и автоматизацией
определенных процессов. Для медицинских учреждений разрабатываются
информационные системы, которые позволяют ускорить ввод информации и
формирование на их основе различных отчетов и документов. В виду широкого
развития аналитики данных и машинного обучения, появляется возможность
извлекать полезную информацию из собранных данных, выявлять
определенные закономерности.
Данные могут быть представлены в различных форматах: таблицы,
изображения, аудио, видео, текст и т.д. Для каждого типа представления
данных существует свой подход к обработке и анализу данных. Чаще
встречающейся формой представления медицинских данных являются
изображения и текст на естественном языке.
Отделением инфекционных заболеваний Сибирского государственного
медицинского университета были предоставлены деперсонализированные
истории болезни пациентов, страдающих рожистыми воспалениями, а также
На протяжении выполнения данной работы поставленные задачи были
выполнены. А именно, была проведена подготовка текстовых данных из
медицинских документов к анализу, а также построен классификатор степеней
заболевания пациентов, страдающих рожистым воспалением.
Предварительно загруженные данные были проверены на наличие
пропущенных значений и выбросов. Затем текстовые данные подверглись
токенизации, лемматизации, удалению стоп-слов и транслитерации, после чего
текст был переформатирован в числовые значения, полученные в результате
расчета весов слов методом «TF-IDF». Данная метрика позволила учесть
частоту наиболее значимых слов, уменьшая вес слов, встречающихся в каждом
документе.
Набор данных был разделен на тренировочное и тестовое подмножества.
Было построено несколько моделей для определения степеней тяжести
рожистого воспаления. Из полученных моделей была выбрана лучшая –
градиентный бустинг. Для выбранной модели был проведен подбор
оптимальных параметров. После чего была проведена оценка качества работы
модели классификации с помощью матрицы ошибок и метрик качества, так
верность работы модели составила 95%, полнота – 96%, точность – 94% и
метрика F1 – 95%, что является хорошими результатами.
В результате проделанной работы для классификации степеней тяжести
заболеваний пациентов, страдающих рожистым воспалением, предлагается
использование классификатора «XGBoostClassifier». Использование
разработанной модели поможет в построении эффективных медицинский
информационных систем.
Также разработаны следующие разделы: «Финансовый менеджмент,
ресурсоэффективность и ресурсосбережение», «Социальная ответственность»,
а также раздел на иностранном языке (английский) – «Big Data Analytics in
Medicine», приведенный в Приложении А.
Список научных достижений и публикаций
1. Диплом II степени за лучший доклад на Международной научно-
технической конференции студентов, аспирантов и молодых ученых “Научная
сессия ТУСУР”, 22-24 мая 2019 г.
2. Диплом III степени за доклад на Международной научной
конференции “Информационные технологии в науке, управлении, социальной
сфере и медицине”, 14-19 октября 2019 г.
3. Семёнов С. А. , Кащеева Е. В. , Аксёнов С. В. Алгоритмическое и
программное обеспечение сопровождения анализа результатов
радиологических исследований // Молодежь и современные информационные
технологии: сборник трудов XVI Международной научно- практической
конференции студентов, аспирантов и молодых ученых, Томск, 3-7 Декабря
2018. – Томск: ТПУ, 2019 – C. 204-205
4. Кащеева Е. В. Выявление зависимости между наличием
резистентности к противотуберкулезным лекарственным средствам и
предикторами пациента // Сборник избранных статей научной сессии ТУСУР: в
2 частях. Часть 2, Томск, 22-24 Мая 2019. – Томск: В-Спектр, 2019 – C. 97-100
5. Кащеева Е. В. Определение важности признаков пациентов для
оценки вероятности резистентности к противотуберкулезным лекарственным
средствам // Перспективы развития фундаментальных наук: сборник научных
трудов XVI Международной конференции студентов, аспирантов и молодых
ученых: в 7 т., Томск, 23-26 Апреля 2019. – Томск: ТПУ, 2019 – Т. 7. IT-
технологии и электроника – C. 74-76
6. Кащеева Е. В. Извлечение значимых диагностических критериев для
рожистых воспалений из истории болезни // Информационные технологии в
науке, управлении, социальной сфере и медицине : cборник научных трудов VI
Международной научной конференции , Томск, 14-19 Октября 2019. – Томск:
ТПУ, 2019 – C. 31-33
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!