Математическое и программное обеспечение локализации областей инфильтрата в области легкого по данным компьютерной томографии
Цель работы – повышение эффективности работы врача-радиолога при подготовке медицинского заключения о наличии патологий, представляющих собой скопление инфильтрата в области легкого. Входными данными для исследования служат снимки компьютерной томографии грудной клетки пациентов с различными патологиями легких и подтвержденными диагнозами. Анализируются методы машинного обучения, способные к локализации областей инфильтрата. Широкое распространение таких патологий обуславливает существенную значимость проекта.
Введение …………………………………………………………………………………………………………………. 13
1 Цифровые медицинские изображения …………………………………………………………………….. 16
1.1 Форматы для представления цифровых медицинских изображений …………………….. 17
1.2 Проблемы обработки биомедицинских изображений …………………………………………. 18
2 Архитектура нейронной сети для локализации областей инфильтрата ………………………. 20
2.1 Операция свертки в глубоком обучении ……………………………………………………………. 20
2.1.1 Одноканальная свертка ……………………………………………………………………………… 20
2.1.2 Многоканальная свертка ……………………………………………………………………………. 21
2.1.3 Трехмерная свертка …………………………………………………………………………………… 21
2.2 Разработка архитектуры нейронной сети …………………………………………………………… 22
2.3 Реализация архитектуры нейронной сети ………………………………………………………….. 25
3 Аугментация данных …………………………………………………………………………………………….. 28
3.1 Одномерная трансформация …………………………………………………………………………….. 28
3.2 Двумерная трансформация ………………………………………………………………………………. 30
3.3 Случайные искажения ……………………………………………………………………………………… 32
3.4 Трехмерная трансформация ……………………………………………………………………………… 33
3.5 Реализация алгоритма аугментации данных ………………………………………………………. 34
4 Алгоритм локализации областей инфильтрата …………………………………………………………. 40
4.1 Используемые функционалы качества в оценке нейросетевой сегментации …………. 41
4.2 Реализация алгоритма обучения ……………………………………………………………………….. 44
4.3 Обработка скользящим окном ………………………………………………………………………….. 47
4.4 Бинаризация нейросетевой сегментации……………………………………………………………. 52
4.5 Генерация обучающего набора данных……………………………………………………………… 54
4.6 Обучение нейронной сети ………………………………………………………………………………… 57
4.7 Сглаживание результатов нейросетевой сегментации фильтром Гаусса ………………. 60
5 Результат локализации областей инфильтрата …………………………………………………………. 64
6 Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………… 68
6.1 Потенциальные потребители результатов исследования …………………………………….. 68
6.2 Оценка конкурентоспособности технических решений ………………………………………. 70
6.3 SWOT-анализ………………………………………………………………………………………………….. 72
6.4 Оценка готовности проекта к коммерциализации ………………………………………………. 73
6.5 Организация и планирование работ по проекту …………………………………………………. 74
6.5.1 Определение продолжительности этапов работ……………………………………………. 75
6.6 Расчет сметы затрат на выполнение проекта ……………………………………………………… 78
6.6.1 Расчет затрат на материалы………………………………………………………………………… 78
6.6.2 Расчет заработной платы ……………………………………………………………………………. 79
6.6.3 Расчет затрат на социальный налог …………………………………………………………….. 80
6.6.4 Расчет затрат на электроэнергию ………………………………………………………………… 80
6.6.5 Расчет амортизационных расходов ……………………………………………………………… 81
6.6.6 Расчет прочих расходов …………………………………………………………………………….. 82
6.6.7 Расчет общей себестоимости разработки …………………………………………………….. 83
6.6.8 Оценка прибыли ……………………………………………………………………………………….. 84
7 Социальная ответственность ………………………………………………………………………………….. 85
7.1 Правовые и организационные вопросы обеспечения безопасности. …………………….. 85
7.2 Производственная безопасность……………………………………………………………………….. 87
7.2.1 Правовые и организационные вопросы обеспечения безопасности ……………….. 87
7.2.2 Опасность поражения электрическим током ……………………………………………….. 89
7.2.3 Отсутствие или недостаток освещения ……………………………………………………….. 91
7.2.4 Производственные шумы …………………………………………………………………………… 96
7.3 Экологическая безопасность…………………………………………………………………………….. 97
7.4 Безопасность в чрезвычайных ситуациях ………………………………………………………….. 98
7.4.1 Перечень возможных ЧС при разработке и эксплуатации проектируемого
решения …………………………………………………………………………………………………………… 98
7.4.2 Разработка действий в результате возникшей ЧС и мер по ликвидации её
последствий ……………………………………………………………………………………………………… 99
7.4.3 Организационные мероприятия при компоновке рабочей зоны …………………… 101
7.5 Заключение по разделу ………………………………………………………………………………….. 102
Заключение……………………………………………………………………………………………………………. 103
Список использованных источников ……………………………………………………………………….. 104
Приложение А. Результат нейросетевой сегментации областей интереса ……………………. 107
Приложение Б. Software for localization of infiltrate areas in the lung region based on
computed tomography data ……………………………………………………………………………………….. 115
Приложение В. CD-диск …………………………………………………………………………………………. 130
В 2020 году человечество столкнулось с пандемией коронавирусной инфекции
COVID-19. Данная инфекция представляет собой опасное заболевание, которое может
протекать как в форме острой респираторной вирусной инфекции лёгкого течения, так и в
тяжёлой форме, специфические осложнения которой могут включать вирусную
пневмонию. Согласно статистики ВОЗ количество заболеваний в мире сначала
возникновения первой вспышки в Китае продолжает стремительно расти. На начало мая
2020 года во многих развитых странах, таких как Германия, Китай, Южная Корея, Япония
распространение вируса удалось взять под контроль. Однако, ввиду того, что данный вирус
имеет высокий показатель индекса репродукции, а также является новым вирусом, для
которого на данный момент не создано вакцины, возникает большая вероятность появления
повторных волн распространения вируса в ближайшие годы [1]. В связи с этим становиться
актуальной проблема ранней и точной диагностики наличия заболевания COVID.
Наиболее оперативным методом выявления респираторных нарушений, в том числе
вызванных COVID, является компьютерная томография (КТ) легких. Лучевые методы, не
являясь основными в диагностике коронавирусной инфекции, стали наиболее
информативными для выявления наличия и выраженности изменений в легких. Данные
лучевой визуализации позволяют заподозрить поражение легких вирусной этиологией (в
том числе COVID-19), влиять на лечение осложнений или на постановку альтернативного
диагноза. Все исследователи подчеркивают значимость таких изменений, как «матовое
стекло», консолидация, ретикулярные изменения и площадь поражения, единодушно
соглашаясь, что они отражают тяжесть заболевания и позволяют прогнозировать его
дальнейшее развитие. Очевидно, что существует достоверная корреляционная связь между
тяжестью поражения легких, определенной методом КТ и клиническим течением
заболевания, а, следовательно, целесообразность количественной оценки протяженности
изменений в паренхиме легких [2].
Еще одной распространенной причиной возникновения патологий легких, на
сегодняшний день, является туберкулез – инфекционное заболевание, вызываемое
различными видами микобактерий. Обычно туберкулез поражает легкие, но может также
поражать и другие органы и системы. Микобактерии могут вырабатывать устойчивость к
противомикробным препаратам, используемым для лечения этого заболевания. В
результате растущего из года в год количества резистентных штаммов микобактерий
широкое распространение получил туберкулез с множественной лекарственной
устойчивостью.
По данным Всемирной организации здравоохранения странами с наибольшим
количеством случаев выявления туберкулеза с множественной лекарственной
устойчивостью (47 % от общего числа в мире) являются Китай, Индия и Российская
Федерация [3]. По статистике ВОЗ каждый год туберкулезом заражается около десяти
миллионов человек и около двух миллионов погибает, что делает туберкулез одной из
ведущих причин смерти во всем мире. Считается, что каждый третий человек, заразившись
однажды, может являться латентным носителем, десятилетиями ничего не подозревая о
заболевании. И лишь в моменты ослабления иммунитета болезнь дает о себе знать.
Учитывая, что в запущенных случаях на излечение может уходить до двух лет, диагностика
туберкулеза на ранних стадиях играет очень важную роль.
Томографическая диагностика играет практически роль основного метода для
уточнения диагнозов при перечисленных заболеваниях. По оценкам компании BusinesStat
в 2017 г. натуральный объем рынка томографической диагностики в РФ составил 10,9 млн.
исследований [4]. Самым распространенным видом томографических исследований
является компьютерная томография (в 2017 году – 68,5 % от натурального объема рынка).
Кроме того, BusinesStat в рамках данного исследования выяснено, что среди видов
заболеваний наиболее распространенной группой являются заболевания органов дыхания:
в 2017 г. доля заболеваемости по группе составила 24,8 % от общего показателя по стране.
Более 1,5 млн. КТ исследований в год выполняется с целью диагностики области легкого.
В настоящее время применение сверточных нейронных сетей к обработке КТ и МРТ
изображений показывает великолепные результаты в задачах сегментации костных тканей,
анатомии брюшной полости, сердца, легких и головного мозга. Также в последнее время
была доказана эффективность использования глубокого обучения в задачах
автоматического детектирования, распознавания, сегментации и классификации патологий
на медицинских изображениях, что является важным шагом в раннем выявлении и
диагностике различных заболеваний. Общее описание используемых подходов и примеры
решения конкретных задач можно найти в обзорной публикации [5]. Однако,
эффективность использования методов машинного обучения сильно ограничена
небольшими объемами тренировочных наборов данных и несогласованным качеством их
аннотаций.
Целью настоящей работы является повышение эффективности работы врача-
радиолога путем разработки архитектуры глубокой сверточной нейронной сети для
автоматической локализации инфильтрата на КТ-изображениях. Решение задачи
локализации областей инфильтрата позволит быстрее и точнее готовить медицинское
заключение о состоянии легкого, что позволит увеличить качество медицинской
диагностики.
Для достижения заявленной цели необходимо выполнить следующие задачи:
Изучить форматы хранения цифровых изображений компьютерной томографии;
Спроектировать архитектуру сверточной нейронной сети (ИНС) для локализации
патологий, содержащих инфильтрат в области легкого на КТ;
Разработать алгоритма аугментации данных;
Реализовать архитектуру ИНС и обучить модель;
Протестировать модель и проанализировать результаты.
Входными данными для исследования служат снимки компьютерной томографии
грудной клетки пациентов с различными патологиями легких и подтвержденными
диагнозами. В работе анализируются современные методы машинного обучения,
способные к локализации областей инфильтрата. Широкое распространение таких
патологий обуславливает существенную значимость выполняемой работы.
1 ЦИФРОВЫЕ МЕДИЦИНСКИЕ ИЗОБРАЖЕНИЯ
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!