Диагностирование диабета на начальном этапе
Некоторые болезни сложно диагностировать на этапе их зарождения в человеческом организме. К ним относится и сахарный диабет 2 типа (СД2). Прогнозирование данного заболевания является очень важной задачей, поскольку оказывает колоссальное влияние на экономическую сферу здравоохранения. Здесь от своевременного диагностирования будет зависеть процент осложнений, смертности и расходов государства. Поскольку прогнозирование СД2 на раннем этапе является дорогостоящим, то в данной работе предлагается использовать машинное обучение для удешевления данного исследования. Для выполнения поставленной задачи была изучена предметная область, а именно болезнь СД2. Были приведены все необходимые данные и их подробный анализ для её диагностирования. Программно построены различные методы машинного обучения для прогнозирования диабета у пациента на начальном этапе. Проведён их сравнительный анализ.
Введение……………………………………………………………………… 3
Обзор литературы……………………………………………………………. 4
Постановка задачи…………………………………………………………… 7
Глава 1. Данные……………………………………………………………… 8
1.1 Анализ данных……………………………………………………. 8
1.2 Входные данные…………………………………………………… 11
Глава 2. Программное построение моделей………………………………… 19
2.1 Выбор метрики оценки качества………………………………… 19
2.2 Предварительная обработка данных. Выбор параметров
модели и кросс-валидация…………………………………………………… 20
2.3 Логистическая регрессия…………………………………………. 21
2.4 Случайный лес…………………………………………………….. 23
2.5 Метод опорных векторов………………………………………… 24
2.6 Многослойный персептрон……………………………………….. 26
2.7 Сравнительный анализ методов машинного обучения…………. 27
Анализ заболевания СД2 в РФ……………………………………………… 29
Заключение…………………………………………………………………… 35
Список литературы…………………………………………………………… 36
Программный код………..…………………………………………………… 38
Некоторые болезни очень сложно диагностировать на этапе их зарождения в
человеческом организме. Именно они чаще всего пропускаются докторами. Это
связано с тем, что на ранних этапах отсутствуют какие-либо симптомы, они
неясные, либо слабо ощутимые. Другая причина – даже при полном спектре
анализов даже квалифицированному специалисту будет сложно определить
наличие такой болезни.
В данной работе речь пойдёт о диабете. Сахарный диабет — это состояние,
при котором количество глюкозы (сахара) в крови слишком высокое, потому что
организм не может правильно его использовать. Это происходит потому, что
организм не в состоянии использовать или не производит гормон инсулин,
который отвечает за переработку сахара из пищи, для клеток вашего тела.
Различают два вида диабета: диабет 1 типа – врождённый диабет, диабет 2 типа –
приобретенный. К сложно диагностируемому относится 2 тип. Дело в том, что
диабет 2 не имеет ярко выраженных симптомов, требуются годы наблюдений для
того, чтобы диагностировать данное заболевание. Часто сами больные не
обращают внимания на симптомы этой болезни и не обращаются за медицинской
помощью к профессионалам.
Сахарный диабет 2 типа — заболевание, затрагивающее практически все
органы и системы в организме. Повышенный уровень сахара в крови отрицательно
влияет на нервную систему, головной мозг, сердечно-сосудистую систему, а также
вызывает определенные изменения уровня холестерина крови.
В настоящее время человечество живёт в веке высоких технологий, которые
имеют огромные мощности и способны обрабатывать большие объемы
информации. Уже сейчас существуют методы современной медицины, с
использованием цифровых технологий, которые помогают докторам проводить
анализы высокой точности и диагностировать те или иные болезни. Поэтому,
можно поставить задачу диагностирования на раннем этапе такого сложно
диагностируемого заболевания, как диабет 2 типа, используя современные методы
машинного обучения [1-3].
Обзор литературы
За последние три десятилетия число людей с сахарным диабетом в мире
более чем удвоилось, что делает его одной из наиболее важных проблем
общественного здравоохранения для всех стран [12]. Сахарный диабет 2 типа
(СД2) и предиабет все чаще наблюдаются у женщин, детей, подростков и молодых
людей. Профилактика СД2 является задачей на всю жизнь и требует комплексного
подхода [13-14].
В 2010 году, во всем мире, у 285 миллионов человек был сахарный диабет, у
90% из которых был диабет 2 типа (СД2) (Диаграмма 1). Прогнозируется, что
число людей с сахарным диабетом во всем мире возрастет до 439 миллионов к
2030 году, что составляет 7,7% от общей численности взрослого населения мира в
возрасте 20–79 лет [15] (Диаграмма 2).
Диабет оказывает существенное влияние на экономическую сферу
здравоохранения государства. При оценке экономических последствий
учитываются несколько факторов: заболеваемость и распространение заболевания,
уровень развития системы здравоохранения и общий уровень экономического
развития населения. Для оценки таких последствий были разработаны два
подхода:
1. Первый подход измеряет нематериальные затраты, связанные с диабетом.
Он сочетает в себе число лет здоровой жизни, потерянных в результате
ранней смертности, и лет, потерянных из-за инвалидности.
2. Второй подход — это метод оценки стоимости болезни, который включает в
себя концепции прямых, косвенных и нематериальных затрат.
Исследование, проведенное Всемирным банком, показало, что из 1362
миллионов лет жизней с поправкой на инвалидность, потерянных во всех болезнях
в 1990 году, 7,97 миллионов лет были потеряны из-за диабета. В исследовании,
проведенном в 1992 году, в котором оценивались прямые затраты на лечение
диабета в США, Американская ассоциация диабета использовала подход,
основанный на оценке стоимости заболевания, и обнаружила, что общая сумма
расходов за 1 год составила 45,2 миллиарда долларов [10].
В эпидемиологических исследованиях Зиммета и Всемирной организации
здравоохранения, проведенных в 1994 году, приводятся оценки увеличения
распространенности диабета в результате увеличения численности населения.
Оценки глобальной стоимости диабета на основе этих исследований показывают,
что диабет составляет 2-3% от общего бюджета здравоохранения в каждой стране
[11] (Диаграмма 3).
Таким образом, в данной работе была изучена предметная область, а именно
болезнь диабет. Были приведены все необходимые данные и их подробный анализ
для её диагностирования. Программно построены различные методы машинного
обучения для прогнозирования диабета у пациента на начальном этапе. Проведён
их сравнительный анализ [9]. Установлено, что наиболее эффективным является
метод «случайный лес». Однако, если увеличить количество входных данных НС
сможет показать более точный результат.
В результате проделанной работы был сделан вывод о том, что вопрос
диагностирования СД2 на начальном этапе, увеличение эффективности лечения, а
также минимизации экономических затрат является актуальным и может быть
решен путём программного построения методов машинного обучения для
прогнозирования СД2, цифровизации отрасли здравоохранения и привлечение
крупных компаний для инвестирования.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!