Использование методов машинного обучения для анализа данных в сложной медико-биологической системе
В данной работе рассматривается возможность применения кластерного анализа для задачи диагностирования заболеваний мозга. Сложность задач, возникающих в области нейрофизиологии, а также объем данных, которые используются для диагностики и лечения пациентов, неуклонно растут. Ранняя диагностика болезни Альцгеймера может позволить назначить своевременное лечение для замедления прогрессирования заболевания. Так как, на практике приходится вручную анализировать полученные результаты обследований, возможны ошибки, связанные с человеческим фактором. Кроме того, не всегда удается поставить точный диагноз. В связи с этим разработка эффективных методов обработки этих данных становится наиболее приоритетной.
Была исследована возможность разделения пациентов на группы на основе данных результатов теста Векслера, МРТ и ЭЭГ обследований головного мозга, а так же проведена проверка статистически значимых различий между полученными кластерами по анализам крови.
Введение…………………………………………………………………………………………… 4
Постановка задачи ……………………………………………………………………………. 6
Обзор литературы …………………………………………………………………………….. 7
Глава 1. Исходные данные ………………………………………………………………… 9
1.1 Описание данных ………………………………………………………………… 9
1.2 Тест Векслера ……………………………………………………………………… 9
1.3 Данные МРТ ……………………………………………………………………… 10
1.4 Данные ЭЭГ ………………………………………………………………………. 11
1.5 Анализы крови ………………………………………………………………….. 13
1.6 Предобработка данных ………………………………………………………. 13
Глава 2. Используемые методы ……………………………………………………….. 14
2.1 Кластеризация …………………………………………………………………… 14
2.1.1 K-средних …………………………………………………………………………. 14
2.1.2 Агломеративная кластеризация………………………………………….. 15
2.1.3 Модель гауссовой смеси ……………………………………………………. 16
2.2 Понижение размерности ……………………………………………………. 17
2.3 Проверка статистических гипотез………………………………………. 19
Глава 3. Анализ данных…………………………………………………………………… 20
3.1 Выбор инструментария ……………………………………………………… 20
3.2 Данные теста Векслера………………………………………………………. 20
3.3 Данные МРТ ……………………………………………………………………… 23
3.4 Данные ЭЭГ ………………………………………………………………………. 26
3.5 Отбор признаков ……………………………………………………………….. 29 2
Выводы …………………………………………………………………………………………… 32
Заключение …………………………………………………………………………………….. 33
Список литературы …………………………………………………………………………. 34
Предметная область: Сложность задач, возникающих в области нейрофизиологии, а также объем данных, которые используются для диагностики и лечения пациентов, неуклонно растут. В связи с этим разработка эффективных методов обработки этих данных становится наиболее приоритетной. В настоящее время медицинские исследования, и, в частности, нейрофизиология, являются обширной областью для применения методов искусственного интеллекта.
По оценкам, в 2018 году во всем мире насчитывалось около 50 миллионов человек, страдающих деменцией. К 2030 году это число по прогнозам увеличится до 82 миллионов, а уже к 2050 достигнет отметки 152 миллиона человека, что почти в 3 раза больше, чем на данный момент [1].
Болезнь Альцгеймера — это тип деменции, составляющий около 60-80% всех случаев, который вызывает проблемы с памятью, мышлением и поведением. Симптомы обычно развиваются медленно и со временем ухудшаются, становясь достаточно серьезными, чтобы мешать повседневным задачам. Повреждение мозга начинается задолго до того, как появляются проблемы с памятью или другие когнитивные проблемы [2].
Для диагностики болезни Альцгеймера требуется комплексное обследование: изучается семейная медицинская история, применяются различные методы нейровизуализации, например магнитно-резонансная томография (МРТ), проводятся нейрофизиологические исследования, например электроэнцефалография (ЭЭГ), когнитивные тесты на оценку памяти и мышления, анализы крови [3].
Актуальность исследования: Ранняя диагностика болезни Альцгеймера может позволить назначить своевременное лечение для замедления прогрессирования заболевания. Так как, на практике приходится вручную анализировать полученные результаты обследований, возможны
4
ошибки, связанные с человеческим фактором. Кроме того, не всегда удается поставить точный диагноз. Учитывая большое количество источников данных, необходимо знать, на какие показатели стоит обращать внимание.
В данной работе будут рассмотрены данные полученные с помощью МРТ и ЭЭГ обследований, теста Векслера, а также анализов крови.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!