Прогнозирование рецидива туберкулёза органов дыхания с множественной лекарственной устойчивостью
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА1ОБЗОРЛИТЕРАТУРЫ
1.1 Рецидив туберкулеза (в том числе с множественной лекарственной устойчивостью возбудителя): эпидемиология, причины возникновения. . . .
1.2 Искусственный интеллект и методы машинного обучения: история созданияисферадеятельности
1.3 Методы машинного обучения, применяемые во фтизиатрии. . . . . . . . . . .
ГЛАВА2МАТЕРИАЛИМЕТОДЫИССЛЕДОВАНИЯ
2.1Организацияисследованияисхемаегопроведения
2.2Материалиметодыисследования
ГЛАВА 3 РЕЗУЛЬТАТЫ СОБСТВЕННЫХ ИССЛЕДОВАНИЙ. . . . . . . . . . .
3.1 Статистический анализ групп наблюдения по выявлению предикторов рецидива туберкулеза с множественной лекарственной устойчивостью . . . .
3.2 Регрессионный анализ данных пациентов по выявлению предикторов рецидива туберкулеза с множественной лекарственной устойчивостью. . . .
3.3 Алгоритмы машинного обучения в прогнозировании рецидива заболевания у больных туберкулезом с множественной лекарственной устойчивостью
ЗАКЛЮЧЕНИЕ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ВЫВОДЫ
ПРАКТИЧЕСКИЕРЕКОМЕНДАЦИИ
СПИСОКСОКРАЩЕНИЙИУСЛОВНЫХОБОЗНАЧЕНИЙ
СПИСОКЛИТЕРАТУРЫ
СПИСОКИЛЛЮСТРАТИВНОГОМАТЕРИАЛА
ПРИЛОЖЕНИЕ А (справочное) Иллюстративный материал этапов работы классификаторанаосновеметодадереворешений
ПРИЛОЖЕНИЕ Б (справочное) Иллюстративный материал этапов работы классификаторанаосновеметодаслучайныйлес
3
ПРИЛОЖЕНИЕ В (справочное) Иллюстративный материал этапов работы
классификаторанаосновеметодаXGBoost
ПРИЛОЖЕНИЕ Г (справочное) Иллюстративный материал этапов работы классификатора на основе метода логистическая регрессия. . . . . . . . . . . . . .
ПРИЛОЖЕНИЕ Д (справочное) Тестируемый набор признаков пациента No11
ПРИЛОЖЕНИЕ Е (справочное) Тестируемый набор признаков пациента No56
ПРИЛОЖЕНИЕ Ж (справочное) Программа-калькулятор для оценки риска развития рецидива у больных с множественно лекарственно устойчивым туберкулезом(фрагментытекстапрограммы)
МАТЕРИАЛ И МЕТОДЫ ИССЛЕДОВАНИЯ
Проведенное исследование одобрено локальным этическим комитетом ФГБОУ ВО «Сибирский государственный медицинский университет» Минздрава России (протокол No 5554 от 16.10.2017). Исследовательская база данных пациентов сформирована ретроспективно, в ней содержатся данные о 346 пациентах после ЭКХТ с различными клиническими формами ТОД, которые получали лечение по IV режиму ХТ с января 2009 по декабрь 2011 года. Критериями включения явились: возраст старше 18 лет; ТОД; оба пола; диагноз ТБ, подтвержденный клинически, рентгенологически с посевом мокроты на плотные питательные среды и определением ЛУ МБТ. Критерии исключения: возраст младше 18 лет; внелегочные формы ТБ; неэффективный курс ХТ; прерывание курса ХТ; выбывшие из административной территории до завершения диспансерного наблюдения; смерть от ТБ и от других причин во время лечения.
Для реализации цели исследования и решения задач сформированы две группы пациентов: 1-я (основная) – лица, у которых наступил рецидив заболевания после ЭКХТ (n = 35), 2-я (контрольная) – лица без рецидива заболевания (n = 311), срок наблюдения – минимум 5лет. Обследование, назначение курсов ХТ, а также диспансерное наблюдение пациентов обеих групп проходили согласно действующим нормативным документам на период лечения больных. Выбор препаратов проводился на основе результатов культурального исследования мокроты (посев на плотные среды). Назначение режима ХТ МЛУ ТБ, ее организация и продолжительность, выбор ПТП и соответствующей схемы ХТ, перевод с интенсивной фазы лечения на продолжающую, назначение иных мероприятий производилось врачебной комиссией ОГАУЗ «Томский фтизиопульмонологический медицинский центр».
Создана исследовательская база с обезличенными персональными данными пациентов, куда вносили анамнестические сведения, результаты клинических и параклинических исследований, схемы ХТ, изменения ПТП в режиме лечения, информация о спектре ЛУ МБТ, данные о характере остаточных изменений, о поражении и распространенности процесса и др. Источниками информации была медицинская документация, а также использовали базы учета контингентов ОГАУЗ «Томский фтизиопульмонологический медицинский центр». База данных имела количественные, качественные и порядковые признаки. Для обеспечения репрезентативности данных и достоверности выводов, полученных в ходе исследования для Томской области, размером выборки выступила генеральная совокупность лиц больных с рецидивами МЛУ ТОД, зарегистрированных за указанный период постлечебного наблюдения.
Данные реализованы в табличном виде с использованием пакета Microsoft Office Excel 2016. Обработку и статистический анализ полученных результатов проводили с использованием IBM SPSS Statistics версия 23. Проверку на нормальность закона распределения проводили с помощью критериев: W-критерий Шапиро – Уилка, критерий Колмогорова – Смирнова. Наряду со средним значением M и стандартным отклонением σ, использовали медиану Me и квартили Q1 и Q3. Достоверность различий в двух независимых группах количественных данных проверяли при помощи t-критерия Стьюдента. При сравнении порядковых признаков, а также количественных использовали U-критерий Манна – Уитни. Качественные признаки представлены в виде абсолютных и относительных частот n (%). Для сравнения использовали критерий χ2 Пирсона, также – поправку Йетса, точный критерий Фишера и критерий Фишера по Монте-Карло (F). Различия считали статистически значимыми при p < 0,05. В таблицах сопряженности 2×2 при обнаружении значимых различий определяли ОШ и 95 % доверительный интервал
(95 % ДИ) по методу Уилсона. Для исследования сравнения в динамике ЛУ внутри группы использовали критерий χ2 Мак-Немара. Для получения уравнения и оценки вклада применяли многофакторный анализ в модуле бинарной логистической регрессии. Для построения модели использовали пошаговый отбор включения переменных в уравнение прямой с определением минимального набора предикторов по оценке значения коэффициента детерминации R2. Адекватность полученной модели оценивали с помощью критериев Хосмера – Лемешева, Вальда. Проверку значимости модели осуществляли при помощи критерия χ2. При значении р < 0,05 принимали гипотезу о согласованности модели. Интерпретацию параметров логистической регрессии производили на основе величины exp (b). Чувствительность и специфичность оценивали при помощи ROC-анализа. Количественную интерпретацию результатов проводили с оценкой показателя AUC. Методы МО реализовали на высокоуровневом языке Python версии 3.8.6. В качестве классификаторов использовали дерево решений, случайный лес, XGBoost (градиентный бустинг) и логистическую регрессию (Shi Yu, 2019; Ji C., 2019; Irimata K. M., 2019; Zhao X., 2020; Chen T., 2020). При построении моделей прогнозирования использовали инструменты библиотеки scikit-learn Version 0.24.2 в интерактивной облачной среде работы с программным кодом Google Colaboratory. Для учета несбалансированности размеров выборки использовали подход с разделением исходной обучающей выборки на 5 случайных подвыборок с сохранением пропорций классов (функция StratifiedKFold). Полученные оценки точности, специфичности, чувствительности и AUC усредняли по всем 5 выборкам. На основе оптимальной построенной модели классификации проведено тестирование на клинических случаях двух пациентов.
РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ИХ ОБСУЖДЕНИЕ
Рецидивы после ЭКХТ больных МЛУ ТОД в 77,1 % возникают в течение первых 3 лет наблюдения. Средний срок наступления рецидива – 1,9 года. Частота возникновения за 5 лет наблюдения – 10,1 %.
В обеих группах преобладали мужчины – 26 (74,3 %) и 224 (72,0 %) (p = 0,933; χ2*). Значения ИМТ колебались в пределах 20,9 (p = 0,813; U). По среднему возрасту пациентов различий выявлено не было (p = 0,255; U). Жители города и области в равных долях (p = 0,666; χ2), безработных в 1-й группе – 27 (77,1 %), во 2-й группе – 235 (75,6 %) (р = 0,999; χ2*), пациентов БОМЖ – 17,1 % и 8,4 % (р = 0,164; χ2*). Важными параметрами для прогноза возникновения рецидива в будущем являются: пенсионный возраст (ОШ = 2,86; 95% ДИ 1,14–7,20) и наличие у пациента инвалидности по соматическому заболеванию (ОШ = 4,82; 95 % ДИ 2,13–10,90). Обнаружены значимые различия по наличию сопутствующей патологии: в 1-й группе
чаще встречались ВИЧ-инфекция – 20,0 % (ОШ = 19,19; 95 % ДИ 5,29–69,56), во 2-й группе – 1,3 % (p < 0,001, ТТФ), психические заболевания – 22,9 % (ОШ = 5,85; 95 % ДИ 2,27–15,03) и 4,8 % соответственно (p < 0,001; χ2*); табакокурение – 88,6 % (ОШ = 3,16; 95 % ДИ 1,08–9,20) и 71,1 % (p = 0,027; ТТФ).
Доля пациентов с впервые выявленным диагнозом ТБ в 1-й группе – 11,4 % (ОШ = 0,08; 95 % ДИ 0,03–0,24), во 2-й группе – 61,1 % (p < 0,001; F). Важную роль в развитии рецидива имеет наличие нескольких курсов лечения: у 31 человека (88,6 %) 1-й группы (ОШ = 12,17; 95 % ДИ 4,19–35,34) и у 121 человека (38,9 %) 2-й группы (p < 0,001, ТТФ). Среди них повторное лечение из 1-й группы – 25 (71,4 %) (ОШ = 5,60; 95 % ДИ 2,59–12,11) и 96 (30,9 %) из 2-й группы (p < 0,001; χ2); с хроническим течением заболевания – 6 (17,1 %) и 25 (8,0 %) пациентов соответственно (р = 0,140; χ2*). Чаще рецидивы МЛУ ТОД возникают у пациентов с большим количеством предыдущих курсов лечения: три курса (ОШ = 3,40; 95 % ДИ 1,60–7,23), четыре курса (ОШ = 47,06; 95 % ДИ 12,29–180,16), пять курсов (во 2-й группе частота равна нулю). Во 2-й группе течения МЛУ ТБ повторное лечение не превышало двух курсов: один курс ХТ наблюдался лишь у 2-й группы (p < 0,001; ТТФ), два курса ХТ в 1-й группе встречалось у 5,7 % (ОШ = 0,06; 95 % ДИ 0,01–0,25), во 2-й группе составило 50,8 % (p < 0,001; ТТФ). По количеству курсов ХТ ПТП резервного ряда не обнаружено разницы в частоте использования (р = 0,690; U).
Клинические формы ТОД у больных в группах наблюдали с одинаковой частотой, различий не выявлено (р = 0,526, F). Превалировала инфильтративная форма – 42,9 % в 1-й группе и 55,6 % случаев во 2-й группе. Диссеминированный ТБ в 31,4 % и 22,5 % случаев, доли больных с фиброзно-кавернозным и кавернозный ТБ – 5,7 % и 4,2 %. Очаговый ТБ и туберкулемы – 6–8 % в обеих группах. По объему поражения достоверных различий не выявлено (р = 0,203; χ2*). Деструкция легочной ткани чаще встречалась в 1-й группе на начало лечения в 94,3 % (ОШ =7,48; 95 % ДИ 1,76–31,80) и 68,8 % случаев во 2-й (р = 0,001; ТТФ). На возникновение рецидива влияет лишь наличие каверн в легких, независимо от их размеров (р = 0,422; U). После ЭКХТ все 35 пациентов (100 %) 1-й группы имели большие и малые остаточные изменения в легких, в 2-й группе их доля – 85,9% (р = 0,013; ТТФ). Большие остаточные изменения после ЭКХТ превалируют в 1-й группе в 60 % (ОШ = 3,38; 95 % ДИ 1,64–6,98) и в 30,7 % случаев во 2-й группе и приводят к повторному заболеванию вне зависимости от конкретных характеристик (p = 0,001; χ2). Сравнение конкретных характеристик малых (p = 0,327; F) или больших остаточных изменений в легких не обнаружило влияния на развитие у пациента рецидива (p = 0,080; F).
Положительный микроскопический анализ на КУМ на начало лечения установлен у 27 (77,1 %) пациентов 1-й группы (ОШ = 2,91; 95 % ДИ 1,28–6,61) и 167 (53,7 %) – 2-й группы (p = 0,014; χ2*). Степень бактериовыделения на основе положительной микроскопии (p = 0,320; U) и посева (p = 0,180; U) на начало лечения в группах одинакова. У больных двух групп наблюдения давность заболевания в среднем составила 2,03 (0,33; 7,47) и 0,60 (0,23; 5,90) в годах и не имела различий (p = 0,126; U), равно как и давность обнаружения МЛУ (p = 0,790; U). Спектр ЛУ МБТ у больных в группах наблюдения до начала лечения был одинаков без установленных различий по каждому ПТП. При этом до начала лечения у всех больных выявляли достаточно высокую частоту ЛУ МБТ к следующим ПТП: к этионамиду/протионамиду (Eto/Pto) в 40,0 % (1-я группа) и 37,8 % случаев (2-я группа) (p = 0,800; χ2), к канамицину/амикацину (Km/Am) в 25,7 % и 13,6 % (p = 0,076; χ2*), к капреомицину (Cm) в 25,7 % и 14,0 % (p = 0,113; χ2*). Лекарственная устойчивость МБТ к фторхинолонам в группах наблюдения не достигала 20% (p=0,502; χ2*), к ПАСК (PAS) около 5% (p=0,694; ТТФ), к циклосерину (Cs) не превышала 1 % (p = 1,000; ТТФ). При динамическом исследовании значимое нарастание ЛУ произошло ко всем препаратам в 1-й группе. Во 2-й группе исключением стал Cs (p = 0,625; χ2МН). При сравнении результатов спектр ЛУ в последних положительных посевах мокроты: ЛУ к этамбутолу (E) характерна для 1-й группы – 68,6 % (ОШ = 8,42; 95 % ДИ 3,92–18,09) по сравнению со 2-й группой – 20,6 % (p < 0,001; χ2), к Km/Am – у 54,3 % (ОШ = 5,91; 2,85–12,26) и у 17,0% (p < 0,001; χ2), к Cm – 51,4% (ОШ=5,27; 95% ДИ 2,55–10,91) и 17,0% (p < 0,001; χ2), к фторхинолонам – 54,3 % (ОШ = 7,02; 95 % ДИ 3,36–14,66) и 14,7 % (p < 0,001; χ2), Eto/Pto – 74,3 % (ОШ = 4,30; 95 % ДИ 1,95–9,48) и 41,1 % (p < 0,001; χ2), к ПАСК – 42,9 % (ОШ = 8,97; 95 % ДИ 4,08–19,73) и 7,9 % (p < 0,001; χ2), по Cs различий не наблюдали (p = 0,154; ТТФ).
Амплификацию МБТ наблюдали к: Km/Am (25,7 % и 54,3 % соответственно, (ОШ=5,91; 95% ДИ 2,85–12,26); Cm (25,7% и 51,4%, (ОШ=5,27; 95% ДИ 2,55–10,91), E (25,7 % и 68,6 %, (ОШ = 0,12; 95 % ДИ 0,06–0,26), Eto/Pto (40,0 % и 74,3 %, (ОШ = 4,30; 95 % ДИ 1,95–9,48), левофлоксацину (Lfx) (17,1 % до 54,3 %, (ОШ = 7,02; 95 % ДИ 3,36–14,66). Частота ЛУ МБТ к PAS увеличивалась в процессе ХТ в восемь раз (5,7 % и 42,9 % (ОШ = 8,97; 95 % ДИ 4,08–19,73). Во 2-й группе амплификация ЛУ МБТ по всем вышеуказанным ПТП на фоне ХТ присутствовала, в динамике существенно не нарастала, увеличение частот в пределах 3–4%. У 21 (60,0 %) пациента 1-й группы (ОШ = 12,22; 95 % ДИ 5,69–26,24) в процессе ХТ наблюдали амплификацию к ПТП, что не только усложнило лечение текущего курса, но и повлияло на возникновение рецидива. Подобную тенденцию во 2-й группе
наблюдали всего у 34 (10,9 %) больных (р < 0,001; χ2). Амплификацию в 1-й группе чаще наблюдали к двум (ОШ = 6,94; 95 % ДИ 2,31–20,88), трем (ОШ = 9,90; 95 % ДИ 2,36–41,56), четырем (ОШ = 25,75; 95 % ДИ 4,79–138,46) и пяти (ОШ = 18,79; 95 % ДИ 1,66–212,81) противотуберкулезным препаратам.
Наличие различного сочетания ЛУ МБТ к ПТП у больных с МЛУ ТОД привело к разнообразию схем ХТ. Преобладающая схема ХТ больных МЛУ ТБ состояла из следующих ПТП: Cm/Km Cs E Lfx/Mfx Eto/Ptо Z в 31,4 % 1-й и в 37,9 % 2-й групп (p=0,600; F). Анализируя схемы назначенного лечения, было определено, что фторхинолоны применяли в 94,3 % и 97,7 % случаев (p = 0,228; ТТФ) и инъекционные ПТП в 97,1 % и 93,9 % (p = 0,706; ТТФ). У 332 пациентов (96,0 %) в лечении имелся Z, у 158 (45,7 %) – PAS, у 289 (83,5 %) – Pto, у 238 (68,8 %) – E. При этом по числу ПТП в схемах ХТ различий не выявлено (p = 0,940; U). После получения результатов посева корректировали ХТ пациенту, так как схема ПТП могла быть назначена некорректно как по числу, так и по спектру ЛУ МБТ. Не выявлено зависимости между наступлением рецидива и первоначальной некорректной схемой ХТ, в большинстве случаев схема была полной и соответствовала спектру ЛУ МБТ у больных обеих групп – 33 (94,3 %) и 298 (95,8 %) (p = 0,655; ТТФ). Данные теста на ЛЧ МБТ в последнем положительном посеве демонстрируют, что пациенты с сохраненной ЛЧ МБТ к шести (ОШ = 0,33; 95 % ДИ 0,11–0,97) и семи (ОШ = 0,38; 95 % ДИ 0,16–0,90) противотуберкулезным препаратам излечивались от ТБ и относились к 2-й группе больных. В 1-й группе у каждого второго резерв ПТП к концу лечения ограничивался лишь одним (ОШ = 22,74; 95 % ДИ 6,43–80,42) или двумя ПТП (ОШ = 10,86; 95 % ДИ 3,55–33,17). К концу лечения у 19 (54,3%) больных в 1-й группе (ОШ=0,07; 95% ДИ 0,03–0,17) схема ХТ соответствовала действующим в то время клиническим рекомендациям по лечению МЛУ ТБ, во 2-й группе она была корректной у 293(94,2%) пациентов, что достоверно свидетельствует о влиянии полноты курса ХТ с сохраненной ЛЧ на безрецидивное течение в сроках наблюдения (p < 0,001; χ2). Наиболее часто встречаемая схема Cm/Km/Am Cs E Eto/Pto Lfx/Mfx Z на конец лечения больных была в 17,1 % (ОШ = 0,30; 95 % ДИ 0,12–0,73) и 41,2 % случаев и достоверно снижала риск развития рецидива МЛУ ТБ (p = 0,010; χ2*).
У лиц 1-й группы характерен больший период абациллирования и средний срок лечения. Через 2 мес. лечения прекратили выделять МБТ: 14 (40,0 %) человек из 1-й группы (ОШ = 4,98; 95 % ДИ 2,41–10,29) и 239 (76,8 %) из 2-й группы (p < 0,001; χ2*). Средний срок лечения пациентов в 1-й группе составил 21,1 мес. лечения, во 2-й – 20,0 мес. (p < 0,001; U). Не подтвердилось влияние приверженности лечению, процент принятых доз у пациентов в наблюдаемых группах практически был идентичен –
93 % и 92 % (p = 0,526; U). В 1-й группе частота больных с нарушением приема ПТП – 37,1 %, что незначимо превышает значения 2-й группы – 23,2 % (p = 0,068; χ2). Количество пациентов с самостоятельным прерыванием лечения значимо не различалось (p = 0,067; χ2*), несмотря на относительные частоты (20,0 % – 1-я группа и 8,7 % – 2-я группа).
Регрессионный анализ данных пациентов по выявлению предикторов рецидива туберкулеза органов дыхания с множественной лекарственной устойчивостью. В регрессионном анализе рассматривали параметры, предикторная роль которых в возникновении рецидива у излеченных пациентов с МЛУ ТОД была доказана с помощью однофакторного анализа. С целью исключения мультиколлинеарности отобраны факторы с более высоким значением ОШ и уровнем значимости, стремящемуся к нулю. Больший вклад в формирование рецидива у пациентов с МЛУ ТБ имели следующие предикторы, которые включены в уравнение (b – весовой коэффициент, p – уровень значимости по критерию Вальда): константа (b0 = –46,940, p < 0,001); x1 – пенсионный возраст (b1 = 2,257, p = 0,013); x2 – наличие ВИЧ (b2 = 5,370, p = 0,003); x3 – число предыдущих курсов лечения (b3 = 3,172, p < 0,001); x4 – нарастание спектра ЛУ МБТ к ПТП в период лечения (амплификация) (b4 = 2,057, p = 0,026); x5 – наличие деструкции в легочной ткани на начало лечения (b5 = 2,882, p = 0,065); x6 – срок лечения (b6 = 1,528, p = 0,001). Уравнение регрессии:
Y=2,257×x1 +5,370×x2 +3,172×x3 +2,057×x4 +2,882×x5 +1,528×x6 –46,940
Параметры регрессии: качество подгонки модели χ2 = 181,134, p < 0,001; R2 (Нэйджелкерка) = 0,848; критерий Хосмера-Лемешева χ2 = 0,575, p = 1,000; снижение коэффициента логарифмического правдоподобия до 45,576.
Вероятность возникновения события рассчитаны по следующей формуле:
Характеристики модели: коэффициент детерминации (R2) – 84,8%, коэффициент конкордации – 97,7 %, чувствительность метода – 88,6 %, специфичность – 98,7 %. Результаты ROC-анализа – площадь под кривой AUC = 0,992, что говорит о высоком качестве созданной модели.
Алгоритмы машинного обучения в прогнозировании рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью.
Для построения классифицирующих моделей были выбраны следующие методы МО: дерево решений, случайный лес, XGBoost (градиентный бустинг) и логистическая регрессия. В исследовании на 1-м этапе вся выборка поделена в отношении 70 % и 30% с сохранением баланса классов для обучающего и тестового набора. Для валидации полученных моделей и исключения случая переобучения данные из тестовой выборки не участвовали в процессе обучения.
Существует значительная часть признаков, не попадающих в правила, формирующие деревья, и их информативность по критерию прироста информации в модели равна нулю. Определены 20 неинформативных признаков, которые в основном связаны с ЛУ МБТ к ПТП на начало ХТ (Km, Am, Cm, E, Z, PAS). Кроме того, классификатор не выявил глубинной связи между рецидивом МЛУ ТБ и коморбидностью у пациентов, а также с зависимостями в употреблении психоактивных веществ и табакокурении.
На 2-м этапе для демонстрации надежности прогностических моделей использована стратифицированная К-блочная перекрѐстная проверка для каждого метода МО с делением набора данных на 5 блоков. Полученные оценки информативности признаков, специфичности, чувствительности и AUC усреднялись по всем 5 выборкам.
Установлена значимость лидирующих признаков для каждого из выбранных алгоритмов МО: повторные курсы ХТ, сопряженные с достаточно продолжительным сроком заболевания, с МЛУ МБТ более 3 лет, а также продолжительностью лечения МЛУ ТОД и наличия у пациентов ВИЧ-инфекции. Из сопутствующей патологии XGBoost выделил больных с наличием вирусных гепатитов В, С, В+С, а в модели логистической регрессии определены социальные факторы риска в виде наличия у пациентов инвалидности по соматическому заболеванию и пенсионный возраст. К менее важным, но введенным в модель прогноза большинством методов, относятся признаки, влияющие на эффективность лечения: количество ПТП в схеме ХТ с сохраненной ЛЧ, сроки абациллирования, амплификация МБТ к Lfx на фоне лечения.
В модели случайный лес определен вклад наличия остаточных изменений в легких, деревом решений – индекс массы тела. Наглядным способом, позволяющим оценить качество построенных моделей прогноза, является построение ROC-кривой на основании рассчитанных показателей специфичности и чувствительности (рисунок 1).
Рисунок 1 – ROC кривые для моделей классификаторов машинного обучения, определяющих признаки, сопряженные с рецидивом туберкулеза органов дыхания с множественной лекарственной устойчивостью
Числовые трактовки параметров, представленные в таблице 1, свидетельствуют о высоком качестве работы прогнозирующих моделей МО.
Таблица 1 – Параметры, характеризующие качество моделей методами машинного обучения
Алгоритм
Дерево решений Случайный лес
XGBoost
Логистическая регрессия
Чувствительность, отклонение 0,74 ± 0,167 0,91 ± 0,17 0,91 ± 0,14 0,91 ± 0,16
Специфичность, отклонение 0,97 ± 0,03 0,98 ± 0,02 0,98 ± 0,02 0,98 ± 0,02
AUC, отклонение
0,9 ± 0,1 0,96 ± 0,03 0,98 ± 0,02 0,95 ± 0,04
Оптимальным алгоритмом МО из таблицы 1 является метод случайный лес. На его основе проведено тестирование на описанных клинических случаях двух пациентов. После обработки признаков первого пациента получен результат модели с вероятностью развития рецидива МЛУ ТОД – 86 %. На развитие повторного заболевания у данного пациента влияют следующие факторы: средний срок лечения (0,418), тип туберкулезного процесса (0,085), количество курсов ХТ и наличие инвалидности (совместный вклад) (0,121), прочие факторы (0,088 суммарно). По аналогии были проведены этапы работы классификатора по второму пациенту, у
которого вероятность–8%. Основными предикторами в пользу безрецидивного течения заболевания являются: количество курсов ХТ (–0,02), число ПТП в схеме лечения (–0,007), отсутствие остаточных изменений в легких (–0,011), прочие признаки (0,01 суммарно).
На основании параметров, характеризующих качество моделей, и, несмотря на хорошее качество модели регрессионного анализа традиционной статистики, методы МО обладают наилучшей прогностической способностью.
Данное исследование показало эффективность моделей МО, на основании которых получено свидетельство о государственной регистрации программы для ЭВМ для оценки риска развития рецидива у больных с МЛУ ТОД как полезный инструмент для принятия решений в клинической практике фтизиатров, направленный на снижение частоты рецидивов и заболеваемости ТБ с первичной МЛУ. Выявленные предикторы и модель программы помогут установить группу больных, нуждающихся в профилактических мероприятиях по предотвращению у них в будущем рецидива МЛУ ТБ.
ВЫВОДЫ
1. Частота возникновения рецидивов после успешного лечения больных туберкулезом органов дыхания с множественной лекарственной устойчивостью за 5последующих лет наблюдения равна 10,1%; в большинстве случаев (77,1%) туберкулез повторно возникает в течение первых трех лет наблюдения; средний срок наступления рецидива после эффективного курса химиотерапии больных туберкулезом органов дыхания с множественной лекарственной устойчивостью составляет 1,9 года.
2. Значимые медико-социальные факторы риска развития рецидивов у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью: инвалидность по соматическим заболеваниям (ОШ = 4,82; 95 % ДИ 2,13–10,90); пенсионный возраст (ОШ = 2,86; 95 % ДИ 1,14–7,20); повторное лечение (ОШ = 5,60; 95 % ДИ 2,59–12,11); ВИЧ-инфекция (ОШ = 19,19; 95 % ДИ 5,29–69,56); наличие психических заболеваний (ОШ = 5,85; 95 % ДИ 2,27–15,03); табакокурение (ОШ = 3,16; 95 % ДИ 1,08–9,20).
3. Рецидив туберкулеза органов дыхания с множественной лекарственной устойчивостью потенциально возможен у лиц с деструктивными формами заболевания (ОШ = 7,48; 95 % ДИ 1,76–31,80), повторно леченных с остаточными изменениями в легких (ОШ = 3,38; 95 % ДИ 1,64–6,98), имеющих бактериовыделение, определяемое при микроскопии (ОШ = 2,91; 95 % ДИ 1,28–6,61), с лекарственной устойчивостью возбудителя к шести и семи противотуберкулезным препаратам, с формированием в процессе лечения амплификации к следующим
препаратам: канамицин/амикацин (ОШ = 5,91; 95 % ДИ 2,85–12,26), капреомицин (ОШ = 5,27; 95 % ДИ 2,55–10,91), левофлоксацин (ОШ = 7,02; 95 % ДИ 3,36–14,66), этионамид/протионамид (ОШ = 4,30; 95 % ДИ 1,95–9,48), ПАСК (ОШ = 8,97; 95 % ДИ 4,08–19,73).
4. Прекращение бактериовыделения до 2 мес. (посев) (ОШ = 4,98; 95 % ДИ 2,41–10,29) и полноценность химиотерапии в фазе продолжения (ОШ = 0,07; 95 % ДИ 0,03–0,17) являются критериями отсутствия рецидива заболевания у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью.
5. Анализ характеристик моделей прогнозирования с помощью четырех алгоритмов машинного обучения, включающих дерево решений, случайный лес, XGBoost (градиентный бустинг) и логистическую регрессию, с использованием К-блочной стратифицированной проверки выявил высокую чувствительность (0,74 ± 0,167, 0,91 ± 0,17, 0,91 ± 0,14, 0,91 ± 0,16 соответственно) и специфичность (0,97 ± 0,03, 0,98 ± 0,02, 0,98 ± 0,02, 0,98 ± 0,02 соответственно).
6. С помощью алгоритмов дерево решений, случайный лес, XGBoost и логистическая регрессия установлены 5 основных предикторов развития рецидивов у успешно пролеченных больных туберкулезом органов дыхания с множественной лекарственной устойчивостью: неоднократные курсы лечения, давность заболевания, деструктивный туберкулез, общий срок лечения не достигает 22 мес. и в схеме химиотерапии присутствуют менее пяти противотуберкулезных препаратов.
7. Создана программа ЭВМ для оценки индивидуального риска развития рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью.
Актуальность избранной темы
В соответствии с данными ВОЗ туберкулез (ТБ) входит в десятку заболеваний, являющихся основными причинами смертности населения в мире. По оценкам ВОЗ в 2019 г. ТБ заболело 10 млн человек [100]. За последнее десятилетие Россия демонстрирует высокие темпы снижения заболеваемости и смертности от ТБ: число заболевших за период с 2000 по 2019 год снизилось более чем в 2 раза, а умерших от ТБ – более чем в 4 раза, что является результатом приоритетного отношения государства к данной проблеме. При этом наибольшей сложностью в противодействии ТБ в настоящее время является особенность возбудителя заболевания – его множественная лекарственная устойчивость (МЛУ), где микобактерии туберкулеза (МБТ) резистентны, как минимум, к основным противотуберкулезным препаратам (ПТП) – изониазиду и рифампицину. В мире в 2019 году у 465000 заболевших развился МЛУ туберкулез, еще у 100 000 была выявлена устойчивость к рифампицину. По данным информационного бюллетеня ВОЗ, в Европе каждый пятый случай впервые выявленного ТБ – это МЛУ ТБ, в РФ – каждый третий [6, 198]. Несмотря на всеобщий доступ к ПТП результаты лечения в РФ остаются неоптимальными. В настоящее время показатели эффективного лечения больных с МЛУ ТБ составляют только 57 % случаев в мире, в РФ – 55 % [198]. В то же время эффективное излечение МЛУ ТБ не гарантирует, что через некоторое время вновь не будут выявлены признаки активности туберкулезного процесса (рецидива заболевания). Рецидивом ТБ считается случай у пациента, когда зарегистрирован повторный эпизод заболевания ТБ после эффективного курса химиотерапии (ЭКХТ).
В последние годы результаты исследований показывают, что рецидивы туберкулеза органов дыхания с МЛУ возбудителя (МЛУ ТОД) после успешной химиотерапии (ХТ) нередки и зарегистрированные показатели повторного заболевания при сроке наблюдения до 8 лет варьируют от 2,5 % до 18 % [3, 6, 15, 153, 190]. Ведение пациентов с МЛУ ТБ, а тем более с рецидивом заболевания представляет собой сложную задачу для клинической медицины в связи с тем, что лечение больных с МЛУ возбудителя является длительным (минимум 20месяцев), осложняется потенциально тяжелыми побочными реакциями и является наиболее дорогостоящим, чем лечение лекарственно-чувствительного ТБ [17, 29]. Учитывая высокий уровень заболеваемости в РФ МЛУ ТБ и низкий уровень излечения, адекватность ведения больных с МЛУ ТБ требует всестороннего исследования, так как случаи рецидива МЛУ ТОД пополняют резервуар резистентной туберкулёзной инфекции, что, в свою очередь, поддерживает в стране высокий уровень инфицированности и первичной МЛУ МБТ. В связи с этим для клинициста крайне важно знать особенности, связанные с рецидивом МЛУ ТОД, и факторы, позволяющие прогнозировать, какие пациенты подвергаются наибольшему риску реактивации заболевания, чтобы
провести профилактические мероприятия.
Одновременный прогресс в области инфраструктуры информационных
технологий и роста мощностей компьютеров позволяет сегодня анализировать любые наборы биомедицинских данных для решения задач здравоохранения, используя современные методы анализа, такие как методы машинного обучения (МО) [8, 9, 24, 151]. Эти методы могут обнаруживать и идентифицировать внутренние закономерности и взаимосвязи из сложных и многочисленных наборов данных, в то же время они обладают эффективной прогнозирующей способностью и могут применяться для создания стандартных моделей принятия клинических решений [62, 115, 171].
Методы МО стали популярным инструментом для медицинских исследователей во всем мире, в том числе и в проблематике ТБ, особенно в прогнозировании и диагностике, а также в предсказании исходов заболевания [46, 66, 83, 94, 121, 138]. Учитывая вышеизложенное, а также важность персонализированной медицины, исследование, в котором используются методы МО в отношении выделения значимых факторов риска и прогнозирования развития рецидива МЛУ ТОД, является актуальным. Степень разработанности темы диссертации
В настоящее время в исследованиях определены основные факторы риска развития рецидива ТОД без учета спектра лекарственной устойчивости (ЛУ) МБТ к ПТП [17, 29, 32, 33]. Закономерно возникает вопрос о причинно-следственных связях, ведущих к повторному заболеванию людей, пролеченных по схемам ХТ МЛУ ТБ. Одни авторы отводят основную роль неполноценному первому этапу лечения, частым перерывам в ХТ, по мнению других специалистов, основная причина развития рецидива – наличие исключительно остаточных изменений в легких и наличие сопутствующей патологии. Выявленные особенности не позволяют сделать окончательное заключение об их вкладе в развитие повторного заболевания и не обозначают их абсолютной значимости. Факторы риска рецидива ТОД, особенно с МЛУ возбудителя, нуждаются в дальнейшем исследовании и количественной оценке информативности и прогностичности. Вопросам алгоритмов прогнозирования посвящено значительное число исследований во фтизиатрии в разных аспектах [46, 66, 83, 138]. До настоящего времени как отечественными, так и зарубежными авторами не были предложены математические модели, которые позволили бы создать автоматизированную систему оценки риска развития рецидива у больных МЛУ ТОД для применения во фтизиатрической практике. Вышеизложенное определило цель и задачи настоящего исследования.
Цель исследования
Выявить приоритетные факторы риска развития рецидива у эффективно излеченных больных туберкулезом органов дыхания с множественной лекарственной устойчивостью и разработать с помощью алгоритмов машинного обучения методику прогнозирования.
Задачи исследования
1. Установить частоту возникновения рецидива туберкулеза органов дыхания после успешного лечения больных с множественной лекарственной устойчивостью возбудителя. 2. Охарактеризовать больных, у которых после эффективно
завершенного лечения развился рецидив туберкулеза органов дыхания с множественной лекарственной устойчивостью, определить ведущие медицинские и немедицинские факторы риска повторного заболевания.
3. Оценить возможность применения алгоритмов машинного обучения в прогнозировании рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью.
4. Создать программу ЭВМ для оценки индивидуального риска развития рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью.
Научная новизна
В результате выполнения данного исследования были получены следующие результаты, характеризующиеся научной новизной:
1. Впервые выявлены основные социальные, клинико-рентгенологические и микробиологические факторы риска, влияющие на развитие рецидива у больных МЛУ ТОД после ЭКХТ в периоде 5-летнего наблюдения.
2. Впервые получены новые знания о частоте, сроках возникновения, характере и причинах развития рецидива ТОД у излеченных больных с МЛУ возбудителя, включающие как медико-социальные характеристики пациентов, так и индивидуальные особенности проводимого лечения, с анализом полноты схем ХТ на начало и на конец лечения, с оценкой влияния амплификации МБТ, сроков абациллирования и характера остаточных изменений в легких.
3. Впервые на основе методов МО предложена методология прогнозирования вероятности развития рецидива МЛУ ТОД: выделение значимых признаков (факторов риска), ранжирование их по вносимому вкладу, построение модели для прогнозирования риска развития рецидива заболевания.
4. Разработанное впервые методами МО программное обеспечение позволяет персонализировано оценить риск развития рецидива у эффективно излеченных больных МЛУ ТОД. Теоретическая и практическая значимость работы
В результате исследования выявлены и систематизированы социальные, клинико-микробиологические и рентгенологические факторы риска развития рецидива у больных МЛУ ТОД после ЭКХТ. Созданная с помощью методов МО прогностическая модель позволяет предположить возможность развития рецидива у пациентов МЛУ ТБ в начале противотуберкулезной терапии, что позволит совершенствовать организацию лечения с учетом индивидуальных особенностей больных. Способность прогнозировать риск развития рецидива заболевания в ходе лечения пациентов МЛУ ТБ предупреждает их развитие в будущем. Это ведет к рациональному использованию лекарственных средств, сохранению их клинической эффективности и, соответственно, сдерживанию распространения ТОД с множественной и широкой ЛУ возбудителя, что, в свою очередь, лежит в основе новой стратегии ВОЗ по ликвидации ТБ, направленной на своевременное выявление случаев заболевания среди групп высокого риска.
Методология и методы диссертационного исследования
Данное диссертационное исследование представляет собой научное решение в повышении эффективности прогнозирования развития рецидива заболевания у эффективно излеченных пациентов МЛУ ТОД. Объект исследования – больные с рецидивом МЛУТОД. Предмет исследования – значимые факторы риска, оказывающие влияние на развитие рецидива после ЭКХТ МЛУ ТБ. Научная идея исследования заключается в выявлении совокупности значимых факторов риска развития рецидива МЛУ ТОД, на основе которых с применением методов традиционной статистики и методов МО получена прогностическая модель. В научной работе использован комплексный подход с применением клинико-рентгенологических и лабораторных методов обследования, экспертной оценки медицинской документации, системного и статистического анализа, математического и компьютерного моделирования, оценки информативности. Справедливость гипотезы подтверждают результаты анализа социальных,
клинических, эпидемиологических, рентгенологических, микробиологических данных ретроспективной выборки 346пациентов МЛУ ТОД, из которой сформированы две группы. Первая (основная) – лица, у которых наступил рецидив заболевания после ЭКХТ (n=35), вторая (контрольная) – лица без рецидива заболевания (n = 311), срок наблюдения минимум 5 лет.
Обработка и статистический анализ полученных результатов проводили с использованием программного продукта IBM SPSS Statistics версия 23.0. Модели прогнозирования рецидива МЛУ ТОД с помощью алгоритмов МО включали в себя дерево решений, случайный лес, XGBoost (градиентный бустинг) и логистическую регрессию, с использованием К-блочной стратифицированной проверки. Использовали инструменты библиотеки scikit-learn Version 0.24.2 в интерактивной облачной среде работы с программным кодом Google Colaboratory.
Положения, выносимые на защиту
1. У каждого десятого излеченного пациента туберкулезом органов дыхания с множественной лекарственной устойчивостью развивается рецидив заболевания, в среднем через два года наблюдения.
2. Факторами риска у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью, определяющими значимое влияние на развитие рецидива заболевания, являются:
– социальные – пациенты пенсионного возраста, имеющие инвалидность по соматическому заболеванию, психические заболевания, табакокурение;
– медицинские – повторное лечение, неполноценность предыдущего курса химиотерапии, остаточные изменения в легких, деструктивные формы туберкулеза с наличием полостей распада в легочной ткани от 2,0см, бактериовыделение на начало химиотерапии, определяемое микроскопией, наличие у пациентов ВИЧ-инфекции;
– микробиологические – наличие лекарственной устойчивости возбудителя на конец лечения к шести и более лекарственным средствам, формирование амплификации микобактерии туберкулеза к противотуберкулезным препаратам и замедленные сроки прекращения
бактериовыделения на фоне химиотерапии.
3. Логит-регрессионная модель прогнозирования на основе
традиционного статистического анализа и прогностическая модель на основе методов машинного обучения позволяют совершенствовать лечебно- диагностический процесс, формируя тактику ведения больных туберкулезом органов дыхания с множественной лекарственной устойчивостью, с учетом имеющихся в каждом конкретном случае социальных, эпидемиологических и клинических особенностей заболевания.
4. Созданная автоматизированная система для оценки индивидуального риска развития рецидива туберкулеза органов дыхания с множественной лекарственной устойчивостью, построенная на основе классификаторов машинного обучения, позволяет обеспечить индивидуальный подход к определенному пациенту в рамках системы поддержки принятия решений в повседневной практике врача-фтизиатра.
Степень достоверности
Достоверность и обоснованность полученных результатов диссертационного исследования обеспечены применением современных методик сбора и обработки данных, корректным подбором объектов исследования, достаточным объемом выборочной совокупности, а также использованием для анализа апробированного математического аппарата с интерпретацией результатов исследования в рамках отечественного и мирового опыта.
Апробация работы
Основные результаты диссертационной работы были представлены в виде научных докладов и обсуждались на: 6-й ежегодной молодежной научной конференции с Международным участием, посвящённой Дню Российской науки (Новосибирск, 2018); 7-й ежегодной научной конференции «Современные тенденции развития фтизиатрии», посвящённой Дню Российской науки и 100- летию со дня рождения выдающегося Сибирского фтизиохирурга профессора Андрея Илларионовича Боровинского (Новосибирск, 2019); Юбилейной научно- практической конференции «Новые горизонты фтизиатрии», посвященной 75-летию образования ФГБУ «Новосибирский НИИ туберкулеза» Минздрава России (Новосибирск, 2019); 8-й ежегодной научной конференции «Фтизиатрия сегодня и завтра», посвящённой Дню Российской науки (Новосибирск, 2020); Всероссийской научно-практической конференции молодых ученых с международным участием, посвященной Всемирному Дню борьбы с туберкулезом «Современные инновационные технологии в эпидемиологии, диагностике и лечении туберкулеза взрослых и детей» (Москва, 2020); научно- практической конференции с Международным участием «Исследования и
инновации в современной фтизиатрии» (Новосибирск, 2021).
Диссертационное исследование апробировано на заседании проблемной
комиссии «Внутренние болезни (пульмонология, фтизиатрия, сочетанные формы патологий внутренних органов)» ФГБОУ ВО «Сибирский государственный медицинский университет» Минздрава России (Томск, 2021).
Диссертационная работа выполнена в соответствии с утвержденным направлением научно-исследовательской работы ФГБОУ ВО «Сибирский государственный медицинский университет» Минздрава России по теме: «Фундаментальные аспекты клинической физиологии дыхания. Важнейшие звенья патогенеза острых и хронических заболеваний легких и сочетанных форм патологии». Регистрационный номер АААА-А16-116021010210-5.
Внедрение результатов исследования
Результаты работы внедрены в лечебно-диагностический процесс ОГАУЗ «Томский фтизиопульмонологический медицинский центр», в учебный процесс кафедры фтизиатрии и пульмонологии и кафедры медицинской и биологической кибернетики ФГБОУ ВО «Сибирский государственный медицинский университет» Минздрава России. Публикации
По теме диссертации опубликовано 7 научных работ, в том числе 1 свидетельство о государственной регистрации программы для электронных вычеслительных машин и 4 статьи в научных журналах, включенных в перечень рецензируемых научных изданий, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук, из них 4 статьи в журнале, входящем в международную реферативную базу данных и систем цитирования (Scopus).
Объем и структура работы
Диссертация изложена на 190 страницах машинописного текста и состоит из введения, 3 глав, выводов, практических рекомендаций, списка сокращений и условных обозначений, списка литературы, списка иллюстративного материала и приложений. Список литературы представлен 210 источниками, из которых 158 в зарубежных изданиях. Полученные результаты проиллюстрированы с помощью 38 таблиц и 13 рисунков, в приложениях представлены важные этапы работы алгоритмов МО и часть зарегистрированной программы ЭВМ.
Личный вклад автора
Изучение проблематики и поиск литературных данных, получение исходных данных, анализ медицинской документации, планирование исследования, постановка гипотезы, цели и задач исследования, получение результатов исследования, разработка алгоритма и математических моделей, подтвержденных проверкой, обсуждение результатов исследования на научных конференциях, публикации результатов в рецензируемых научных изданиях и написание диссертации выполнены лично автором.
Помогаем с подготовкой сопроводительных документов
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!