Математическое моделирование антигенного сходства штаммов вируса гриппа с помощью вейвлет-преобразования : диссертация на соискание ученой степени кандидата физико-математических наук : 05.13.18

📅 2018 год
Форгани, М.
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Основные обозначения и соглашения 4

Введение 8

1 Модель 41
1.1 Математическая постановка задачи . . . . . . . . . . . . . . 41
1.2 Линейная модель антигенного сходства . . . . . . . . . . . . 46
1.3 Вывод по главе . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2 Численные методы и оптимизация 50
2.1 Численное отображение белка . . . . . . . . . . . . . . . . . 51
2.2 Численное представление мутации . . . . . . . . . . . . . . . 55
2.2.1 Гибридные признаки: комбинирование методов Ву и
Яня с глобальными дескрипторами . . . . . . . . . . 56
2.2.2 Преобразования вейвлет и вейвлет-пакет . . . . . . . 59
2.2.3 Сортировки последовательностей белка с помощью ПВП 64
2.3 Метод декомпозиции вейвлет-частиц . . . . . . . . . . . . . . 68
2.4 Первый вычислительный эксперимент: Изучение изменения
аминокислоты в одной позиции с применением ДВЧ . . . . . 77
2.5 Трудоемкость алгоритма ДВЧ . . . . . . . . . . . . . . . . . 79
2.6 Второй вычислительный эксперимент: Оптимальная комби-
нация эвристического алгоритма с методом ДВЧ . . . . . . . 81
2.7 Третий вычислительный эксперимент: Демонстрация значи-
мости порядка соседей по отношению к ДВЧ . . . . . . . . . 86
2.8 Формулировка метода декомпозиции вейвлет-частиц . . . . . 88
2.9 Формула частицы . . . . . . . . . . . . . . . . . . . . . . . . 99
2.10 Преобразования декомпозиции вейвлет-частиц . . . . . . . . 105
2.11 Итерационный процесс поиска наилучшей частицы . . . . . 110
2.12 Альтернативный метод вычисления декомпозиции частиц . . 112
2.13 Четвертый вычислительный эксперимент: Итерационная де-
композиция частиц . . . . . . . . . . . . . . . . . . . . . . . . 114
2.14 Выводы по главе . . . . . . . . . . . . . . . . . . . . . . . . . 123

3 Программная реализация 125
3.1 Кластеризация последовательности белка . . . . . . . . . . . 126
3.2 Трехмерное дерево эволюции . . . . . . . . . . . . . . . . . . 127
3.3 Программный комплекс МАГВ и его реализация . . . . . . 131
3.4 Выводы по главе . . . . . . . . . . . . . . . . . . . . . . . . . 139

Заключение 142
Краткое описание цели, задач и подходов работы . . . . . . . . . 142
Основные результаты . . . . . . . . . . . . . . . . . . . . . . . . . 144
Перспективы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

Приложение A 146
Вирусы гриппа и их воздействие . . . . . . . . . . . . . . . . . . . 147
Антигенная изменчивость и антигенный дрейф . . . . . . . . . . 148
Белок гемагглютинин и его структура . . . . . . . . . . . . . . . . 150
Вакцинация и антигенная картография . . . . . . . . . . . . . . . 152

Приложение B 158

Литература 160
Основные обозначения и соглашения

AAindex — Amino Acid Index Database (база данных аминокислотных
индексов и матриц мутаций аминокислот).
ACC — Absolute value of correlation coefficient (абсолютная величи-
на коэффициента корреляции).
BLAST — Basic Local Alignment Search Tool (средство поиска основ-
ного локального выравнивания).
HA — Hemagglutinin (гемагглютинин), поверхностный белок ви-
руса гриппа, обеспечивающий способность вируса присо-
единяться к клетке хозяина.
NA — Neuraminidase (нейраминидаза), поверхностный белок ви-
руса гриппа, обеспечивающий способность вируса освобо-
диться от клетки хозяина.
АВКК — Абсолютная величина коэффициента корреляции (absolute
value of correlation coefficient).
АИГ — Анализ ингибирования гемагглютинации (hemagglutination
inhibition assay) – стандартный метод серологического
определения инфекции гриппа и оценки сходства между
разными штамами вируса гриппа.
АЧО — Алфавитно-численное отображение (alphabetical-to-
numerical mapping).
ВИ — Метод взаимной информации (the mutual information), ко-
торый способен измерить взаимную зависимость между
двумя переменными.
ВОЗ — Всемирная организация здравоохранения (World Health
Organization).
ВПП — Время поиска признака (feature search time).
ВП — Вейвлет-преобразование (wavelet transform).
ГДА — График динамики аллели (allele dynamics plot) – метод, ко-
торый визуализирует эволюционную динамику различных
аллелей гена в популяции с течением времени и указывает
на аллели, которые, скорее всего, будут подвергнуты на-
правленному отбору.
ГСЭГО — Глобальная система эпиднадзора за гриппом и принятия
ответных мер (the global influenza surveillance system) – это
уникальная всемирная сеть, способная быстро выявлять и
реагировать на вспышки гриппа, в том числе с пандемиче-
ским потенциалом.
ДНК — Дезоксирибонуклеиновая кислота (deoxyribonucleic acid) –
это макромолекула (одна из трёх основных, две другие –
РНК и белки), обеспечивающая хранение, передачу из по-
коления в поколение и реализацию генетической програм-
мы развития и функционирования живых организмов.
ДВЧ — Метод декомпозиции вейвлет-частиц (decomposition of
wavelet-particles).
ИС — Метод информационного спектра (the informational
spectrum) – метод виртуальной спектроскопии для
структурно-функционального анализа белков в идентифи-
кации функциональных белковых доменов.
КИС — Метод консенсусного информационного спектра (consensus
informational spectrum), используемого как часть ана-
лиза частотной области кросс-корреляции или кросс-
ковариации между двумя временными рядами.
КМА — Кратномасштабный анализ (multiresolution analysis), ин-
струмент построения базисов вейвлета.
КМШ — Классическое многомерное шкалирование (classical
multidimensional scaling) – это метод анализа и ви-
зуализации данных с помощью расположения точек,
соответствующих изучаемым (шкалируемым) объектам,
в пространстве меньшей размерности, чем пространство
признаков объектов.
МАГВ — Модель антигенности вируса гриппа (model of influenza
virus antigenicity).
МГК — Метод главных компонент (principal component analysis),
один из основных способов уменьшить размерность дан-
ных, потеряв наименьшее количество информации.
МШ — Многомерное шкалирование (multidimensional scaling) – ме-
тод анализа и визуализации данных с помощью расположе-
ния точек, соответствующих изучаемым (шкалируемым)
объектам, в пространстве меньшей размерности, чем про-
странство признаков объектов.
ОДВЧ — Оператор декомпозиции вейвлет-частиц (wavelet-particles’
decomposition operator).
ОКК — Оптимальное количество кластеров (optimal number of
clusters).
ПВП — Преобразование вейвлет-пакета (wavelet packet transform).
ПВПГ — Потенциальные вирусы пандемического гриппа (potential
pandemic influenza viruses).
ПИ — Прирост информации (the information gain) – метод, поз-
воляющий измерить, насколько информация дает характе-
ристику класса.
ПО — Программное обеспечение (software).
ПУ — Процент улучшения (improvement percentage).
РМР — Резонансная модель распознавания (the resonant
recognition model), является физико-математической
моделью, которая может анализировать взаимодействие
белка и его мишени с использованием методов обработки
сигналов.
РНК — Рибонуклеиновая кислота (ribonucleic acid) – одна из трёх
основных макромолекул (две другие – ДНК и белки), кото-
рая содержится в клетках всех живых организмов и играет
важную роль в кодировании, прочтении, регуляции и вы-
ражении генов.
СММ — Скрытая марковская модель (hidden Markov model) – ста-
тистическая модель, имитирующая работу процесса, похо-
жего на марковский процесс с неизвестными параметрами,
задачей ставится выявленние неизвестных параметров на
основе наблюдаемых.
ФСР — Функция степени расхождения (function of disagreement
degree) – это показатель несоответствия информации.
L2 (R) — Пространство квадратично интегрируемых функций на
числовой прямой со скалярным произведением (space of
square-integrable functions).

Краткое описание цели, решения и результатов иссле-
дования

Выяснение отношения между фенотипом и последовательностями белков
лежит в основе многих генетических исследований, а моделирование фено-
типа на основе этих данных является крайне важной задачей в генетике.
Один из примеров таких задач – это моделирование и прогнозирование
эволюции вируса, особенно по отношению к избеганию иммунного ответа.
Вирус гриппа каждый год наносит огромный ущерб мировой экономике и
влияет на жизнь и здоровье большого количества людей. Субтип гриппа
H1N1 является самым распространенным, поэтому именно он был выбран
для исследования.
Вирус состоит из макромолекул–белков, состоящих из блоков – амино-
кислот. В процессе эволюции вирус избегает иммунного ответа путем за-
мены аминокислот. Эта замена как явление имеет локальное влияние на
регион ее возникновения в белке.
То, что выгодно отличает данную работу от других исследований ма-
тематического моделирования эволюции – это рассмотрение и извлечение
локального влияния замены аминокислоты в разных масштабах путем при-
менения созданного автором метода под названием декомпозиция вейвлет-
частиц.
Белок можно рассматривать как алфавитную последовательность, со-
стоящую из 20 букв, каждая из которых представляет собой конкретную
аминокислоту. Используя физико-химические характеристики аминокис-
лот, каждую букву в последовательности можно заменить на число, отоб-
ражающее ее характеристику. В результате из алфавитной последователь-
ности производится численный одномерный сигнал, к которому можно при-
менить методы обработки сигналов.
Метод декомпозиции вейвлет-частиц основан на теории вейвлет-
преобразования. В итоге применения этого метода к одномерному сигналу,
значение точки сигнала декомпозируется на разных уровнях на мелкие зна-
чения под названием частицы. Каждая частица – это линейная комбинация
точек, находящихся в окрестности целевой точки, которая декомпозиру-
ется из исходного сигнала. Коэффициенты этой комбинации определяют
взаимное влияние комбинируемых аминокислот.
Первый шаг к производству эффективной вакцины против гриппа со-
стоит в измерении сходства между штаммами вируса. Обычно для это-
го применяется долгосрочная лабораторная процедура, основанная на хи-
мической реакции между антителами и вирусом. Во многих исследовани-
ях по моделированию эволюции вируса используются последовательности
белка гемагглютинина (HA от латинского Hemagglutinin), который игра-
ет основную роль в данной лабораторной процедуре. Другими словами,
задача определяется таким образом, что на вход модели подаются две по-
следовательности белка гемагглютинина анализируемых штаммов вируса;
цель состоит в оценке (предсказании) значения их сходства, подтвержда-
емого результатами лабораторных анализов. Чтобы измерить расстояние
между аминокислотами, находящимся в конкретной позиции в анализи-
руемых штаммах, используя метод декомпозиции вейвлет-частиц, произ-
водится множество линейных комбинаций и выбирается та, которая дает
большую корреляцию с результатами лабораторных наблюдений.
Секвенирование, т.е. получение последовательности белка, не настоль-
ко трудоемкий процесс, как лабораторная процедура измерения сходства
между штаммами вируса. Поэтому математическая модель, основанная на
последовательности белка, позволит сохранить время и ресурсы, действо-
вать более оперативно в борьбе с вирусом.
В работе увеличивается точность моделирования с помощью двух фак-
торов. Первый фактор – это рассмотрение аминокислоты как многомерного
объекта, где каждая ее физико-химическая характеристика отображается
в численной форме отдельной координаты. Второй фактор – это рассмот-
рение мутации как локального явления, а не как точечной замены амино-
кислоты. Предполагается, что учет этих факторов при построении модели
позволит уменьшить ошибку моделирования.
Описания генетических понятий, таких как белок гемагглютинина, ана-
лиз ингибирования гемагглютинации, антиген и антигенные участки даны
в приложении А, где предоставлен обзор сведений о вирусе гриппа, его
воздействии, молекулярных характеристиках, способах изменения, вакци-
нации и ее эффективности.
Далее во введении будут рассмотрены:

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Елена Л. РЭУ им. Г. В. Плеханова 2009, Управления и коммерции, пре...
    4.8 (211 отзывов)
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно исполь... Читать все
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно использую в работе графический материал (графики рисунки, диаграммы) и таблицы.
    #Кандидатские #Магистерские
    362 Выполненных работы
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    user1250010 Омский государственный университет, 2010, преподаватель,...
    4 (15 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    21 Выполненная работа
    Дарья С. Томский государственный университет 2010, Юридический, в...
    4.8 (13 отзывов)
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.
    #Кандидатские #Магистерские
    18 Выполненных работ
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ

    Другие учебные работы по предмету

    Модели и алгоритмы параллельной обработки гидроакустической информации линейных антенных решёток
    📅 2022год
    🏢 ФГАОУ ВО «Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина)»
    Математическое моделирование равновесных форм капиллярных поверхностей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»