Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров

Фарков, Михаил Александрович

СОДЕРЖАНИЕ ………………………………………………………………………………………………… 2
ВВЕДЕНИЕ ………………………………………………………………………………………………………. 4
1 Особенности реализации численных методов оптимизации на графических
процессорах для решения прикладных задач ……………………………………………………. 13
1.1 Виды молекулярного докинга …………………………………………………………………. 13
1.2 Оптимизируемая функция. Оценка энергии конформации ………………………. 17
1.3 Численные методы оптимизации …………………………………………………………….. 21
1.3.1 Генетический алгоритм в программе AutoDock …………………………………. 22
1.3.2 Итеративный локальный поиск в программе AutoDock Vina ……………… 23
1.3.3 Метод инкрементального наращивания в программе DOCK ………………. 24
1.3.4 Метод Монте-Карло в программе ROSETTALIGAND ……………………….. 25
1.3.5 Муравьиный алгоритм в программе PLANTS ……………………………………. 26
1.3.6 Метод дифференциальной эволюции ………………………………………………… 27
1.3.7 Метод роя частиц ……………………………………………………………………………… 27
1.4 Требования к численным методам оптимизации для реализации с
использованием графических процессоров …………………………………………………… 28
1.5 Выбор метода оптимизации для реализации на графических процессорах .. 32
1.6 Выводы по первой главе …………………………………………………………………………. 35
2 Алгоритм реализации метода дифференциальной эволюции с использованием
графических процессоров………………………………………………………………………………… 36
2.1 Существующие подходы к реализации метода дифференциальной эволюции
с использованием графических процессоров ………………………………………………… 36
2.2 Предлагаемая модель выполнения метода дифференциальной эволюции с
использованием графических процессоров …………………………………………………… 43
2.3 Организация основных структур данных для выполнения метода
дифференциальной эволюции ………………………………………………………………………. 46
2.4 Обобщѐнная схема алгоритма реализации метода дифференциальной
эволюции для одного вычислительного блока ………………………………………………. 48
2.5 Использование CUDA потоков для организации вычислений ………………….. 49
2.6 Выводы по второй главе …………………………………………………………………………. 51
3 Применение метода дифференциальной эволюции для выполнения
молекулярного докинга с использованием графических процессоров ………………. 53
3.1 Применение сеточного подхода в молекулярном докинге ……………………….. 53
3.2 Существующие реализации сеточного подхода ……………………………………….. 54
3.3 Алгоритм расчѐта силовых полей межмолекулярного взаимодействия с
помощью сеток на графических процессорах ……………………………………………….. 56
3.4 Алгоритм выполнения молекулярного лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 64
3.5 Особенности программной реализации лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 69
3.5.1 Организация основных структур данных …………………………………………… 69
3.5.2 Ограничения по используемым графическим процессорам ………………… 71
3.5.3 Использование массива графических процессоров …………………………….. 73
3.5.4 Управление вычислениями на одном графическом процессоре ………….. 74
3.5.5 Форматы файлов силового поля и обработка биомишени ………………….. 76
3.5.6 Трѐхмерная трансформация лиганда на графическом процессоре ………. 79
3.6 Выводы по третьей главе ………………………………………………………………………… 83
4 Анализ эффективности разработанных алгоритмов и программ …………………. 85
4.1 Тестирование алгоритма реализации метода дифференциальной эволюции 85
4.2 Тестирование алгоритма вычисления сеток силовых полей ……………………… 87
4.3 Тестирование алгоритма решения задачи молекулярного лиганд-белкового
докинга ………………………………………………………………………………………………………… 89
4.4 Выводы по четвѐртой главе …………………………………………………………………….. 93
ЗАКЛЮЧЕНИЕ ………………………………………………………………………………………………. 94
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ……………………………………………………………………….. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 100
Приложение А. Акты о внедрении …………………………………………………………………. 113

Актуальность исследования.Широкий спектр существующих прикладных
задач требует применения сложных вычислительных алгоритмов и методов,
предъявляющих высокие требования к вычислительным ресурсам. Для их
эффективной реализации используются высокопроизводительные
вычислительные системы, в том числе гетерогенные, включающие в себя
специализированные процессоры, например, графические. Перенос
существующих решений для центрального процессора на гетерогенные
вычислительные системы без изменений невозможен в силу значительных
различий в программно-аппаратной архитектуре. Поэтому актуальной является
задача подбора подходящих алгоритмов и их преобразования с учѐтом
особенностей информационных процессов, протекающийв
высокопроизводительных вычислительных системах, и специфики прикладной
задачи.
Одной из таких прикладных задач, имеющих важное народно-
хозяйственное значение, является выполнение молекулярного докинга, основная
область применения которого – разработка лекарственных препаратов. Разработка
и тестирование одного лекарственного препарата занимает несколько лет и
требует вложения в размере десятков миллионов долларов [1,2]. Весь процесс
разработки можно разделить на три основных этапа: подбор перспективных
соединений, т.е. испытания invitro; доклинические испытания соединений на
животных с целью оценки возможных побочных эффектов и общей
эффективности; завершающий этап – клинические испытания на человеке, т.е.
испытания invivo. Первый этап может занимать, по различным оценкам, до 3 лет.
Этап является ресурсоѐмким, так как требуется отобрать небольшое количество
перспективных химических соединений (кандидатов в лекарства) из набора,
состоящего из нескольких миллионов веществ, что требует существенных
финансовых затрат на реагенты для проведения химических реакций, а также
существенных временных затрат на проведение каждого теста. Именно на первом
этапе перспективным является использование компьютерных моделей (insilico),
что позволяет значительным образом снизить количество химических реакций
invitro с нескольких миллионов до нескольких десятков для наиболее
перспективных соединений, вследствие чего происходит снижение как
финансовых, так и временных затрат [5].
Исследования в области молекулярного докинга ведутся уже более 30 лет, и
разработано значительное количество разнообразных методов выполнения
моделирования, учитывающих различные комбинации аспектов молекулярного
взаимодействия и ориентированных на различные классы соединений [25, 26, 28,
29, 30, 35, 36, 39-41, 47-51]. Внедрение перспективных параллельных архитектур,

В рамках диссертации изучались методы и алгоритмы применения
численных методов оптимизации на графических процессорах для решения
прикладных задач и их применение для эффективного решения задачи
молекулярного лиганд-белкового докинга.
К основным результатам диссертационного исследования следует отнести:
1. Предложен алгоритм реализации метода дифференциальной эволюции с
использованием графических процессоров. Предлагаемая композиция этапов
дифференциальной эволюции обеспечивает распределение отдельных процедур
оптимизации по мультипроцессорам графического процесса, удовлетворяя
требованиям метода дифференциальной эволюции к размеру популяции, позволяя
тем самым увеличить нагрузку на графический процессор и использовать
встроенные средства синхронизации. Разработанный подход хорошо подходит
для решения задач, связанных с выполнением большого количества процедур
оптимизации.
2. Разработан алгоритм расчѐта силовых полей межмолекулярного
взаимодействия на основе вычисления сеток с использованием графических
процессоров. Предлагаемый метод выполнения позволяет эффективно
автоматически распределять вычисления различных типов сеток силовых полей
для больших баз химический соединений между доступными ресурсами
графических процессоров. Управление вычислениями организовано таким
образом, чтобы обеспечить максимальную загрузку графических процессоров и
скрыть задержки работы с дисковой памятью. Алгоритм демонстрирует
значительное ускорение вычислений по сравнению с аналогами.
3. Предложен алгоритмрешения задачи молекулярного докинга с
использованием графических процессоров. Разработанное решение
ориентировано на автоматическую обработку больших баз лигандов и позволяет
прозрачно для пользователя распределять нагрузку по всем доступным
графическим процессорам. Предлагаемый подход демонстрирует существенное
ускорение моделирования и требуемую точность вычислений при обработке
реальных химических соединений.
4. Создан комплекс программного обеспечения, реализующий
предложенные алгоритмы.Получены свидетельства о регистрации программ для
ЭВМ в Федеральном институте промышленной собственности №2013660687,
№2014619771.
Предложенные алгоритмы и программные решения создают научную
основу решения важных прикладных задач фармакологии и биоинформатики на
базе гетерогенных вычислительных систем, использующих графические
процессоры. Данные средства могут использоваться как самостоятельно, так и
применяться для реализации новых подходов к решению этих задач.
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

CUDA (ComputeUnifiedDeviceArchitecture): Программно-аппаратная массивно-
параллельная архитектура, используемая в графических процессорах компании
NVIDIA.
CUDA ядро: Арифметико-логическое устройство, входящее в состав
мультипроцессора графического процессора в большом количестве.
invitro: Эксперименты «в стекле», т.е. в пробирке.
invivo: Эксперименты в живом организме.
insilico: Компьютерное моделирование.
MPP (MassiveParallelProcessing): Архитектура параллельных вычислительных
систем, суперкомпьютеров Как правило, отличительной особенностью от
кластерных вычислительных систем является применение специфических
технологических решений при построении компонент системы.
sp2 гибридизация: Гибридизация одной s орбитали и двух p орбиталей. В
результате образуется три гибридных орбитали, расположенные в одной
плоскости с углом в 120°.
sp3 гибридизация: Гибридизация одной s орбитали и трѐх p орбиталей. В
результате образуется четыре гибридных орбитали, оси которых направлены к
вершинам правильного тетраэдра.
варп (warp): Группа нитейграфического процессора, которая выполняется
одновременно на одном мультипроцессоре.
аминогруппа: Функциональная группа атомов –NH2.
аминокислоты: Органические соединения, молекула которых состоит из
аминогруппы, карбоксильной группы и углеводородного радикала.
Подразделяются на: альфа-, бета-, гамма- и т.д. аминокислоты в зависимости
от места присоединения аминогруппы. В природе встречаются только альфа-
аминокислоты.
ангстрем: Единица измерения расстояния. 1 ангстрем равен 0,1 нм.
биомишень: Большое молекулярное соединение (как правило, белок),
насчитывающее несколько сотен атомов и являющееся целью получение
биологического отклика.
валентность: Свойство атомов химических элементов образовывать
химические связи.
вычислительное ядро: Программная единица, функция, исполняющаяся на
графическом процессоре.
геометрические изомеры: Изомеры, имеющие различное пространственное
расположение атомов в молекуле и не относящиеся к оптическим изомерам.
Подразделяются на цисизомеры и трансизомеры.
гетерогенная вычислительная система: Вычислительная система, в состав
которой входят вычислительные устройства различных архитектур.
гибридизация: Это взаимодействие различных по типу, но близких по энергии
атомных орбиталей с образованием гибридых орбиталей одинаковой формы и
энергии.
гидроксильная группа: Функциональная группа атомов –OH.
ингибитор: Вещество, замедляющее течение какой-либо химической реакции.
изомеры: Химические соединения, имеющие одинаковый качественный и
количественный состав, но разное строение и, как следствие, разные свойства.

карбоксильная группа: Функциональная группа атомов –COOH.
ковалентная связь: Химическая связь, образованная перекрытием пары
валентных электронных облаков.
конформация молекулы: Пространственное расположение атомов в молекуле
при вращении атомов или групп атомов вокруг простых связей при сохранении
неизменным порядка химических связей атомов.
конформер: Стереоизомер в ряде конформаций, соответствующий минимуму
потенциальной энергии.
лиганд: Небольшое молекулярное соединение (как правило, кандидат в
лекарственный препарат), насчитывающее несколько десятков атомов.
межмолекулярное взаимодействие: Взаимодействие молекул между собой,
которое не приводит к образованию новых или разрыву старых химических
связей.
молекулярный докинг: Это метод компьютерного моделирования
межмолекулярных взаимодействий.
молекулярная формула: Формула, отражающая качественный состав
соединения.
орбиталь: Пространство вокруг ядра атома, в котором заключено 90%
электронного облака.
пептидная связь: Это связь, образующаяся между остатком –NH–
аминогруппы одной молекулы аминокислоты и остатком –CO– карбоксильной

группы другой молекулы аминокислоты. .
программируемая логическая интегральная схема (ПЛИС): Интегральная
схема, логика работы не задана жѐстко в процессе производства и может
изменять программным образом.
ротамер: Частный случай конформера, являющийся результатом вращения
группы атомов вокруг одной химической связи.
сайт связывания (bindingsite): Область поверхности молекулы биомишени, к
которой происходит присоединения молекулы лиганда.
энергия связывания, свободная энергия связывания: Это величина,
показывающая изменение энергии в ходе химической реакции.
спин: Собственный магнитный момент электрона.
структурная формула: Формула, отражающая порядок соединения атомов в
молекуле.
ферменты, энзимы: Органические катализаторы химических реакций в живых
организмах.
функциональная группа: Группа атомов, которая определяет наиболее
характерные свойства вещества и его принадлежность к определѐнному классу
соединений (например, гидроксильная группа –OH определяет
принадлежность к алканолам).
шейдер: Программа для управления вычислениями на определѐнной стадии
обработки графической информации. Различают: вершинные, пиксельные и
геометрические шейдеры.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Дмитрий М. БГАТУ 2001, электрификации, выпускник
    4.8 (17 отзывов)
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал стать... Читать все
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал статьи, патенты, кандидатскую диссертацию, преподавал. Занимаюсь этим с 2003.
    #Кандидатские #Магистерские
    19 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ

    Последние выполненные заказы

    Другие учебные работы по предмету

    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»