Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров

Фарков, Михаил Александрович

СОДЕРЖАНИЕ ………………………………………………………………………………………………… 2
ВВЕДЕНИЕ ………………………………………………………………………………………………………. 4
1 Особенности реализации численных методов оптимизации на графических
процессорах для решения прикладных задач ……………………………………………………. 13
1.1 Виды молекулярного докинга …………………………………………………………………. 13
1.2 Оптимизируемая функция. Оценка энергии конформации ………………………. 17
1.3 Численные методы оптимизации …………………………………………………………….. 21
1.3.1 Генетический алгоритм в программе AutoDock …………………………………. 22
1.3.2 Итеративный локальный поиск в программе AutoDock Vina ……………… 23
1.3.3 Метод инкрементального наращивания в программе DOCK ………………. 24
1.3.4 Метод Монте-Карло в программе ROSETTALIGAND ……………………….. 25
1.3.5 Муравьиный алгоритм в программе PLANTS ……………………………………. 26
1.3.6 Метод дифференциальной эволюции ………………………………………………… 27
1.3.7 Метод роя частиц ……………………………………………………………………………… 27
1.4 Требования к численным методам оптимизации для реализации с
использованием графических процессоров …………………………………………………… 28
1.5 Выбор метода оптимизации для реализации на графических процессорах .. 32
1.6 Выводы по первой главе …………………………………………………………………………. 35
2 Алгоритм реализации метода дифференциальной эволюции с использованием
графических процессоров………………………………………………………………………………… 36
2.1 Существующие подходы к реализации метода дифференциальной эволюции
с использованием графических процессоров ………………………………………………… 36
2.2 Предлагаемая модель выполнения метода дифференциальной эволюции с
использованием графических процессоров …………………………………………………… 43
2.3 Организация основных структур данных для выполнения метода
дифференциальной эволюции ………………………………………………………………………. 46
2.4 Обобщѐнная схема алгоритма реализации метода дифференциальной
эволюции для одного вычислительного блока ………………………………………………. 48
2.5 Использование CUDA потоков для организации вычислений ………………….. 49
2.6 Выводы по второй главе …………………………………………………………………………. 51
3 Применение метода дифференциальной эволюции для выполнения
молекулярного докинга с использованием графических процессоров ………………. 53
3.1 Применение сеточного подхода в молекулярном докинге ……………………….. 53
3.2 Существующие реализации сеточного подхода ……………………………………….. 54
3.3 Алгоритм расчѐта силовых полей межмолекулярного взаимодействия с
помощью сеток на графических процессорах ……………………………………………….. 56
3.4 Алгоритм выполнения молекулярного лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 64
3.5 Особенности программной реализации лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 69
3.5.1 Организация основных структур данных …………………………………………… 69
3.5.2 Ограничения по используемым графическим процессорам ………………… 71
3.5.3 Использование массива графических процессоров …………………………….. 73
3.5.4 Управление вычислениями на одном графическом процессоре ………….. 74
3.5.5 Форматы файлов силового поля и обработка биомишени ………………….. 76
3.5.6 Трѐхмерная трансформация лиганда на графическом процессоре ………. 79
3.6 Выводы по третьей главе ………………………………………………………………………… 83
4 Анализ эффективности разработанных алгоритмов и программ …………………. 85
4.1 Тестирование алгоритма реализации метода дифференциальной эволюции 85
4.2 Тестирование алгоритма вычисления сеток силовых полей ……………………… 87
4.3 Тестирование алгоритма решения задачи молекулярного лиганд-белкового
докинга ………………………………………………………………………………………………………… 89
4.4 Выводы по четвѐртой главе …………………………………………………………………….. 93
ЗАКЛЮЧЕНИЕ ………………………………………………………………………………………………. 94
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ……………………………………………………………………….. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 100
Приложение А. Акты о внедрении …………………………………………………………………. 113

Актуальность исследования.Широкий спектр существующих прикладных
задач требует применения сложных вычислительных алгоритмов и методов,
предъявляющих высокие требования к вычислительным ресурсам. Для их
эффективной реализации используются высокопроизводительные
вычислительные системы, в том числе гетерогенные, включающие в себя
специализированные процессоры, например, графические. Перенос
существующих решений для центрального процессора на гетерогенные
вычислительные системы без изменений невозможен в силу значительных
различий в программно-аппаратной архитектуре. Поэтому актуальной является
задача подбора подходящих алгоритмов и их преобразования с учѐтом
особенностей информационных процессов, протекающийв
высокопроизводительных вычислительных системах, и специфики прикладной
задачи.
Одной из таких прикладных задач, имеющих важное народно-
хозяйственное значение, является выполнение молекулярного докинга, основная
область применения которого – разработка лекарственных препаратов. Разработка
и тестирование одного лекарственного препарата занимает несколько лет и
требует вложения в размере десятков миллионов долларов [1,2]. Весь процесс
разработки можно разделить на три основных этапа: подбор перспективных
соединений, т.е. испытания invitro; доклинические испытания соединений на
животных с целью оценки возможных побочных эффектов и общей
эффективности; завершающий этап – клинические испытания на человеке, т.е.
испытания invivo. Первый этап может занимать, по различным оценкам, до 3 лет.
Этап является ресурсоѐмким, так как требуется отобрать небольшое количество
перспективных химических соединений (кандидатов в лекарства) из набора,
состоящего из нескольких миллионов веществ, что требует существенных
финансовых затрат на реагенты для проведения химических реакций, а также
существенных временных затрат на проведение каждого теста. Именно на первом
этапе перспективным является использование компьютерных моделей (insilico),
что позволяет значительным образом снизить количество химических реакций
invitro с нескольких миллионов до нескольких десятков для наиболее
перспективных соединений, вследствие чего происходит снижение как
финансовых, так и временных затрат [5].
Исследования в области молекулярного докинга ведутся уже более 30 лет, и
разработано значительное количество разнообразных методов выполнения
моделирования, учитывающих различные комбинации аспектов молекулярного
взаимодействия и ориентированных на различные классы соединений [25, 26, 28,
29, 30, 35, 36, 39-41, 47-51]. Внедрение перспективных параллельных архитектур,

В рамках диссертации изучались методы и алгоритмы применения
численных методов оптимизации на графических процессорах для решения
прикладных задач и их применение для эффективного решения задачи
молекулярного лиганд-белкового докинга.
К основным результатам диссертационного исследования следует отнести:
1. Предложен алгоритм реализации метода дифференциальной эволюции с
использованием графических процессоров. Предлагаемая композиция этапов
дифференциальной эволюции обеспечивает распределение отдельных процедур
оптимизации по мультипроцессорам графического процесса, удовлетворяя
требованиям метода дифференциальной эволюции к размеру популяции, позволяя
тем самым увеличить нагрузку на графический процессор и использовать
встроенные средства синхронизации. Разработанный подход хорошо подходит
для решения задач, связанных с выполнением большого количества процедур
оптимизации.
2. Разработан алгоритм расчѐта силовых полей межмолекулярного
взаимодействия на основе вычисления сеток с использованием графических
процессоров. Предлагаемый метод выполнения позволяет эффективно
автоматически распределять вычисления различных типов сеток силовых полей
для больших баз химический соединений между доступными ресурсами
графических процессоров. Управление вычислениями организовано таким
образом, чтобы обеспечить максимальную загрузку графических процессоров и
скрыть задержки работы с дисковой памятью. Алгоритм демонстрирует
значительное ускорение вычислений по сравнению с аналогами.
3. Предложен алгоритмрешения задачи молекулярного докинга с
использованием графических процессоров. Разработанное решение
ориентировано на автоматическую обработку больших баз лигандов и позволяет
прозрачно для пользователя распределять нагрузку по всем доступным
графическим процессорам. Предлагаемый подход демонстрирует существенное
ускорение моделирования и требуемую точность вычислений при обработке
реальных химических соединений.
4. Создан комплекс программного обеспечения, реализующий
предложенные алгоритмы.Получены свидетельства о регистрации программ для
ЭВМ в Федеральном институте промышленной собственности №2013660687,
№2014619771.
Предложенные алгоритмы и программные решения создают научную
основу решения важных прикладных задач фармакологии и биоинформатики на
базе гетерогенных вычислительных систем, использующих графические
процессоры. Данные средства могут использоваться как самостоятельно, так и
применяться для реализации новых подходов к решению этих задач.
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

CUDA (ComputeUnifiedDeviceArchitecture): Программно-аппаратная массивно-
параллельная архитектура, используемая в графических процессорах компании
NVIDIA.
CUDA ядро: Арифметико-логическое устройство, входящее в состав
мультипроцессора графического процессора в большом количестве.
invitro: Эксперименты «в стекле», т.е. в пробирке.
invivo: Эксперименты в живом организме.
insilico: Компьютерное моделирование.
MPP (MassiveParallelProcessing): Архитектура параллельных вычислительных
систем, суперкомпьютеров Как правило, отличительной особенностью от
кластерных вычислительных систем является применение специфических
технологических решений при построении компонент системы.
sp2 гибридизация: Гибридизация одной s орбитали и двух p орбиталей. В
результате образуется три гибридных орбитали, расположенные в одной
плоскости с углом в 120°.
sp3 гибридизация: Гибридизация одной s орбитали и трѐх p орбиталей. В
результате образуется четыре гибридных орбитали, оси которых направлены к
вершинам правильного тетраэдра.
варп (warp): Группа нитейграфического процессора, которая выполняется
одновременно на одном мультипроцессоре.
аминогруппа: Функциональная группа атомов –NH2.
аминокислоты: Органические соединения, молекула которых состоит из
аминогруппы, карбоксильной группы и углеводородного радикала.
Подразделяются на: альфа-, бета-, гамма- и т.д. аминокислоты в зависимости
от места присоединения аминогруппы. В природе встречаются только альфа-
аминокислоты.
ангстрем: Единица измерения расстояния. 1 ангстрем равен 0,1 нм.
биомишень: Большое молекулярное соединение (как правило, белок),
насчитывающее несколько сотен атомов и являющееся целью получение
биологического отклика.
валентность: Свойство атомов химических элементов образовывать
химические связи.
вычислительное ядро: Программная единица, функция, исполняющаяся на
графическом процессоре.
геометрические изомеры: Изомеры, имеющие различное пространственное
расположение атомов в молекуле и не относящиеся к оптическим изомерам.
Подразделяются на цисизомеры и трансизомеры.
гетерогенная вычислительная система: Вычислительная система, в состав
которой входят вычислительные устройства различных архитектур.
гибридизация: Это взаимодействие различных по типу, но близких по энергии
атомных орбиталей с образованием гибридых орбиталей одинаковой формы и
энергии.
гидроксильная группа: Функциональная группа атомов –OH.
ингибитор: Вещество, замедляющее течение какой-либо химической реакции.
изомеры: Химические соединения, имеющие одинаковый качественный и
количественный состав, но разное строение и, как следствие, разные свойства.

карбоксильная группа: Функциональная группа атомов –COOH.
ковалентная связь: Химическая связь, образованная перекрытием пары
валентных электронных облаков.
конформация молекулы: Пространственное расположение атомов в молекуле
при вращении атомов или групп атомов вокруг простых связей при сохранении
неизменным порядка химических связей атомов.
конформер: Стереоизомер в ряде конформаций, соответствующий минимуму
потенциальной энергии.
лиганд: Небольшое молекулярное соединение (как правило, кандидат в
лекарственный препарат), насчитывающее несколько десятков атомов.
межмолекулярное взаимодействие: Взаимодействие молекул между собой,
которое не приводит к образованию новых или разрыву старых химических
связей.
молекулярный докинг: Это метод компьютерного моделирования
межмолекулярных взаимодействий.
молекулярная формула: Формула, отражающая качественный состав
соединения.
орбиталь: Пространство вокруг ядра атома, в котором заключено 90%
электронного облака.
пептидная связь: Это связь, образующаяся между остатком –NH–
аминогруппы одной молекулы аминокислоты и остатком –CO– карбоксильной

группы другой молекулы аминокислоты. .
программируемая логическая интегральная схема (ПЛИС): Интегральная
схема, логика работы не задана жѐстко в процессе производства и может
изменять программным образом.
ротамер: Частный случай конформера, являющийся результатом вращения
группы атомов вокруг одной химической связи.
сайт связывания (bindingsite): Область поверхности молекулы биомишени, к
которой происходит присоединения молекулы лиганда.
энергия связывания, свободная энергия связывания: Это величина,
показывающая изменение энергии в ходе химической реакции.
спин: Собственный магнитный момент электрона.
структурная формула: Формула, отражающая порядок соединения атомов в
молекуле.
ферменты, энзимы: Органические катализаторы химических реакций в живых
организмах.
функциональная группа: Группа атомов, которая определяет наиболее
характерные свойства вещества и его принадлежность к определѐнному классу
соединений (например, гидроксильная группа –OH определяет
принадлежность к алканолам).
шейдер: Программа для управления вычислениями на определѐнной стадии
обработки графической информации. Различают: вершинные, пиксельные и
геометрические шейдеры.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    user1250010 Омский государственный университет, 2010, преподаватель,...
    4 (15 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    21 Выполненная работа
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Олег Н. Томский политехнический университет 2000, Инженерно-эконо...
    4.7 (96 отзывов)
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Явл... Читать все
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Являюсь действующим преподавателем одного из ВУЗов.
    #Кандидатские #Магистерские
    177 Выполненных работ
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Ольга Р. доктор, профессор
    4.2 (13 отзывов)
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласован... Читать все
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласованные сроки и при необходимости дорабатываются по рекомендациям научного руководителя (преподавателя). Буду рада плодотворному и взаимовыгодному сотрудничеству!!! К каждой работе подхожу индивидуально! Всегда готова по любому вопросу договориться с заказчиком! Все работы проверяю на антиплагиат.ру по умолчанию, если в заказе не стоит иное и если это заранее не обговорено!!!
    #Кандидатские #Магистерские
    21 Выполненная работа
    Рима С.
    5 (18 отзывов)
    Берусь за решение юридических задач, за написание серьезных научных статей, магистерских диссертаций и дипломных работ. Окончила Кемеровский государственный универси... Читать все
    Берусь за решение юридических задач, за написание серьезных научных статей, магистерских диссертаций и дипломных работ. Окончила Кемеровский государственный университет, являюсь бакалавром, магистром юриспруденции (с отличием)
    #Кандидатские #Магистерские
    38 Выполненных работ
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы

    Другие учебные работы по предмету

    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»