Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров

Фарков, Михаил Александрович

СОДЕРЖАНИЕ ………………………………………………………………………………………………… 2
ВВЕДЕНИЕ ………………………………………………………………………………………………………. 4
1 Особенности реализации численных методов оптимизации на графических
процессорах для решения прикладных задач ……………………………………………………. 13
1.1 Виды молекулярного докинга …………………………………………………………………. 13
1.2 Оптимизируемая функция. Оценка энергии конформации ………………………. 17
1.3 Численные методы оптимизации …………………………………………………………….. 21
1.3.1 Генетический алгоритм в программе AutoDock …………………………………. 22
1.3.2 Итеративный локальный поиск в программе AutoDock Vina ……………… 23
1.3.3 Метод инкрементального наращивания в программе DOCK ………………. 24
1.3.4 Метод Монте-Карло в программе ROSETTALIGAND ……………………….. 25
1.3.5 Муравьиный алгоритм в программе PLANTS ……………………………………. 26
1.3.6 Метод дифференциальной эволюции ………………………………………………… 27
1.3.7 Метод роя частиц ……………………………………………………………………………… 27
1.4 Требования к численным методам оптимизации для реализации с
использованием графических процессоров …………………………………………………… 28
1.5 Выбор метода оптимизации для реализации на графических процессорах .. 32
1.6 Выводы по первой главе …………………………………………………………………………. 35
2 Алгоритм реализации метода дифференциальной эволюции с использованием
графических процессоров………………………………………………………………………………… 36
2.1 Существующие подходы к реализации метода дифференциальной эволюции
с использованием графических процессоров ………………………………………………… 36
2.2 Предлагаемая модель выполнения метода дифференциальной эволюции с
использованием графических процессоров …………………………………………………… 43
2.3 Организация основных структур данных для выполнения метода
дифференциальной эволюции ………………………………………………………………………. 46
2.4 Обобщѐнная схема алгоритма реализации метода дифференциальной
эволюции для одного вычислительного блока ………………………………………………. 48
2.5 Использование CUDA потоков для организации вычислений ………………….. 49
2.6 Выводы по второй главе …………………………………………………………………………. 51
3 Применение метода дифференциальной эволюции для выполнения
молекулярного докинга с использованием графических процессоров ………………. 53
3.1 Применение сеточного подхода в молекулярном докинге ……………………….. 53
3.2 Существующие реализации сеточного подхода ……………………………………….. 54
3.3 Алгоритм расчѐта силовых полей межмолекулярного взаимодействия с
помощью сеток на графических процессорах ……………………………………………….. 56
3.4 Алгоритм выполнения молекулярного лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 64
3.5 Особенности программной реализации лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 69
3.5.1 Организация основных структур данных …………………………………………… 69
3.5.2 Ограничения по используемым графическим процессорам ………………… 71
3.5.3 Использование массива графических процессоров …………………………….. 73
3.5.4 Управление вычислениями на одном графическом процессоре ………….. 74
3.5.5 Форматы файлов силового поля и обработка биомишени ………………….. 76
3.5.6 Трѐхмерная трансформация лиганда на графическом процессоре ………. 79
3.6 Выводы по третьей главе ………………………………………………………………………… 83
4 Анализ эффективности разработанных алгоритмов и программ …………………. 85
4.1 Тестирование алгоритма реализации метода дифференциальной эволюции 85
4.2 Тестирование алгоритма вычисления сеток силовых полей ……………………… 87
4.3 Тестирование алгоритма решения задачи молекулярного лиганд-белкового
докинга ………………………………………………………………………………………………………… 89
4.4 Выводы по четвѐртой главе …………………………………………………………………….. 93
ЗАКЛЮЧЕНИЕ ………………………………………………………………………………………………. 94
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ……………………………………………………………………….. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 100
Приложение А. Акты о внедрении …………………………………………………………………. 113

Актуальность исследования.Широкий спектр существующих прикладных
задач требует применения сложных вычислительных алгоритмов и методов,
предъявляющих высокие требования к вычислительным ресурсам. Для их
эффективной реализации используются высокопроизводительные
вычислительные системы, в том числе гетерогенные, включающие в себя
специализированные процессоры, например, графические. Перенос
существующих решений для центрального процессора на гетерогенные
вычислительные системы без изменений невозможен в силу значительных
различий в программно-аппаратной архитектуре. Поэтому актуальной является
задача подбора подходящих алгоритмов и их преобразования с учѐтом
особенностей информационных процессов, протекающийв
высокопроизводительных вычислительных системах, и специфики прикладной
задачи.
Одной из таких прикладных задач, имеющих важное народно-
хозяйственное значение, является выполнение молекулярного докинга, основная
область применения которого – разработка лекарственных препаратов. Разработка
и тестирование одного лекарственного препарата занимает несколько лет и
требует вложения в размере десятков миллионов долларов [1,2]. Весь процесс
разработки можно разделить на три основных этапа: подбор перспективных
соединений, т.е. испытания invitro; доклинические испытания соединений на
животных с целью оценки возможных побочных эффектов и общей
эффективности; завершающий этап – клинические испытания на человеке, т.е.
испытания invivo. Первый этап может занимать, по различным оценкам, до 3 лет.
Этап является ресурсоѐмким, так как требуется отобрать небольшое количество
перспективных химических соединений (кандидатов в лекарства) из набора,
состоящего из нескольких миллионов веществ, что требует существенных
финансовых затрат на реагенты для проведения химических реакций, а также
существенных временных затрат на проведение каждого теста. Именно на первом
этапе перспективным является использование компьютерных моделей (insilico),
что позволяет значительным образом снизить количество химических реакций
invitro с нескольких миллионов до нескольких десятков для наиболее
перспективных соединений, вследствие чего происходит снижение как
финансовых, так и временных затрат [5].
Исследования в области молекулярного докинга ведутся уже более 30 лет, и
разработано значительное количество разнообразных методов выполнения
моделирования, учитывающих различные комбинации аспектов молекулярного
взаимодействия и ориентированных на различные классы соединений [25, 26, 28,
29, 30, 35, 36, 39-41, 47-51]. Внедрение перспективных параллельных архитектур,

В рамках диссертации изучались методы и алгоритмы применения
численных методов оптимизации на графических процессорах для решения
прикладных задач и их применение для эффективного решения задачи
молекулярного лиганд-белкового докинга.
К основным результатам диссертационного исследования следует отнести:
1. Предложен алгоритм реализации метода дифференциальной эволюции с
использованием графических процессоров. Предлагаемая композиция этапов
дифференциальной эволюции обеспечивает распределение отдельных процедур
оптимизации по мультипроцессорам графического процесса, удовлетворяя
требованиям метода дифференциальной эволюции к размеру популяции, позволяя
тем самым увеличить нагрузку на графический процессор и использовать
встроенные средства синхронизации. Разработанный подход хорошо подходит
для решения задач, связанных с выполнением большого количества процедур
оптимизации.
2. Разработан алгоритм расчѐта силовых полей межмолекулярного
взаимодействия на основе вычисления сеток с использованием графических
процессоров. Предлагаемый метод выполнения позволяет эффективно
автоматически распределять вычисления различных типов сеток силовых полей
для больших баз химический соединений между доступными ресурсами
графических процессоров. Управление вычислениями организовано таким
образом, чтобы обеспечить максимальную загрузку графических процессоров и
скрыть задержки работы с дисковой памятью. Алгоритм демонстрирует
значительное ускорение вычислений по сравнению с аналогами.
3. Предложен алгоритмрешения задачи молекулярного докинга с
использованием графических процессоров. Разработанное решение
ориентировано на автоматическую обработку больших баз лигандов и позволяет
прозрачно для пользователя распределять нагрузку по всем доступным
графическим процессорам. Предлагаемый подход демонстрирует существенное
ускорение моделирования и требуемую точность вычислений при обработке
реальных химических соединений.
4. Создан комплекс программного обеспечения, реализующий
предложенные алгоритмы.Получены свидетельства о регистрации программ для
ЭВМ в Федеральном институте промышленной собственности №2013660687,
№2014619771.
Предложенные алгоритмы и программные решения создают научную
основу решения важных прикладных задач фармакологии и биоинформатики на
базе гетерогенных вычислительных систем, использующих графические
процессоры. Данные средства могут использоваться как самостоятельно, так и
применяться для реализации новых подходов к решению этих задач.
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

CUDA (ComputeUnifiedDeviceArchitecture): Программно-аппаратная массивно-
параллельная архитектура, используемая в графических процессорах компании
NVIDIA.
CUDA ядро: Арифметико-логическое устройство, входящее в состав
мультипроцессора графического процессора в большом количестве.
invitro: Эксперименты «в стекле», т.е. в пробирке.
invivo: Эксперименты в живом организме.
insilico: Компьютерное моделирование.
MPP (MassiveParallelProcessing): Архитектура параллельных вычислительных
систем, суперкомпьютеров Как правило, отличительной особенностью от
кластерных вычислительных систем является применение специфических
технологических решений при построении компонент системы.
sp2 гибридизация: Гибридизация одной s орбитали и двух p орбиталей. В
результате образуется три гибридных орбитали, расположенные в одной
плоскости с углом в 120°.
sp3 гибридизация: Гибридизация одной s орбитали и трѐх p орбиталей. В
результате образуется четыре гибридных орбитали, оси которых направлены к
вершинам правильного тетраэдра.
варп (warp): Группа нитейграфического процессора, которая выполняется
одновременно на одном мультипроцессоре.
аминогруппа: Функциональная группа атомов –NH2.
аминокислоты: Органические соединения, молекула которых состоит из
аминогруппы, карбоксильной группы и углеводородного радикала.
Подразделяются на: альфа-, бета-, гамма- и т.д. аминокислоты в зависимости
от места присоединения аминогруппы. В природе встречаются только альфа-
аминокислоты.
ангстрем: Единица измерения расстояния. 1 ангстрем равен 0,1 нм.
биомишень: Большое молекулярное соединение (как правило, белок),
насчитывающее несколько сотен атомов и являющееся целью получение
биологического отклика.
валентность: Свойство атомов химических элементов образовывать
химические связи.
вычислительное ядро: Программная единица, функция, исполняющаяся на
графическом процессоре.
геометрические изомеры: Изомеры, имеющие различное пространственное
расположение атомов в молекуле и не относящиеся к оптическим изомерам.
Подразделяются на цисизомеры и трансизомеры.
гетерогенная вычислительная система: Вычислительная система, в состав
которой входят вычислительные устройства различных архитектур.
гибридизация: Это взаимодействие различных по типу, но близких по энергии
атомных орбиталей с образованием гибридых орбиталей одинаковой формы и
энергии.
гидроксильная группа: Функциональная группа атомов –OH.
ингибитор: Вещество, замедляющее течение какой-либо химической реакции.
изомеры: Химические соединения, имеющие одинаковый качественный и
количественный состав, но разное строение и, как следствие, разные свойства.

карбоксильная группа: Функциональная группа атомов –COOH.
ковалентная связь: Химическая связь, образованная перекрытием пары
валентных электронных облаков.
конформация молекулы: Пространственное расположение атомов в молекуле
при вращении атомов или групп атомов вокруг простых связей при сохранении
неизменным порядка химических связей атомов.
конформер: Стереоизомер в ряде конформаций, соответствующий минимуму
потенциальной энергии.
лиганд: Небольшое молекулярное соединение (как правило, кандидат в
лекарственный препарат), насчитывающее несколько десятков атомов.
межмолекулярное взаимодействие: Взаимодействие молекул между собой,
которое не приводит к образованию новых или разрыву старых химических
связей.
молекулярный докинг: Это метод компьютерного моделирования
межмолекулярных взаимодействий.
молекулярная формула: Формула, отражающая качественный состав
соединения.
орбиталь: Пространство вокруг ядра атома, в котором заключено 90%
электронного облака.
пептидная связь: Это связь, образующаяся между остатком –NH–
аминогруппы одной молекулы аминокислоты и остатком –CO– карбоксильной

группы другой молекулы аминокислоты. .
программируемая логическая интегральная схема (ПЛИС): Интегральная
схема, логика работы не задана жѐстко в процессе производства и может
изменять программным образом.
ротамер: Частный случай конформера, являющийся результатом вращения
группы атомов вокруг одной химической связи.
сайт связывания (bindingsite): Область поверхности молекулы биомишени, к
которой происходит присоединения молекулы лиганда.
энергия связывания, свободная энергия связывания: Это величина,
показывающая изменение энергии в ходе химической реакции.
спин: Собственный магнитный момент электрона.
структурная формула: Формула, отражающая порядок соединения атомов в
молекуле.
ферменты, энзимы: Органические катализаторы химических реакций в живых
организмах.
функциональная группа: Группа атомов, которая определяет наиболее
характерные свойства вещества и его принадлежность к определѐнному классу
соединений (например, гидроксильная группа –OH определяет
принадлежность к алканолам).
шейдер: Программа для управления вычислениями на определѐнной стадии
обработки графической информации. Различают: вершинные, пиксельные и
геометрические шейдеры.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров»

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Ольга Р. доктор, профессор
    4.2 (13 отзывов)
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласован... Читать все
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласованные сроки и при необходимости дорабатываются по рекомендациям научного руководителя (преподавателя). Буду рада плодотворному и взаимовыгодному сотрудничеству!!! К каждой работе подхожу индивидуально! Всегда готова по любому вопросу договориться с заказчиком! Все работы проверяю на антиплагиат.ру по умолчанию, если в заказе не стоит иное и если это заранее не обговорено!!!
    #Кандидатские #Магистерские
    21 Выполненная работа

    Последние выполненные заказы

    Другие учебные работы по предмету

    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022 год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022 год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021 год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»