Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров

Фарков, Михаил Александрович

СОДЕРЖАНИЕ ………………………………………………………………………………………………… 2
ВВЕДЕНИЕ ………………………………………………………………………………………………………. 4
1 Особенности реализации численных методов оптимизации на графических
процессорах для решения прикладных задач ……………………………………………………. 13
1.1 Виды молекулярного докинга …………………………………………………………………. 13
1.2 Оптимизируемая функция. Оценка энергии конформации ………………………. 17
1.3 Численные методы оптимизации …………………………………………………………….. 21
1.3.1 Генетический алгоритм в программе AutoDock …………………………………. 22
1.3.2 Итеративный локальный поиск в программе AutoDock Vina ……………… 23
1.3.3 Метод инкрементального наращивания в программе DOCK ………………. 24
1.3.4 Метод Монте-Карло в программе ROSETTALIGAND ……………………….. 25
1.3.5 Муравьиный алгоритм в программе PLANTS ……………………………………. 26
1.3.6 Метод дифференциальной эволюции ………………………………………………… 27
1.3.7 Метод роя частиц ……………………………………………………………………………… 27
1.4 Требования к численным методам оптимизации для реализации с
использованием графических процессоров …………………………………………………… 28
1.5 Выбор метода оптимизации для реализации на графических процессорах .. 32
1.6 Выводы по первой главе …………………………………………………………………………. 35
2 Алгоритм реализации метода дифференциальной эволюции с использованием
графических процессоров………………………………………………………………………………… 36
2.1 Существующие подходы к реализации метода дифференциальной эволюции
с использованием графических процессоров ………………………………………………… 36
2.2 Предлагаемая модель выполнения метода дифференциальной эволюции с
использованием графических процессоров …………………………………………………… 43
2.3 Организация основных структур данных для выполнения метода
дифференциальной эволюции ………………………………………………………………………. 46
2.4 Обобщѐнная схема алгоритма реализации метода дифференциальной
эволюции для одного вычислительного блока ………………………………………………. 48
2.5 Использование CUDA потоков для организации вычислений ………………….. 49
2.6 Выводы по второй главе …………………………………………………………………………. 51
3 Применение метода дифференциальной эволюции для выполнения
молекулярного докинга с использованием графических процессоров ………………. 53
3.1 Применение сеточного подхода в молекулярном докинге ……………………….. 53
3.2 Существующие реализации сеточного подхода ……………………………………….. 54
3.3 Алгоритм расчѐта силовых полей межмолекулярного взаимодействия с
помощью сеток на графических процессорах ……………………………………………….. 56
3.4 Алгоритм выполнения молекулярного лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 64
3.5 Особенности программной реализации лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 69
3.5.1 Организация основных структур данных …………………………………………… 69
3.5.2 Ограничения по используемым графическим процессорам ………………… 71
3.5.3 Использование массива графических процессоров …………………………….. 73
3.5.4 Управление вычислениями на одном графическом процессоре ………….. 74
3.5.5 Форматы файлов силового поля и обработка биомишени ………………….. 76
3.5.6 Трѐхмерная трансформация лиганда на графическом процессоре ………. 79
3.6 Выводы по третьей главе ………………………………………………………………………… 83
4 Анализ эффективности разработанных алгоритмов и программ …………………. 85
4.1 Тестирование алгоритма реализации метода дифференциальной эволюции 85
4.2 Тестирование алгоритма вычисления сеток силовых полей ……………………… 87
4.3 Тестирование алгоритма решения задачи молекулярного лиганд-белкового
докинга ………………………………………………………………………………………………………… 89
4.4 Выводы по четвѐртой главе …………………………………………………………………….. 93
ЗАКЛЮЧЕНИЕ ………………………………………………………………………………………………. 94
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ……………………………………………………………………….. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 100
Приложение А. Акты о внедрении …………………………………………………………………. 113

Актуальность исследования.Широкий спектр существующих прикладных
задач требует применения сложных вычислительных алгоритмов и методов,
предъявляющих высокие требования к вычислительным ресурсам. Для их
эффективной реализации используются высокопроизводительные
вычислительные системы, в том числе гетерогенные, включающие в себя
специализированные процессоры, например, графические. Перенос
существующих решений для центрального процессора на гетерогенные
вычислительные системы без изменений невозможен в силу значительных
различий в программно-аппаратной архитектуре. Поэтому актуальной является
задача подбора подходящих алгоритмов и их преобразования с учѐтом
особенностей информационных процессов, протекающийв
высокопроизводительных вычислительных системах, и специфики прикладной
задачи.
Одной из таких прикладных задач, имеющих важное народно-
хозяйственное значение, является выполнение молекулярного докинга, основная
область применения которого – разработка лекарственных препаратов. Разработка
и тестирование одного лекарственного препарата занимает несколько лет и
требует вложения в размере десятков миллионов долларов [1,2]. Весь процесс
разработки можно разделить на три основных этапа: подбор перспективных
соединений, т.е. испытания invitro; доклинические испытания соединений на
животных с целью оценки возможных побочных эффектов и общей
эффективности; завершающий этап – клинические испытания на человеке, т.е.
испытания invivo. Первый этап может занимать, по различным оценкам, до 3 лет.
Этап является ресурсоѐмким, так как требуется отобрать небольшое количество
перспективных химических соединений (кандидатов в лекарства) из набора,
состоящего из нескольких миллионов веществ, что требует существенных
финансовых затрат на реагенты для проведения химических реакций, а также
существенных временных затрат на проведение каждого теста. Именно на первом
этапе перспективным является использование компьютерных моделей (insilico),
что позволяет значительным образом снизить количество химических реакций
invitro с нескольких миллионов до нескольких десятков для наиболее
перспективных соединений, вследствие чего происходит снижение как
финансовых, так и временных затрат [5].
Исследования в области молекулярного докинга ведутся уже более 30 лет, и
разработано значительное количество разнообразных методов выполнения
моделирования, учитывающих различные комбинации аспектов молекулярного
взаимодействия и ориентированных на различные классы соединений [25, 26, 28,
29, 30, 35, 36, 39-41, 47-51]. Внедрение перспективных параллельных архитектур,

В рамках диссертации изучались методы и алгоритмы применения
численных методов оптимизации на графических процессорах для решения
прикладных задач и их применение для эффективного решения задачи
молекулярного лиганд-белкового докинга.
К основным результатам диссертационного исследования следует отнести:
1. Предложен алгоритм реализации метода дифференциальной эволюции с
использованием графических процессоров. Предлагаемая композиция этапов
дифференциальной эволюции обеспечивает распределение отдельных процедур
оптимизации по мультипроцессорам графического процесса, удовлетворяя
требованиям метода дифференциальной эволюции к размеру популяции, позволяя
тем самым увеличить нагрузку на графический процессор и использовать
встроенные средства синхронизации. Разработанный подход хорошо подходит
для решения задач, связанных с выполнением большого количества процедур
оптимизации.
2. Разработан алгоритм расчѐта силовых полей межмолекулярного
взаимодействия на основе вычисления сеток с использованием графических
процессоров. Предлагаемый метод выполнения позволяет эффективно
автоматически распределять вычисления различных типов сеток силовых полей
для больших баз химический соединений между доступными ресурсами
графических процессоров. Управление вычислениями организовано таким
образом, чтобы обеспечить максимальную загрузку графических процессоров и
скрыть задержки работы с дисковой памятью. Алгоритм демонстрирует
значительное ускорение вычислений по сравнению с аналогами.
3. Предложен алгоритмрешения задачи молекулярного докинга с
использованием графических процессоров. Разработанное решение
ориентировано на автоматическую обработку больших баз лигандов и позволяет
прозрачно для пользователя распределять нагрузку по всем доступным
графическим процессорам. Предлагаемый подход демонстрирует существенное
ускорение моделирования и требуемую точность вычислений при обработке
реальных химических соединений.
4. Создан комплекс программного обеспечения, реализующий
предложенные алгоритмы.Получены свидетельства о регистрации программ для
ЭВМ в Федеральном институте промышленной собственности №2013660687,
№2014619771.
Предложенные алгоритмы и программные решения создают научную
основу решения важных прикладных задач фармакологии и биоинформатики на
базе гетерогенных вычислительных систем, использующих графические
процессоры. Данные средства могут использоваться как самостоятельно, так и
применяться для реализации новых подходов к решению этих задач.
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

CUDA (ComputeUnifiedDeviceArchitecture): Программно-аппаратная массивно-
параллельная архитектура, используемая в графических процессорах компании
NVIDIA.
CUDA ядро: Арифметико-логическое устройство, входящее в состав
мультипроцессора графического процессора в большом количестве.
invitro: Эксперименты «в стекле», т.е. в пробирке.
invivo: Эксперименты в живом организме.
insilico: Компьютерное моделирование.
MPP (MassiveParallelProcessing): Архитектура параллельных вычислительных
систем, суперкомпьютеров Как правило, отличительной особенностью от
кластерных вычислительных систем является применение специфических
технологических решений при построении компонент системы.
sp2 гибридизация: Гибридизация одной s орбитали и двух p орбиталей. В
результате образуется три гибридных орбитали, расположенные в одной
плоскости с углом в 120°.
sp3 гибридизация: Гибридизация одной s орбитали и трѐх p орбиталей. В
результате образуется четыре гибридных орбитали, оси которых направлены к
вершинам правильного тетраэдра.
варп (warp): Группа нитейграфического процессора, которая выполняется
одновременно на одном мультипроцессоре.
аминогруппа: Функциональная группа атомов –NH2.
аминокислоты: Органические соединения, молекула которых состоит из
аминогруппы, карбоксильной группы и углеводородного радикала.
Подразделяются на: альфа-, бета-, гамма- и т.д. аминокислоты в зависимости
от места присоединения аминогруппы. В природе встречаются только альфа-
аминокислоты.
ангстрем: Единица измерения расстояния. 1 ангстрем равен 0,1 нм.
биомишень: Большое молекулярное соединение (как правило, белок),
насчитывающее несколько сотен атомов и являющееся целью получение
биологического отклика.
валентность: Свойство атомов химических элементов образовывать
химические связи.
вычислительное ядро: Программная единица, функция, исполняющаяся на
графическом процессоре.
геометрические изомеры: Изомеры, имеющие различное пространственное
расположение атомов в молекуле и не относящиеся к оптическим изомерам.
Подразделяются на цисизомеры и трансизомеры.
гетерогенная вычислительная система: Вычислительная система, в состав
которой входят вычислительные устройства различных архитектур.
гибридизация: Это взаимодействие различных по типу, но близких по энергии
атомных орбиталей с образованием гибридых орбиталей одинаковой формы и
энергии.
гидроксильная группа: Функциональная группа атомов –OH.
ингибитор: Вещество, замедляющее течение какой-либо химической реакции.
изомеры: Химические соединения, имеющие одинаковый качественный и
количественный состав, но разное строение и, как следствие, разные свойства.

карбоксильная группа: Функциональная группа атомов –COOH.
ковалентная связь: Химическая связь, образованная перекрытием пары
валентных электронных облаков.
конформация молекулы: Пространственное расположение атомов в молекуле
при вращении атомов или групп атомов вокруг простых связей при сохранении
неизменным порядка химических связей атомов.
конформер: Стереоизомер в ряде конформаций, соответствующий минимуму
потенциальной энергии.
лиганд: Небольшое молекулярное соединение (как правило, кандидат в
лекарственный препарат), насчитывающее несколько десятков атомов.
межмолекулярное взаимодействие: Взаимодействие молекул между собой,
которое не приводит к образованию новых или разрыву старых химических
связей.
молекулярный докинг: Это метод компьютерного моделирования
межмолекулярных взаимодействий.
молекулярная формула: Формула, отражающая качественный состав
соединения.
орбиталь: Пространство вокруг ядра атома, в котором заключено 90%
электронного облака.
пептидная связь: Это связь, образующаяся между остатком –NH–
аминогруппы одной молекулы аминокислоты и остатком –CO– карбоксильной

группы другой молекулы аминокислоты. .
программируемая логическая интегральная схема (ПЛИС): Интегральная
схема, логика работы не задана жѐстко в процессе производства и может
изменять программным образом.
ротамер: Частный случай конформера, являющийся результатом вращения
группы атомов вокруг одной химической связи.
сайт связывания (bindingsite): Область поверхности молекулы биомишени, к
которой происходит присоединения молекулы лиганда.
энергия связывания, свободная энергия связывания: Это величина,
показывающая изменение энергии в ходе химической реакции.
спин: Собственный магнитный момент электрона.
структурная формула: Формула, отражающая порядок соединения атомов в
молекуле.
ферменты, энзимы: Органические катализаторы химических реакций в живых
организмах.
функциональная группа: Группа атомов, которая определяет наиболее
характерные свойства вещества и его принадлежность к определѐнному классу
соединений (например, гидроксильная группа –OH определяет
принадлежность к алканолам).
шейдер: Программа для управления вычислениями на определѐнной стадии
обработки графической информации. Различают: вершинные, пиксельные и
геометрические шейдеры.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Елена Л. РЭУ им. Г. В. Плеханова 2009, Управления и коммерции, пре...
    4.8 (211 отзывов)
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно исполь... Читать все
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно использую в работе графический материал (графики рисунки, диаграммы) и таблицы.
    #Кандидатские #Магистерские
    362 Выполненных работы
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ

    Последние выполненные заказы

    Другие учебные работы по предмету

    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»