Разработка алгоритмов выполнения молекулярного докинга с использованием графических процессоров

Фарков, Михаил Александрович

СОДЕРЖАНИЕ ………………………………………………………………………………………………… 2
ВВЕДЕНИЕ ………………………………………………………………………………………………………. 4
1 Особенности реализации численных методов оптимизации на графических
процессорах для решения прикладных задач ……………………………………………………. 13
1.1 Виды молекулярного докинга …………………………………………………………………. 13
1.2 Оптимизируемая функция. Оценка энергии конформации ………………………. 17
1.3 Численные методы оптимизации …………………………………………………………….. 21
1.3.1 Генетический алгоритм в программе AutoDock …………………………………. 22
1.3.2 Итеративный локальный поиск в программе AutoDock Vina ……………… 23
1.3.3 Метод инкрементального наращивания в программе DOCK ………………. 24
1.3.4 Метод Монте-Карло в программе ROSETTALIGAND ……………………….. 25
1.3.5 Муравьиный алгоритм в программе PLANTS ……………………………………. 26
1.3.6 Метод дифференциальной эволюции ………………………………………………… 27
1.3.7 Метод роя частиц ……………………………………………………………………………… 27
1.4 Требования к численным методам оптимизации для реализации с
использованием графических процессоров …………………………………………………… 28
1.5 Выбор метода оптимизации для реализации на графических процессорах .. 32
1.6 Выводы по первой главе …………………………………………………………………………. 35
2 Алгоритм реализации метода дифференциальной эволюции с использованием
графических процессоров………………………………………………………………………………… 36
2.1 Существующие подходы к реализации метода дифференциальной эволюции
с использованием графических процессоров ………………………………………………… 36
2.2 Предлагаемая модель выполнения метода дифференциальной эволюции с
использованием графических процессоров …………………………………………………… 43
2.3 Организация основных структур данных для выполнения метода
дифференциальной эволюции ………………………………………………………………………. 46
2.4 Обобщѐнная схема алгоритма реализации метода дифференциальной
эволюции для одного вычислительного блока ………………………………………………. 48
2.5 Использование CUDA потоков для организации вычислений ………………….. 49
2.6 Выводы по второй главе …………………………………………………………………………. 51
3 Применение метода дифференциальной эволюции для выполнения
молекулярного докинга с использованием графических процессоров ………………. 53
3.1 Применение сеточного подхода в молекулярном докинге ……………………….. 53
3.2 Существующие реализации сеточного подхода ……………………………………….. 54
3.3 Алгоритм расчѐта силовых полей межмолекулярного взаимодействия с
помощью сеток на графических процессорах ……………………………………………….. 56
3.4 Алгоритм выполнения молекулярного лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 64
3.5 Особенности программной реализации лиганд-белкового докинга с
использованием графических процессоров …………………………………………………… 69
3.5.1 Организация основных структур данных …………………………………………… 69
3.5.2 Ограничения по используемым графическим процессорам ………………… 71
3.5.3 Использование массива графических процессоров …………………………….. 73
3.5.4 Управление вычислениями на одном графическом процессоре ………….. 74
3.5.5 Форматы файлов силового поля и обработка биомишени ………………….. 76
3.5.6 Трѐхмерная трансформация лиганда на графическом процессоре ………. 79
3.6 Выводы по третьей главе ………………………………………………………………………… 83
4 Анализ эффективности разработанных алгоритмов и программ …………………. 85
4.1 Тестирование алгоритма реализации метода дифференциальной эволюции 85
4.2 Тестирование алгоритма вычисления сеток силовых полей ……………………… 87
4.3 Тестирование алгоритма решения задачи молекулярного лиганд-белкового
докинга ………………………………………………………………………………………………………… 89
4.4 Выводы по четвѐртой главе …………………………………………………………………….. 93
ЗАКЛЮЧЕНИЕ ………………………………………………………………………………………………. 94
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ ……………………………………………………………………….. 96
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 100
Приложение А. Акты о внедрении …………………………………………………………………. 113

Актуальность исследования.Широкий спектр существующих прикладных
задач требует применения сложных вычислительных алгоритмов и методов,
предъявляющих высокие требования к вычислительным ресурсам. Для их
эффективной реализации используются высокопроизводительные
вычислительные системы, в том числе гетерогенные, включающие в себя
специализированные процессоры, например, графические. Перенос
существующих решений для центрального процессора на гетерогенные
вычислительные системы без изменений невозможен в силу значительных
различий в программно-аппаратной архитектуре. Поэтому актуальной является
задача подбора подходящих алгоритмов и их преобразования с учѐтом
особенностей информационных процессов, протекающийв
высокопроизводительных вычислительных системах, и специфики прикладной
задачи.
Одной из таких прикладных задач, имеющих важное народно-
хозяйственное значение, является выполнение молекулярного докинга, основная
область применения которого – разработка лекарственных препаратов. Разработка
и тестирование одного лекарственного препарата занимает несколько лет и
требует вложения в размере десятков миллионов долларов [1,2]. Весь процесс
разработки можно разделить на три основных этапа: подбор перспективных
соединений, т.е. испытания invitro; доклинические испытания соединений на
животных с целью оценки возможных побочных эффектов и общей
эффективности; завершающий этап – клинические испытания на человеке, т.е.
испытания invivo. Первый этап может занимать, по различным оценкам, до 3 лет.
Этап является ресурсоѐмким, так как требуется отобрать небольшое количество
перспективных химических соединений (кандидатов в лекарства) из набора,
состоящего из нескольких миллионов веществ, что требует существенных
финансовых затрат на реагенты для проведения химических реакций, а также
существенных временных затрат на проведение каждого теста. Именно на первом
этапе перспективным является использование компьютерных моделей (insilico),
что позволяет значительным образом снизить количество химических реакций
invitro с нескольких миллионов до нескольких десятков для наиболее
перспективных соединений, вследствие чего происходит снижение как
финансовых, так и временных затрат [5].
Исследования в области молекулярного докинга ведутся уже более 30 лет, и
разработано значительное количество разнообразных методов выполнения
моделирования, учитывающих различные комбинации аспектов молекулярного
взаимодействия и ориентированных на различные классы соединений [25, 26, 28,
29, 30, 35, 36, 39-41, 47-51]. Внедрение перспективных параллельных архитектур,

В рамках диссертации изучались методы и алгоритмы применения
численных методов оптимизации на графических процессорах для решения
прикладных задач и их применение для эффективного решения задачи
молекулярного лиганд-белкового докинга.
К основным результатам диссертационного исследования следует отнести:
1. Предложен алгоритм реализации метода дифференциальной эволюции с
использованием графических процессоров. Предлагаемая композиция этапов
дифференциальной эволюции обеспечивает распределение отдельных процедур
оптимизации по мультипроцессорам графического процесса, удовлетворяя
требованиям метода дифференциальной эволюции к размеру популяции, позволяя
тем самым увеличить нагрузку на графический процессор и использовать
встроенные средства синхронизации. Разработанный подход хорошо подходит
для решения задач, связанных с выполнением большого количества процедур
оптимизации.
2. Разработан алгоритм расчѐта силовых полей межмолекулярного
взаимодействия на основе вычисления сеток с использованием графических
процессоров. Предлагаемый метод выполнения позволяет эффективно
автоматически распределять вычисления различных типов сеток силовых полей
для больших баз химический соединений между доступными ресурсами
графических процессоров. Управление вычислениями организовано таким
образом, чтобы обеспечить максимальную загрузку графических процессоров и
скрыть задержки работы с дисковой памятью. Алгоритм демонстрирует
значительное ускорение вычислений по сравнению с аналогами.
3. Предложен алгоритмрешения задачи молекулярного докинга с
использованием графических процессоров. Разработанное решение
ориентировано на автоматическую обработку больших баз лигандов и позволяет
прозрачно для пользователя распределять нагрузку по всем доступным
графическим процессорам. Предлагаемый подход демонстрирует существенное
ускорение моделирования и требуемую точность вычислений при обработке
реальных химических соединений.
4. Создан комплекс программного обеспечения, реализующий
предложенные алгоритмы.Получены свидетельства о регистрации программ для
ЭВМ в Федеральном институте промышленной собственности №2013660687,
№2014619771.
Предложенные алгоритмы и программные решения создают научную
основу решения важных прикладных задач фармакологии и биоинформатики на
базе гетерогенных вычислительных систем, использующих графические
процессоры. Данные средства могут использоваться как самостоятельно, так и
применяться для реализации новых подходов к решению этих задач.
ТЕРМИНЫ И ОПРЕДЕЛЕНИЯ

CUDA (ComputeUnifiedDeviceArchitecture): Программно-аппаратная массивно-
параллельная архитектура, используемая в графических процессорах компании
NVIDIA.
CUDA ядро: Арифметико-логическое устройство, входящее в состав
мультипроцессора графического процессора в большом количестве.
invitro: Эксперименты «в стекле», т.е. в пробирке.
invivo: Эксперименты в живом организме.
insilico: Компьютерное моделирование.
MPP (MassiveParallelProcessing): Архитектура параллельных вычислительных
систем, суперкомпьютеров Как правило, отличительной особенностью от
кластерных вычислительных систем является применение специфических
технологических решений при построении компонент системы.
sp2 гибридизация: Гибридизация одной s орбитали и двух p орбиталей. В
результате образуется три гибридных орбитали, расположенные в одной
плоскости с углом в 120°.
sp3 гибридизация: Гибридизация одной s орбитали и трѐх p орбиталей. В
результате образуется четыре гибридных орбитали, оси которых направлены к
вершинам правильного тетраэдра.
варп (warp): Группа нитейграфического процессора, которая выполняется
одновременно на одном мультипроцессоре.
аминогруппа: Функциональная группа атомов –NH2.
аминокислоты: Органические соединения, молекула которых состоит из
аминогруппы, карбоксильной группы и углеводородного радикала.
Подразделяются на: альфа-, бета-, гамма- и т.д. аминокислоты в зависимости
от места присоединения аминогруппы. В природе встречаются только альфа-
аминокислоты.
ангстрем: Единица измерения расстояния. 1 ангстрем равен 0,1 нм.
биомишень: Большое молекулярное соединение (как правило, белок),
насчитывающее несколько сотен атомов и являющееся целью получение
биологического отклика.
валентность: Свойство атомов химических элементов образовывать
химические связи.
вычислительное ядро: Программная единица, функция, исполняющаяся на
графическом процессоре.
геометрические изомеры: Изомеры, имеющие различное пространственное
расположение атомов в молекуле и не относящиеся к оптическим изомерам.
Подразделяются на цисизомеры и трансизомеры.
гетерогенная вычислительная система: Вычислительная система, в состав
которой входят вычислительные устройства различных архитектур.
гибридизация: Это взаимодействие различных по типу, но близких по энергии
атомных орбиталей с образованием гибридых орбиталей одинаковой формы и
энергии.
гидроксильная группа: Функциональная группа атомов –OH.
ингибитор: Вещество, замедляющее течение какой-либо химической реакции.
изомеры: Химические соединения, имеющие одинаковый качественный и
количественный состав, но разное строение и, как следствие, разные свойства.

карбоксильная группа: Функциональная группа атомов –COOH.
ковалентная связь: Химическая связь, образованная перекрытием пары
валентных электронных облаков.
конформация молекулы: Пространственное расположение атомов в молекуле
при вращении атомов или групп атомов вокруг простых связей при сохранении
неизменным порядка химических связей атомов.
конформер: Стереоизомер в ряде конформаций, соответствующий минимуму
потенциальной энергии.
лиганд: Небольшое молекулярное соединение (как правило, кандидат в
лекарственный препарат), насчитывающее несколько десятков атомов.
межмолекулярное взаимодействие: Взаимодействие молекул между собой,
которое не приводит к образованию новых или разрыву старых химических
связей.
молекулярный докинг: Это метод компьютерного моделирования
межмолекулярных взаимодействий.
молекулярная формула: Формула, отражающая качественный состав
соединения.
орбиталь: Пространство вокруг ядра атома, в котором заключено 90%
электронного облака.
пептидная связь: Это связь, образующаяся между остатком –NH–
аминогруппы одной молекулы аминокислоты и остатком –CO– карбоксильной

группы другой молекулы аминокислоты. .
программируемая логическая интегральная схема (ПЛИС): Интегральная
схема, логика работы не задана жѐстко в процессе производства и может
изменять программным образом.
ротамер: Частный случай конформера, являющийся результатом вращения
группы атомов вокруг одной химической связи.
сайт связывания (bindingsite): Область поверхности молекулы биомишени, к
которой происходит присоединения молекулы лиганда.
энергия связывания, свободная энергия связывания: Это величина,
показывающая изменение энергии в ходе химической реакции.
спин: Собственный магнитный момент электрона.
структурная формула: Формула, отражающая порядок соединения атомов в
молекуле.
ферменты, энзимы: Органические катализаторы химических реакций в живых
организмах.
функциональная группа: Группа атомов, которая определяет наиболее
характерные свойства вещества и его принадлежность к определѐнному классу
соединений (например, гидроксильная группа –OH определяет
принадлежность к алканолам).
шейдер: Программа для управления вычислениями на определѐнной стадии
обработки графической информации. Различают: вершинные, пиксельные и
геометрические шейдеры.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Екатерина П. студент
    5 (18 отзывов)
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно... Читать все
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно занимаюсь английским языком, уровень владения - Upper-Intermediate.
    #Кандидатские #Магистерские
    39 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ

    Последние выполненные заказы

    Другие учебные работы по предмету

    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»