Сравнительный анализ алгоритмов машинного обучения в задачах исследования фондового рынка

Шульга Валентин Александрович
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Объект исследования – Проведение анализа различных методов машинного обучения, архитектур нейросетей, библиотек и инструментов, с целью их дальнейшего применения для рассматриваемой задачи. Поиск, предобработка, оптимизация и нормализация данных для обучения и тестирования и программная реализация модели.
Работа состоит из введения, обзора литературы, постановки задачи, четырёх глав, вывода, заключения и списка использованной литературы.
В ведении раскрывается актуальность выбранной темы. В обзоре литературы мною рассматриваются книги, интернет-статьи и публикации относящиеся к данной задаче. Далее ставится задача проводимого исследования.
В первой и второй главе проводится анализ различных алгоритмов машинного обучения, обзор библиотек и фреймворков используемых в работе.
В третьей и четвертой главе проводится построение и настройка моделей и визуализация результатов в виде графиков.
В выводе перечислены и охарактеризованы полученные результаты исследования, и предложены способы улучшения результатов в дальнейшем.
В заключении кратко проведено описание выполненных передо мною задач и подводятся итоги данной работы.

Используемые сокращения и определения 3
Введение 4
Постановка задачи 7
Обзор литературы 8

ГЛАВА 1. Анализ методов глубинного обучения, библиотек и
инструментов 10
1.1. Рекуррентная нейронная сеть (RNN) – LSTM………………………………………11
1.2. MLP…………………………………………………………………………………………………..13
ГЛАВА 2. Алгоритмы машинного обучения 16
2.1. Регуляризация………………..………………………………………………………….16
2.2. Линейная регрессия…………………………………………………………………………..19
2.3. Случайный лес…………………………………………………………………………..22
2.4. K-соседи……………………………………………………………………………………24
2.5. Функции потерь…………………………………………………………………………..25
2.6. Библиотеки и инструменты………………………………………………………………26

ГЛАВА 3. Подготовка данных и построение предсказательной модели.
Обучение 28
3.1. Набор данных. Методика прогноза. OHLC….…………………………………28
3.2. Подготовка данных………………………………………………………………………….30
3.3. Нормализация данных..…………………………………………………..33
3.4. Настройка и построение моделей……………………………………………………..34
ГЛАВА 4. Визуализация и результаты 43
4.1. Реализация……………………………………………………………………………………..43

Выводы 53
Заключение 54
Список литературы 55
Используемые сокращения и определения

Приведём основные понятия и термины, используемые в данной работе:

RNN – рекуррентная нейронная сеть, это вид нейронных сетей, где связи
между элементами образуют направленную последовательность. Благодаря
этому появляется возможность обрабатывать серии событий во времени или
последовательные пространственные цепочки.

LSTM – Долгая краткосрочная память. Разновидность архитектуры
рекуррентных нейронных сетей.

Нейрон — это вычислительная единица, которая получает
информацию, производит над ней простые вычисления и передает ее дальше.

Синапс – связь между несколькими нейронами.

Цена закрытия (closing price) –цена последней сделки,
зарегистрированная при закрытии срочной биржи по окончании рабочего
дня.

Объём (volume) – технический индикатор, отражающий реальный
объём (оборот) торгов по количеству купленных, проданных к примеру, акций
за выбранный промежуток времени.

Эпоха – один проход по всему набору данных, используемый для
разделения обучения на отдельные фазы, важно для ведения логов и
периодической оценки.

МО- Машинное обучение

НС – Нейронная сеть

LR – Linear Regression

Прогнозирование фондового рынка – это попытка определить будущую
стоимость акций компании или другого финансового инструмента, торгуемого
на бирже. Успешное прогнозирование будущей цены акций может принести
хорошую прибыль.

Гипотеза об эффективном рынке говорит, что цены на акции отражают
всю имеющуюся в настоящее время информацию, и любые изменения цен,
которые не основаны на недавно выявленной информации, по своей сути
непредсказуемы. Другие не согласны, и те, у кого есть эта точка зрения,
обладают бесчисленными методами и технологиями, которые
предположительно позволяют им получать информацию о будущих ценах.

Из полученных результатов следует, что точнее всего оказались модели
LinearRegression и RandomForestRegressor. Причём модели Линейной
регрессии именно без применения различных регуляризаций даже
после тщательной нормализации данных. Возможно, такой результат
был обусловлен спецификой исследуемых данных.
Выполненная работа показывает отсутствие паттернов в
техническом анализе данных данного рода задач. Возможно такие
паттерны имели место, если производилась бы классификация и к тому
же брались, к примеру, минутные цены внутри одного дня и для них
осуществлялись бы предсказания.
В результате исследования также можно отметить, что если в
одном случае имеется картина прогноза за 10 дней и поведение цены
произошло одним образом на 11-й день, то в следующий раз при
повторении точно такой же ситуации она может повести себя
совершенно случайным образом.
Поэтому, и нейронные сети, и обычные алгоритмы либо сильно
ошибаются, либо наконец понимают, что самой выигрышной
стратегией будет являться предсказание где цена останется на уровне
предыдущего дня. То есть с равной вероятностью подъёма вниз или
вверх. Тогда ошибка начнёт уменьшаться, и предсказания начнёт
строиться по этому принципу.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ
    Антон П. преподаватель, доцент
    4.8 (1033 отзыва)
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публик... Читать все
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публикуюсь, имею высокий индекс цитирования. Спикер.
    #Кандидатские #Магистерские
    1386 Выполненных работ
    Анна К. ТГПУ им.ЛН.Толстого 2010, ФИСиГН, выпускник
    4.6 (30 отзывов)
    Я научный сотрудник федерального музея. Подрабатываю написанием студенческих работ уже 7 лет. 3 года назад начала писать диссертации. Работала на фирмы, а так же помог... Читать все
    Я научный сотрудник федерального музея. Подрабатываю написанием студенческих работ уже 7 лет. 3 года назад начала писать диссертации. Работала на фирмы, а так же помогала студентам, вышедшим на меня по рекомендации.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет