Исследование методов статистического контроля для разработки алгоритмов предиктивной диагностики производственного оборудования
В работе рассмотрены методы статистического контроля и методы машинного обучения с целью прогнозирования работы оборудования, и выявления в нем неисправностей.
Реферат ………………………………………………………………………………………………… 11
Список сокращений ………………………………………………………………………………. 15
Термины и определения …………………………………………………………………………. 16
Введение ………………………………………………………………………………………………. 18
Цели и задачи исследования …………………………………………………………………… 19
Обзор существующих решений ………………………………………………………………. 20
1 Описание технологического процесса производства БОПП-пленки ……….. 22
2 Оборудование ТДО …………………………………………………………………………….. 27
2.1 Контроллерное оборудование ТДО ……………………………………………………. 27
2.2 Датчики ТДО …………………………………………………………………………………… 28
2.3 Двигатели ТДО ………………………………………………………………………………… 29
2.4 Ректифер ТДО………………………………………………………………………………….. 29
2.5 Control Unit ТДО………………………………………………………………………………. 30
3 Схема информационных потоков ТДО …………………………………………………. 31
4 Разработка предиктивной модели ………………………………………………………… 32
4.1 Основные шаги в разработке предиктивной модели……………………………. 32
4.2 Сбор данных для предиктивной модели …………………………………………….. 32
4.3 Постановка задачи ……………………………………………………………………………. 33
4.4 Требования к временному ряду …………………………………………………………. 33
4.5 Стек технологий для исследования ……………………………………………………. 37
4.6 Метрики качества …………………………………………………………………………….. 39
4.7 Подготовка данных ………………………………………………………………………….. 40
4.8 Прогнозные модели ………………………………………………………………………….. 41
4.8.1 Методы скользящего среднего (moving average, MA)……………………….. 42
4.8.2 Методы экспоненциального сглаживания ……………………………………….. 43
4.8.2.1 Экспоненциальное сглаживание …………………………………………………… 43
4.8.2.2 Двойное экспоненциальное сглаживание ……………………………………… 44
4.8.2.3 Тройное экспоненциальное сглаживание (Holt-Winters) ………………… 46
4.8.3 Авторегрессионые модели ……………………………………………………………… 48
4.8.3.1 AR (autoregreesive) модель …………………………………………………………… 48
4.8.3.2 ARIMA (autoregressive integrated moving average) модель………………. 49
4.8.3.3 SARIMA (seasonal autoregressive integrated moving average) модель .. 51
4.8.4 Скрытая марковская модель (Hidden Markov model) ………………………… 52
4.8.5 Регрессионные модели …………………………………………………………………… 55
4.8.5.1 Теоретическая часть ……………………………………………………………………. 55
4.8.5.2 Практическая часть …………………………………………………………………….. 56
4.8.6 Модели на базе классификационно-регрессионных деревьев ……………. 59
4.8.6.1 CatBoost ……………………………………………………………………………………… 59
4.8.6.2 XGBoost……………………………………………………………………………………… 61
4.8.6.3 LightGBM …………………………………………………………………………………… 63
4.8.6.4 Сравнение CatBoost, XGBoost, LightGBM …………………………………….. 65
4.8.7 Нейросетевые модели…………………………………………………………………….. 66
4.8.8 Готовые решения (Facebook Prophet, Amazon Gluon TS) …………………… 69
4.8.8.1 Facebook Prophet …………………………………………………………………………. 69
4.8.8.2 Amazon Gluon TS ………………………………………………………………………… 70
4.8.9 Сравнение моделей прогнозирования ……………………………………………… 72
4.9 Детектирование аномалий ………………………………………………………………… 74
4.9.1 Статистические методы …………………………………………………………………. 75
4.9.1.1 Ящик с усами ……………………………………………………………………………… 75
4.9.1.2 Z-score ……………………………………………………………………………………….. 76
4.9.2 Контрольные карты ……………………………………………………………………….. 77
4.9.3 Методы, основанные на плотности …………………………………………………. 78
4.9.3.1 Локальный уровень выброса (LOF, Local outlier factor) ………………….. 78
4.9.3.2 DBSCAN ……………………………………………………………………………………. 79
4.9.4 Методы машинного обучения ………………………………………………………… 80
4.9.4.1 One Class SVM ……………………………………………………………………………. 80
4.9.4.2 Isolation Forest …………………………………………………………………………….. 82
4.9.5 Модельные методы………………………………………………………………………… 83
4.9.6 Методы на основе экспертных знаний …………………………………………….. 84
4.9.7 Сравнение методов детектирования ………………………………………………… 85
4.10 Интеграция предиктивной модели в технологический процесс
производства БОПП-пленки …………………………………………………………………… 88
4.10.1 Имитационная модель ТДО ………………………………………………………….. 88
4.10.2 SCADA-пакет ………………………………………………………………………………. 89
4.10.3 OPC-сервер …………………………………………………………………………………. 90
4.10.4 База данных…………………………………………………………………………………. 90
4.10.5 Онлайн-мониторинг технологического процесса ……………………………. 91
4.10.6 Реализация взаимодействия технологического процесса и
предиктивной модели ……………………………………………………………………………. 92
5 Финансовый менеджмент, ресурсоэффективность и ресурсосбережение … 96
5.1 Организация и планирование работ …………………………………………………… 96
5.1.1 Продолжительность этапов работ …………………………………………………… 97
5.2 Расчет сметы затрат на выполнение проекта …………………………………….. 103
5.2.1 Затраты на материалы и покупные изделия ……………………………………. 103
5.2.2 Затраты на заработную плату ……………………………………………………….. 104
5.2.3 Затраты на социальный налог ……………………………………………………….. 105
5.2.4 Затраты на электроэнергию ………………………………………………………….. 105
5.2.5 Амортизационные расходы…………………………………………………………… 106
5.2.6 Расходы, учитываемые непосредственно на основе платежных
документов …………………………………………………………………………………………. 107
5.2.7 Прочие расходы …………………………………………………………………………… 108
5.2.8 Общая себестоимость разработки …………………………………………………. 108
5.2.9 Доход ………………………………………………………………………………………….. 108
5.2.10 Затраты на НДС …………………………………………………………………………. 108
5.2.11 Цена разработки НИР …………………………………………………………………. 108
5.3 Оценка экономической эффективности проекта ……………………………….. 109
6 Социальная ответственность ……………………………………………………………… 111
6.3 Правовые и организационные вопросы обеспечения безопасности ……. 112
6.3.1 Особенности трудового законодательства ……………………………………… 112
6.3.1 Особенности трудового законодательства ……………………………………… 113
6.4 Производственная безопасность ……………………………………………………… 114
6.5 Анализ опасных и вредных факторов ………………………………………………. 116
6.6 Экологическая безопасность …………………………………………………………… 125
6.7 Безопасность в чрезвычайных ситуациях …………………………………………. 126
Заключение …………………………………………………………………………………………. 128
Список литературы ……………………………………………………………………………… 129
Одна из главных тенденций современного производства – это
концепция «Индустрия 4.0» [1]. «Индустрия 4.0» предполагает цифровизацию
производства, внедрение в него киберфизических систем, предиктивной
аналитики, использование виртуальной реальности для обучения
сотрудников, работу с большими данными, создание цифровых двойников.
Тенденция появилась потому, что крупные компании и России, и мира
стремятся увеличить экономическую эффективность, повысить безопасность
и надежность производства, автоматизировать процессы на всех уровнях. А
одной из важнейших проблем, решаемой индустрией 4.0, является
непрерывная работа оборудования.
На данный момент существует несколько методов обслуживания
оборудования – аварийное, регламентное и предиктивное [2].
Аварийное обслуживание – обслуживание оборудования после выхода
его из строя. Данный метод оправдан при обслуживании дешевого
оборудования, не оказывающего решающего влияния на технологический
процесс, либо имеющего резервирование.
Регламентное обслуживание осуществляется плановыми проверками
согласно документации оборудования. План проверок рассчитывается с
помощью статистического анализа компанией-изготовителем. Проблема
возникает при работе оборудования на высоких нагрузках, что повышает шанс
выхода из строя раньше плана проверки и соответственно приводит к
нарушению технологического процесса.
Третий вид обслуживания – предиктивный. Когда процесс
контролируется непрерывно по фактическому состоянию. Часто происходит
так, что отклонения производственного процесса от обычного своего течения
обнаруживается только по факту самого отклонения. Выявление таких
отклонений (аномалий) происходит с помощью предсказательной аналитики,
то есть строится модель предсказаний, имитирующая ход процесса и
прогнозирующая его на несколько шагов вперед, после чего возникает
подзадача – детектирование аномалий в прогнозируемой части процесса.
Данный метод позволяет сформировать мероприятия технического
обслуживания к моменту отклонения процесса, что уменьшает количество
фактических неисправностей, простоев, затрат на обслуживание и т.д.
Данная работа посвящена применению методов машинного обучения
для предиктивной аналитики технологического процесса производства БОПП-
пленки с последующим детектированием аномалий.
Производство БОПП-пленки – это сложный технологический процесс,
в котором некорректная работа какого-либо оборудования может привести к
большому времени простоев, что, в свою очередь, приведет к значительным
экономическим потерям. Поэтому предсказание процесса и выявление в нём
аномалий существенно увеличит экономическую эффективность
производства, так как уменьшит вероятность нарушения хода работы
технологической линии.
Цели и задачи исследования
Цель исследования – потенциальное уменьшение количества остановок
производства БОПП-пленки и планирование мероприятий по обслуживанию
оборудования за счет предиктивных моделей.
Объект исследования – исторические данные (в форме временных
рядов) о технологическом процессе: значения датчиков, исполнительных
механизмов и другие параметры технологической линии.
Предмет исследования – методы прогнозирования временного ряда и
детектирования аномалий в нём.
Задачи исследования:
1. Сбор данных.
2. Подготовка данных.
3. Построение прогнозных моделей.
4. Детектирование аномалий.
5. Интеграция в технологический процесс.
Обзор существующих решений
В статье [3] исследуется прогнозирование отказов оборудования в
условиях малого количества поломок. На основе алгоритма Random Forest
строятся прогнозные модели, вычисляются отклонения прогнозных сигналов
от фактического в каждый момент времени. В результате возникают проблемы
с определением контрольных границ отклонения сигнала, а также с
интеграцией модели в производство. Также в статье нет аргументов в пользу
выбора алгоритма Random Forest.
В статье [4] выделяются плюсы и минусы предиктивной аналитики в
контексте внедрения методики на производство. Предлагается решение,
рассматривающее оценку определенных показателей – функции надежности,
функции риска. И имеющее следующие функциональные возможности –
мониторинг работы технологического процесса, планирование работ по
устранению неисправностей, построение прогноза. Решение не рассматривает
варианты интеграции в производство, не предлагает прогнозирующую модель
и существует только на уровне концепций.
В статье [2] исследуется модель предиктивного обслуживания
оборудования с применением беспроводных сенсорных сетей. Предлагается
использовать вместо проводных датчиков – беспроводные. Передавать данные
с них в «облако», после чего применять различные статистические методы для
прогнозирования выхода какого-либо оборудования. Проблема
рассматриваемого решение в том, что передача информации с использованием
беспроводных датчиков небезопасна и ненадежна. Кроме того, внедрение в
уже функционирующее производство проблематично из-за стоимости и
различных протоколов связи.
В магистерских диссертациях [5], [6], [7] исследуется поиск аномалий
во временных рядах. Предлагаются подходы для их выявления, сравнивается
эффективность различных моделей. Но не анализируются реальные данные
производства из-за чего ценность работ в поиске оптимального метода для
детектирования аномалий, а не в создании предиктивной модели.
В магистерской диссертации [8] применяются виртуальные агенты
систем управления для обнаружения и ликвидации аварийных случаев.
Предлагается внедрение системы ТОиР, основанной на агентных методах,
которая повысит производительность производства и снизит риски.
Предполагается, что система может быть применима практически к любой
АСУ. Минусы данного решения – регламентированное обслуживание
оборудования, что приводит к повышенным затратам предприятия.
В выпускной квалификационной работе [9] разрабатывается
прогнозная модель изменения температуры. Для этого используется
нейросетевой анализ. Решение не проводит сравнительный анализ прогнозных
моделей, соответственно построение нейросетей возможно избыточно для
данной задачи.
В бакалаврских работах [10], [11] производится анализ временных
рядов. Рассматривается классификация моделей прогнозирования и
временных рядов, алгоритмы построения прогнозных моделей. В работе [11]
создается кроссплатформенное web-приложение в основе которого лежит
модель прогнозирования фреймворка Fbprophet. Недостатками работы
являются – использование базы данных SQLlite, которая не предназначена для
хранения временных рядов, следовательно при возникновении потребности
масштабирования необходимо будет сменить базу данных. Кроме того,
рассмотрены не все модели из классификации и не проведен сравнительный
анализ их.
В статьях [12], [13] рассматриваются внедрение системы мониторинга
с прогнозированием. В статье [12] основе модели прогнозирования лежит
тройное экспоненциальное сглаживание, в статье [13] модель
прогнозирования не строится. Системы мониторинга разрабатывались на
языке Python, в качестве базы данных использовалась InfluxDB. Недостатками
работ являются отсутствие результатов внедрения, сравнительного анализа
моделей и баз данных.
1 Описание технологического процесса производства БОПП-пленки
БОПП-пленка – биаксиально-ориентированная полипропиленовая
пленка. Применяется для пищевой продукции и товаров повседневной жизни.
Технология производства БОПП-пленки начинается с приёма
гранулированного сырья на участке разгрузки. Гранулят загружается по
пневмотранспорту в силосы для хранения (рис.1.).
В магистерской диссертации произведено исследование предиктивной
модели двигателей технологического процесса производства БОПП-пленки.
Собраны данные в виде временных рядов для разработки предиктивной
модели, которые отображают основные параметры двигателя – скорость, ток,
температура и момент. После чего подготовлены для проведения анализа
основных методов (прогнозных и поиска аномалий) на которых базируется
предиктивная модель. Совершен сравнительный анализ методов и выявлены
лучшие для последующего их внедрения в технологический процесс. Как
видно из результатов сравнительного анализа в качестве прогнозной части
можно использовать практически любой, кроме простого и двойного
экспоненциального сглаживания, а в качестве части для поиска аномалий
лучше всего себя показывает DBSCAN.
В результате работы является внедрение в разработанный
имитационный технологический процесс. Построены информационные
потоки для передачи данных по протоколу OPC UA, организовано их хранение
в базе данных временных рядов InfluxDB, а также визуализированы эти
данные с помощью платформы онлайн-мониторинга Grafana.
В итоге, разработана предиктивная модель и архитектура для её
внедрения, что позволяет использовать её в любом технологическом процессе,
а в частности в технологическом процессе производства БОПП-пленки.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!