Разработка методов прогнозирования негативных событий при компьютерной обработке данных
Введение …………………………………………………………………………5
Глава 1. Анализ методов оценки рисков в результате возникновения
негативных компьютерных событий в вычислительных машинах, ком-
плексах и компьютерных сетях ………………………………………………14
§ 1.1. Постановка задачи и направления исследований ………………….14
§ 1.2. Подходы к проблеме обеспечения эффективности процессов обра-
ботки информации в вычислительных машинах, комплексах и компьютерных
сетях на основе оценки рисков………..………………………………………..18
§ 1.3. Модели компьютерных событий на основе подбора вероятностных
распределений…………………………………………………………………….27
§ 1.4. Методы прогнозирования …………………………..………….…32
1.4.1. Методы дисперсионного анализа ……………………………..32
1.4.2. Метод статистической регрессии ………………………….…..36
1.4.3. Модели экспоненциального сглаживания ……………….….…37
1.4.4. Модели авторегрессии ………………………..………………..39
1.4.5. Комбинированные модели прогнозирования …………………41
Выводы по 1 главе……………………………………………………………….44
Глава 2. Теоретико-вероятностные модели компьютерных событий, воз-
никающих в вычислительных машинах, комплексах и компьютерных
сетях, и применение их к анализу эффективности процессов обработки
данных……………..………………………………..……………………………46
§ 2.1. Модели появления активных событий в результате взаимодей-
ствия программных систем и анализ эффективности процесса обработки дан-
ных…………………………………………………………………………………46
§ 2.2. Модель управления рисками, учитывающая нарастающую сумму
ущерба …………………………………………………………………………..53
§ 2.3. Модель активного компьютерного события в условии ограничен-
ных возможностей по обеспечению эффективности обработки данных и мо-
дель попыток доступа к элементам программного обеспечения вычислитель-
ных машин, комплексов и компьютерных сетей ……………………………..57
Выводы по 2 главе …………………………………………………………………63
Глава 3. Экспериментальные исследования методов прогнозирования
интенсивности компьютерных событий ……………………………………65
§ 3.1. Прогнозирование интенсивности активных событий…………….65
§ 3.2. Прогнозирование негативных событий, связанных с несанкциониро-
ванными операциями со счетами юридических лиц с использованием пла-
тежных карт ……………………………………………………………..………..69
§ 3.3 Прогнозирование динамики появления веб-угроз ……………….…77
§ 3.4. Прогнозирование появления уязвимостей программных систем……82
§ 3.5. Прогнозирование сетевых активных событий ……………………86
§ 3.6. Прогнозирование интенсивности компьютерных активных собы-
тий с целью майнинга криптовалют. ………………………………………….90
§ 3.7. Прогнозирование негативных событий, связанных с ущербом от
хищений со счетов юридических лиц с использованием платежных карт….94
Выводы по 3 главе …………………………………………………………………97
Глава 4. Разработка методов прогнозирования компьютерных событий
на основе построения непрерывных аппроксимирующих функций…….99
§ 4.1. Выбор математического аппарата…………………………………99
§ 4.2. Построение аппроксимирующих функций на основе модифициро-
ванного метода наименьших квадратов………………………………………105
§ 4.3. Теоретическая оценка точности прогнозирования модифицирован-
ного МНК………………………………………………………………………..108
§ 4.4. Разработка инструментария для построения аппроксимирующих
функций …………………………………………………………………………112
Выводы по 4 главе ……………………………………………………………..119
Глава 5. Исследование точности применяемого метода прогнозирования
компьютерных событий ……………………………………………………………………120
§ 5.1. Экспериментальные исследования по построению прогнозных мо-
делей ……………………………………………………………………………121
5.1.1. Построение прогнозных моделей динамики изменения валютных
курсов………………………………………………………………………….…..121
5.1.2. Прогнозирование курсов драгоценных металлов……….…….…..129
5.1.3. Прогнозирование динамики изменения параметров средств вычис-
лительной техники……………………………………………………..……….…135
§ 5.2. Экспериментальные исследования точности прогнозирования на
примерах прогнозирования курсов валют и драгоценных металлов……….139
§ 5.3. Сравнение точности прогнозирования модифицированным мето-
дом МНК и методом полиномов Лагранжа………………………………..…144
§ 5.4. Методика оценки эффективности процесса обработки данных в
вычислительных машинах, комплексах и компьютерных се-
тях…………………………………………………………………………………148
Выводы по 5 главе ……………………………………………………………..149
Заключение ………………….……………………………………………………151
Глоссарий …………………………………………………………………………156
Литература…..…………………………………………………………………….158
Приложение 1. Свидетельство о государственной регистрации программы на
ЭВМ ……………………………………………………………………………….173
Приложение 2. Акты внедрения …………………………………………..……..174
Во введении дана постановка научной задачи и изложены характеристики решаемой проблемы. Обоснованы актуальность и практическая значимость темы диссертации, сформулированы цель
диссертационной работы и решаемые задачи.
Глава 1. В первой главе приведены результаты аналитического обзора
известных подходов к оценке эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях, в том числе, на основе оценки рисков, методов описания процессов возникновения компьютерных событий, а также известных на данный момент методов прогнозирования состояний динамических процессов. Рассмотрен применяемый в настоящее время большинством специалистов риск – ориентированный подход к оценке эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях, основанный на определении актуальных угроз, оценке вероятности их успешной реализации и подсчете возникающих при этом вероятных потерь.
Существенным недостатком такого подхода является то обстоятельство, что вывод об эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях может быть сделан только на момент проведения исследований, а вопрос о сроке, в течение которого она будет сохраняться, при этом остается открытым. Такой подход неудобен для руководителей организации, специалистов, управляющих разработкой и эксплуатацией программного обеспечения вычислительных машин, комплексов и компьютерных сетей. Их работа осуществляется в соответствии с перспективным планом и, им необходимо знать временной интервал, в течение которого возникновение проблем с программным обеспечением вычислительных машин, комплексов и компьютерных сетей маловероятно.
Решением данной проблемы может служить подход к оценке эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях, суть которого состоит во введении зависимости от времени вероятности реализации угрозы возникновения событий p(yi) и величины ущерба ui, характеризующих указанную эффективность процессов:
p(yi) pyi (t), ui ui(t).
В этом случае функция рисков R также становится функцией от времени t:
R(t)n p (t)u(t).
yi i i1
Учитывая, что, как правило, функции вероятности реализации угроз
pyi (t) и функция потерь ui,(t) являются неубывающими функциями времени t,
нетрудно видеть, что функция рисков R(t) также является неубывающей функцией t. В этом случае можно составить уравнение относительно неизвестного переменного t:
R(t)n p (t)u(t)R . (1) yi i 0
i 1
где R0 – максимальное допустимое значения ущерба.
Обозначим через Т0 – решение уравнения (1).
Учитывая сказанное выше, нетрудно видеть, что в данном методе
величина Т0 является временным интервалом, в течение которого потери эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях достигнут предельно допустимого значения и процесс обработки данных перестанет быть эффективным.
Таким образом, имеет смысл рассматривать величину Т0, как объективную характеристику эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях. При таком подходе главной задачей становится разработка методов построения непрерывных функций pyi (t) и ui (t) , в том числе, путем прогнозирования
вероятности реализации угроз и возможного ущерба.
Поскольку, как правило, в отношении функционирования
вычислительных машин, комплексов и компьютерных сетей, находящихся в эксплуатации, ведется статистика событий, приводящих к нарушению эффективности процесса обработки данных, и существуют, методы оценки соответствующих потерь, то эксперты, оценивающие уровень указанной эффективности, располагают данными о динамике изменения указанных параметров.
Возможным подходом к построению функций pyi (t) и ui (t) , может
служить метод прогнозирования динамических процессов обработки данных, основанный на построении, так называемых, «аппроксимирующих» функций, наиболее близко расположенных от имеющихся значений параметров состояний данного процесса.
В главе 2 настоящей работы изложены результаты исследований по разработке методов оценки последствий активных компьютерных событий, в том числе, по прогнозированию их интенсивности и применению полученных результатов к построению оценок эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях.
В данной главе разработаны теоретические модели и методы исследования компьютерных событий: модели активных компьютерных событий в результате взаимодействия программных систем; модель управления рисками учитывающие нарастающую сумму ущерба; модели активного компьютерного события в условиях ограниченных возможностей
противодействия, и модель попыток доступа к элементам программного обеспечения вычислительных машин, комплексов и компьютерных сетей.
Полученные результаты далее применяются для исследования оценки важного параметра, характеризующего процесс обработки данных в вычислительных машинах, комплексах и компьютерных сетях – время в течение, которого обеспечивается эффективность процесса обработки указанных данных.
Рассматривается удаленная (интернет) сеть, состоящая из сервера и N компьютеров. В сети наблюдается процесс событий, среди которых могут осуществляться активные события в отношении процесса обработки данных в ее компонентах. Активные события можно классифицировать как активные события на уровне приложений или как активные события для перегрузки сетевого канала или программы. В любом случае цель состоит в том, чтобы привести к перегрузке ресурсов сервера или вывести веб-ресурс из строя. При этом активные события могут происходить на каждом из семи уровнях модели OSI, которые охватывают все среды коммуникации: начиная с физической среды (1-й уровень) и заканчивая уровнем приложений (7-й уровень), на котором «общаются» между собой программы.
Рассмотрим подробнее реализацию данного процесса на различных уровнях.
1. Процесс возникновения активного события на уровне приложений. Для осуществления активного события с N компьютеров генерируются запросы на сервер или веб-сайт для доступа к содержащейся там информации. Суть активного события состоит в целенаправленной генерации большого количество запросов в ограниченный промежуток времени, обработать которые сервер или веб-сайт в штатном режиме не имеют возможности по причине ограниченности вычислительных ресурсов. Следствием реализации указанного активного события является снижение производительности или блокировка системы, то есть, потеря эффективности процесса обработки данных.
2. Процесс возникновения активного события на транспортном уровне.
В варианте протокольных активных событий с N компьютеров постоянно отправляются пакеты данных на сервер или веб-ресурс для последующей сборки. В процессе обработки пакетов данных, серверу требуются подтверждения от IP-адресов, с которых направлены данные и, которые он не может получить из-за загруженности канала. Но, тем не менее, он продолжает далее получать пакеты для распаковки, пока по причине отсутствия необходимых вычислительных ресурсов, не происходит блокировка системы. Данное активное событие приводит к снижению производительности или блокировке системы, то есть, к частичной, или полной потери эффективности процесса обработки данных.
Предложена вероятностная модель активного события в результате взаимодействия программных систем, которая продемонстрирована на следующем примере.
3. Процесс возникновения активного события на канальном уровне. Для осуществления активного события с N компьютеров генерируются запросы с целью исчерпания полосы пропускания сетевого канала. Суть активного события состоит в целенаправленной генерации большого количество запросов с целью заблокировать доступ к внешней сети серверу или веб-сайту и существенно снизить эффективность процесса обработки данных в штатном режиме по причине ограниченности полосы пропускания сетевого канала.
Теоретическая модель появления активного компьютерного события, направленного на затруднении работы программного обеспечения или блокирования доступа к нему, определяется следующим образом. В случайные дискретные моменты времени t, t 1,2,…,T,…. на сервер поступает поток запросов. При этом в фиксированный момент времени поступает только один запрос или не поступает ни одного. Запросы поступают независимо, вероятность появления запроса равна p.
Определим величины m0 и t0 следующим образом. Будим считать, что сервер в течение t0 единиц времени может обработать не более m0 запросов,
t0 m0 .
При поступлении в этот интервал времени m0 1 и более запросов
сервер блокируется и активное событие считается наступившим. Обозначим pат (T ) – вероятность наступления активного
время T.
Для вычисления величины pат (T ) определим случайные
являющиеся элементами случайного процесса:
t(t0)t t1…tt01, t1,2,…
где t – индикатор появления запроса в момент времени t:
1, если запрос паступил { .
события за величины,
t
0, в противном случае
Введем далее индикатор события, состоящего в первом выходе
процесса { t (t0 )} на заданную границу m0 1:
{если (t)m,(t)m1,
tm011, t10 0t0 0 0, в противном случае
а также случайную величину (m0 1) – время первого выхода процесса {t} на границу m0 1:
(m01)min t|t m011 .
Тогда, для вероятности pат (T ) успешного наступления активного компьютерного события за время T имеем соотношение:
pат(T)p(m0 1)Tt0 1.
В соответствии с введенным выше определением нетрудно видеть, что
pат(T)p(m01)Tt01p max t(t0)m01. (2)
0 Методы оценки вероятности (2) приведены в тексте диссертации.
Вопросы построения модели активного компьютерного события рассмотрены также на основе теории массового обслуживания. В этом случае задача вычисления вероятности успешного наступления активного события в течение времени T вычисляется при условии, что блокировка сервера происходит в случае поступления более m0 запросов в течение промежутка
времени t0 . В диссертации найдено выражение для вероятности наступления
активного компьютерного события за время T .
Модель управления рисками, учитывающая нарастающую сумму
ущерба
Предположим, что в случайные дискретные моменты времени в вычислительных машинах, комплексах и компьютерных сетях происходят события Ik , k 1,2,…, , приводящие к нарушению эффективности процесса
обработки данных: активные компьютерные события, сбой в работе, нарушение правил эксплуатации и т.д. Каждое событие сопровождается ущербом.
Положим u u1,…,um , ui 0, i 1,2,…,m – множество возможных
вариантов величины ущерба при появлении активных событий. Программная система реагирует на события, и возможные действия могут осуществляться по нескольким сценариям.
Один из возможных вариантов сценария состоит в последовательном сравнении величин ущерба uk , при возникновении очередного события Ik , с
максимально допустимой величиной ущерба R . В случае u R 0k0
программная система продолжает работу в штатном режиме. В противном случае производится корректировка политики управления событиями, введение дополнительных мер по обеспечению эффективности обработки данных и других аналогичных мероприятий.
N
ущербов ui ,ui ,…,ui ,… , вычисление статистики 12N
Второй вариант сценария состоит в следующем.
При появлении в моменты времени i ,i ,…,i ,… событий Ii , Ii ,…, Ii ,…
12N 11 производится последовательное суммирование значений соответствующих
S R, N0
1tTt 1
S Nu, (3) N ij
j1
и сравнение ее значения с максимально допустимой величиной ущерба R0 .
Если при появлении активного события IiN выполняется условие:
программная система продолжает работу в штатном режиме. В противном случае, аналогично первому сценарию делается вывод о
необходимости корректировки политики управления событиями и введения дополнительных мер по обеспечению эффективной обработки данных.
Рассмотрим математическую модель первого сценария.
Пусть , t 1,2,…,N – последовательность независимых, одинаково
t распределенных индикаторов,
Положим далее
p 1 p, p 0 1 p,
t
t
характеризующих моменты поступления событий.
Предполагаем, что события появляются независимо друг от друга,
вероятность появления каждого равна р.
Далее, как и ранее, положим u u1 ,…,um – значения возможных
значений ущерба и будем полагать, что при наступлении очередного события
m вероятность возникновения ущерба uk равна pk , pk 1.
k1
Пусть так же для значений k1,k2,…,ks , kj 1,…,m, имеет место
неравенство
а для значений i 1,…,m k ,k ,…,k
r
12 s u R ,
имеет место неравенство
uk Ro, j1,…,s, j
k0 kj
s p j1
q
С последовательностью t связывается
последовательность t {1,еслиt 1и наступилинцидентI , k k1,k2,…,ks
индикаторов
t
и рассматривается случайная величина τ:
k
0, в противном случае
min t|t 1 ,
– момент наступления критического события, при котором вычислительные машины, комплексы и компьютерные сети нуждаются в дополнительных мерах по обеспечению эффективности процесса обработки данных.
В рамках рассматриваемой модели вероятностное распределение случайной величины имеет вид:
k1
pk pq1pq , k1,2,…,
Что, очевидно, является геометрическим распределением. Математическое ожидание случайной величины равное Е 1
pq может служить оценкой среднего времени эффективной обработки данных.
Второй вариант сценария, при котором происходит суммирование значений ущерба от активных событий, состоит в следующем.
С последовательностью t связывается последовательность индикаторов t
t {1,еслиSt1R0,StR0 ,t=1,2,…, (4) 0, в противном случае
– моменты времени, в которые сумма ущерба превышает установленную границу R0. При этом момент наступления критического события, при
котором система нуждается в дополнительных мерах по повышению эффективности процесса обработки данных, определяется случайной величиной χ:
mint|t 1,
Для решения задачи в рамках введенной теоретико-вероятностной
модели найдем распределение случайной величины χ: p N pN .
r
N1 0 1 m 0 k k k 0 k1
Обозначим через N (0,1,…,m) первичную спецификацию исходов последовательности t N , где – число исходов равных 0, число
t0k исходов равных uk , 0 1,…,m N и положим:
m N1u |…N1,Ru uR.
Показано, что для вероятности первого наступления критического события имеет место соотношение:
N m k 0 0kkN1
m
pNP 1pp p. (5)
k1 N1MN1(uk )
k1
Модель активного компьютерного события в условии ограниченных возможностей по обеспечению эффективности обработки данных.
Рассмотрены процесс появления активных компьютерных событий и возможности механизмов по обеспечению эффективности обработки данных. В дискретные моменты времени происходят активные компьютерные
события в вычислительных машинах, комплексах и компьютерных сетях. События появляются независимо друг от друга, вероятность появления активного компьютерного события в фиксированный момент времени равна p.
Предполагается, что на ликвидацию активного компьютерного события и устранение последствий его наступления требуется m единиц времени, а возможности программного обеспечения имеют ограниченный ресурс и одновременно могут обеспечить эффективность процесса обработки данных только при наступлении одного события. Таким образом, обеспечивается эффективность процесса обработки данных, только если временные
интервалы между последовательными активными событиями превышают величину m .
С помощью метода производящих функций в коммутативном несимметричном n – базисе, показано, что:
p (m,n)1Cn1 pn1pNn. (6) N Nnm1
Следующее утверждение устанавливает асимптотическое поведение
величины в правой части соотношения (6).
Утверждение. Пусть m const , а величины N,n так, что n2 o(N). Тогда Nn 1
Cn1 pn1p Rn1es2n (1o(1)), Nnm1
где R N ,sNpn12p. ne 1 p
Разработанные вероятностные модели и методики описания компьютерных событий, подробно характеризуют взаимодействие программных систем в части нарушения штатного режима процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях. В рамках данных методик получены строгие соотношения для вероятности реализации указанных событий. Полученные результаты позволяют вычислять важный параметр – время в течение, которого обеспечивается эффективность процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях, примеры вычисления приведены в диссертации.
Глава 3. В данной главе изложены результаты исследований по моделированию компьютерных событий и применению полученных результатов к построению оценок эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях. В ходе экспериментальных исследований рассмотрены вопросы прогнозирования компьютерных событий в части построения непрерывных функций прогнозирования, зависящих от времени на основе данных об интенсивности событий.
Приведены результаты экспериментальных исследований по прогнозированию: интенсивности активных событий, веб-угроз, количества несанкционированных операций со счетами юридических лиц с использованием платежных карт, сетевых событий, интенсивности активных компьютерных событий с целью майнинга криптовалют и оценки ущерба от последствий взаимодействия программных систем.
Полученные результаты применены для разработки методики оценки эффективности процесса обработки данных в вычислительных машинах, в частности, для оценки важного параметра – времени эффективной обработки данных.
В качестве примера далее рассматривается эксперимент по прогнозированию веб-угроз в вычислительных комплексах и сетях.
Прогнозирование динамики появления веб-угроз.
В эксперименте по прогнозированию веб-угроз при построении функции прогнозированияF(x) использовались данные с 13.02.2018 года по
12.03.2018 года, для удобства представления исходные данные поделены на 100, за нулевое значение по оси OX принята дата 01.02.2018 года. Для данного эксперимента аппроксимирующая функция F(x) имеет вид:
3460901.55 F(x)46007.45 2
x 1336.59x5589.69sin . (7)
2
График прогнозной функции y F(x) представлен на рисунке 1. На данном графике по оси Х расположены даты, начиная с 01.02.2018 г., одно деление соответствует двум дням, по оси Y – количество веб-угроз, поделенное на 100. Точками на графике являются, приведенные для наглядности, значения исходных данных, на основании которых строится
сама аппроксимирующая функция.
Полученные результаты применялись для оценки времени
эффективности процесса обработки данных в вычислительных комплексах и сетях.
x
В соответствии с предлагаемой выше методикой прогнозирования появления веб-угроз и видом функции F(x) определяемым выражением (7), зависимость их числа от времени имеет вид:
f(t)1t2 3t4sin2t 5 3t, 2
гдеα1,α2,α3,α4 -константы,α5 =α1 +α2 +α4. F(x)
140 000 130 000 120 000 110 000 100 000
90 000 80 000
10 20 30 40 50 60 70
Рис. 1. График функции F(x)
Обозначим через N – общее число программных систем, для которых
проводилось наблюдение. Считается, что величина ущерба при возникновении активных событий для всех программных систем одинакова и равна u.
Тогда, очевидно, T0 – время в течение, которого обеспечивается
эффективность процесса обработки в вычислительных машинах, комплексах
Глава 4. В данной главе приведены результаты разработки и исследования методов прогнозирования динамических процессов, состояния
и компьютерных сетях определяется соотношением: T NR0/u5 ,
3
гдеR0 -максимальнодопустимыйущербпрограммнойсистеме.
x
которых заданы в виде таблицы значений (xi ,yi) – узловых точек. Результаты решения данной задачи позволяют проводить экспериментальные исследования по прогнозированию негативных событий в вычислительных машинах, комплексах и компьютерных сетях, приводящих к нарушению процесса обработки данных, как было показано в главе 3. Поставленная задача решается с помощью построения непрерывных аппроксимирующих функций, наиболее близко отстоящих от заданных значений состояния динамического процесса. Разработана методика построения аппроксимирующих функций в виде линейной комбинации базовых функций на основе модифицированного метода наименьших квадратов. Дано алгоритмическое описание разработанного инструментария и в рамках определенной вероятностной модели построены оценки точности прогнозирования предлагаемым методом.
Схема алгоритма, построения непрерывных аппроксимирующих функций на основе модифицированного метода наименьших квадратов представлена в тесте диссертации.
Разработанный в работе алгоритм реализован в процедуре контроля эффективности процесса обработки данных, встроенного в виде отдельного модуля в общую схему вычислительного комплекса, представленного на рисунке 2.
Рис.2. Диаграмма (UML) развертывания и компонентов вычислительного комплекса со встроенным модулем контроля эффективности обработки
В соответствии с приведенной схемой, на него поступают данные с модуля сбора информации о произошедших событиях. Модуль производит их обработку и выдает решение о возможности продолжения штатной работы или о введении дополнительных механизмов для повышения эффективности процедуры обработки данных.
Для оценки точности прогнозирования рассматриваемой процедурой вводится модель, в которой предполагается, что значение функции f(x), описывающей исходное состояние процесса, есть реализация некоторого случайного стационарного процесса ξ(t), то есть в момент времени ti, (ti=xi), последовательность величин:
yi = f(xi) = ξ(ti)
есть реализация некоторой случайной величины ξ(t), имеющей
n
математическое ожидание: M(t) yi и дисперсию:
D(t) 1 n(y), 2i2
n1 i0
где (xi ,yi) – исходные данные о состоянии процесса (узловые точки).
n1 i0
В условиях данной теоретико-вероятностной модели получены оценки вероятности отклонения прогнозируемых значений рассматриваемого процесса от ее действительных значений, которое дает утверждение, доказанное в диссертационной работе.
В главе 5 проведены экспериментальные исследования точности прогнозирования событий с помощью предлагаемого метода путем построения статистических критериев и вычислением на их основе величин ошибок.
В заключение данной главы, на основе разработанных программно- математических средств, сформулирована новая методика оценок эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях.
Предложенная методика позволяет осуществлять прогнозирование интенсивности различных компьютерных событий при обработке данных в вычислительных машинах, комплексах и компьютерных сетях, приводящих к потере эффективности процесса обработки данных, что позволяет оценивать сроки (время) эффективной обработки данных.
Основные результаты и выводы
1. Разработаны вероятностные модели и методы исследования компьютерных событий, возникающих в процессе обработки данных в вычислительных машинах, комплексах и компьютерных сетях и получены оценки возможности их реализации. Специфика разработанных методов позволяет рассчитать введенный в данной работе важный параметр эффективности обработки данных в вычислительных машинах, комплексах и компьютерных сетях время, в течение которого в процессе обработки данных обеспечивается целостность информации и возможность доступа к ней.
В приложении представлены акты о внедрении практических результатов диссертационной работы, и авторское свидетельство об официальной регистрации программы для ЭВМ, выданное Федеральной службой по интеллектуальной собственности.
2. Разработан метод прогнозирования состояния динамических процессов обработки данных в вычислительных машинах, комплексах и компьютерных сетях, основанный на построении непрерывных аппроксимирующих функций, позволяющий делать обоснованные прогнозы на более длительные промежутки времени и снижающий ошибки прогнозирования более чем в 2 раза по сравнению с известными методами. Указанный метод является универсальным и, в частности, не зависит от природы входных данных.
3. Разработан оригинальный алгоритм построения непрерывных функций прогнозирования и его программная реализация, позволяющая эффективно стоить данные функции в различных режимах.
4. Проведены экспериментальные исследования точности прогнозирования интенсивности появления компьютерных событий, которые исследовались на отрезке экстраполяции, и подтвердившие относительно небольшие значения ошибок прогноза.
5. Для значений ошибок прогнозирования впервые получены теоретические оценки вероятности превышения ими заданной величины.
6. Разработана методика оценки эффективности процесса обработки данных в вычислительных машинах, комплексах и компьютерных сетях, основанная на построении непрерывной временной функции рисков. Преимуществом разработанной методики является ее независимость от природы риска. Тем самым, данный подход может применяться для прогнозирования различных событий в вычислительных машинах, комплексах и компьютерных сетях.
Настоящая диссертационная работа посвящена актуальной задаче –
разработке методов исследования компьютерных событий, возникающих в
процессе обработки, хранения и передаче данных, которые далее применя-
ются для оценки эффективности указанных процессов. При этом под эффек-
тивностью процесса обработки (передачи, хранения) данных понимается
свойство указанного процесса, при котором обеспечивается целостность ин-
формации и возможность доступа к ней. Под событием (компьютерным со-
бытием) понимается любое явление, выходящее за рамки штатной работы
вычислительных машин, комплексов и компьютерных сетей, прямо, косвен-
но или потенциально, ведущее к остановке процессов системы или негативно
отражающееся на качестве ее функционирования. Под активным событием
понимается взаимодействие программных систем, при котором одна из них
осуществляет направленное воздействие на другую.
Вопросы оценки эффективности процессов обработки данных являются
центральными при функционировании вычислительных машин, комплексов
и компьютерных сетей. В условиях, возникновения событий, вызываемых
различными факторами, недостаточное внимание к вопросам обеспечения
эффективности информационных процессов может привести к серьезным по-
следствиям, в частности, к значительному ущербу: потере активов, постоян-
ных клиентов, репутации и многому другому. С другой стороны, избыточные
меры в этом вопросе приводят не только к необоснованным расходам на
приобретение, установку и эксплуатацию дорогостоящего оборудования, но
и к значительным затруднениям в работе вычислительных комплексов.
Применяемый в настоящее время большинством специалистов подход к
оценке эффективности процессов обработки данных [1-6], основан на оценке
рисков, возникающих при появлении компьютерных событий, включающих,
в частности, активные события. Указанные риски строятся путем оценки ве-
роятности появления компьютерных событий и оценки ущерба при их реали-
зации. Вывод об эффективности процессов обработки данных в вычисли-
тельных машинах, комплексах и компьютерных сетях, как правило, делается
на основе сравнения полученных оценок рисков с максимальным допусти-
мым ущербом.
Нетрудно видеть, что в результате применения указанного подхода мо-
жет быть получен ответ на вопрос об эффективности процессов обработки
данных только на момент проведения исследования, а вопрос о времени, в
течение которого возможна эффективная реализация процессов обработки
данных, очевидно, остается открытым. При этом следует заметить, что дан-
ный вопрос более всего интересует руководителей вычислительных ком-
плексов и информационных систем.
Степень разработанности темы.
Проблемам исследования эффективности обработки данных и управ-
ления информационными ресурсами посвящены работы известных россий-
ских ученых и специалистов, как А.М. Астахов, B.C. Артамонов,
Ю.М.Батурин, А.П. Баранов, В.А. Герасименко, Г.В. Емельянов, В.И. Завго-
родний, А.А. Зацаринный, П.Д. Зегжда, А.М. Ивашко, А.С. Кузьмин, А.И.
Костогрызов, А.П. Курило, А.Б. Лось, В.Н. Лопатин, А.А. Малюк, В.Г. Ма-
тюхин, В.А. Минаев, А.А. Молдовян, А.Г. Остапенко, С.А. Петренко, А.А.
Петров, С.П. Расторгуев, С.В. Симонов, С.В. Скрыль, А.В. Старовойтов, А.А.
Стрельцов, Д.С. Черешкин и др.
Большой вклад в развитие исследования эффективности обработки
данных внесли также и зарубежные исследователи: Р. Андерсон, С. Бармен,
JI. Маккарти, М. Мур, Д. Пикфорд и др.
Различные методологические аспекты блокирования доступа к данным
вычислительных машин, комплексов и компьютерных сетей отражены в ра-
ботах специалистов: О.С. Авсентьев, О.И. Бокова, П.Н. Девянин, O.В. Каза-
рин, В.А. Конявский, И.В. Котенко, А.С. Марков, В.А. Минаев, А.Г. Оста-
пенко, С.В. Скрыль, Н.С. Хохлов, А.А. Шелупанов и др. Следует отметить
также ряд работ по отдельным вопросам исследования эффективности про-
цессов обработки данных, в частности доступа к этим данным. К ним отно-
сятся труды В.К. Джогана, А.В. Душкина, и др., а также диссертации В.В.
Александрова, П.Ф. Сушкова, Н.С. Шимона.
В работе Калашникова А.О. предложена методология временного риск-
анализа, которая рассматривается в приложении к переменным состояниям
автоматизированных систем управления технологическими процессами в
критически важных объектах.
Проблемам прогнозирования и моделирования динамики изменения
различных технических и экономических показателей, таких, как курсы ми-
ровых валют и мировых цен на продукцию промышленного производства
посвящено значительное количество работ как отечественных, так и зару-
бежных исследователей.
Большое количество научных статей по данной тематике посвящено
разработке методов прогнозирования биржевых курсов иностранных валют и
котировок ценных бумаг. Из опубликованных работ засуживают внимание
исследования следующих авторов: П.А. Крюков, В.В Рычков, А.Н. Зинин,
Д.С. Литинский, С.В. Смирнов, О.А. Гуляева, М.А. Панилов, Н.В. Рычкова,
О.Б. Веретенникова, Д.В. Мамин, А.А. Качур, В.М. Дегтярев, В. Бирюков,
Л.Р. Болотова, Т.В. Струченкова, А.Ю. Кузьмин, П.В. Кратович, Е.В. Соко-
лов, Д.В. Бородин, Э.М Меликов, Л.А. Сафонова, Н.Е Егорова, К.А. Тор-
жевский и др.
Следует отметить, что все известные подходы к проблеме моделирова-
ния различны с точки зрения определения понятия прогнозирования, однако
большинство работ рассматривает процедуру построения прогнозных моде-
лей, как определение направления соответствующего тренда, а не как вычис-
ление будущего значения анализируемого параметра.
Анализ известных результатов построению различных прогнозных мо-
делей показывает, что достаточно точный прогноз предлагаемыми методами
может быть дан только на краткосрочный период. Попытки прогнозирования
абсолютных значений исследуемых показателей на достаточно длительные
временные промежутки дают значительные погрешности. В частности, при
построении прогнозов более чем на месяц, ошибки составляют не менее 10%.
Проведенный анализ научных и практических работ показал, что в
настоящее время большинством специалистов в области информационных
технологий применяется подход к оценке эффективности обработки данных
в вычислительных комплексах, основанный на оценке рисков, возникающих
при появлении различных событий. Указанные риски строятся путем оценки
вероятности появления негативных событий и оценки возможного ущерба
при их реализации. Вывод об эффективности процессов обработки данных
делается на основе сравнения полученных оценок рисков с максимальным
допустимым ущербом.
В результате применения указанного подхода может быть получен от-
вет на вопрос об эффективности процесса обработки данных в вычислитель-
ных машинах, комплексах и компьютерных сетях только на момент проведе-
ния исследования, а вопрос о времени, в течение которого возможно обеспе-
чение эффективности указанного процесса остается открытым. При этом
следует заметить, что данный вопрос более всего интересует руководителей
вычислительных комплексов и информационных систем, поскольку их рабо-
та, как правило, строится в соответствии с перспективным планом.
Решением данной проблемы может стать разработка методов прогно-
зирования компьютерных событий и применение их для оценки эффективно-
сти процесса обработки данных в вычислительных машинах, комплексах и
компьютерных сетях, чему посвящен ряд результатов настоящей работы.
Таким образом, актуальность темы диссертационного исследования за-
ключается в необходимости разработки методов анализа компьютерных со-
бытий и алгоритмов прогнозирования информационных рисков с целью раз-
работки инструментальных средств, обеспечивающих анализ эффективности
функционирования вычислительных машин, комплексов и компьютерных
сетей.
Актуальность диссертационных исследований подтверждается обсуж-
дением рассматриваемых вопросов на многочисленных форумах, посвящен-
ных проблемам эффективности обработки данных. В частности, на прохо-
дившей 12 – 13 декабря 2019 года в Москве «Межведомственной сессии по
вопросам безопасности критических информационных инфраструктур
(КИИ)», представителем подразделения ФСБ России, отвечающем за госу-
дарственную систему СОПКА, отмечена, в качестве основной задачи бли-
жайшего будущего, разработка методов прогнозирования появления компь-
ютерных событий, поскольку их предотвращение значительно менее болез-
ненная процедура, чем ликвидация последствий.
Целью диссертационной работы является разработка и анализ мето-
дик, направленных на повышение точности методов прогнозирования собы-
тий и определения на этой основе параметров, характеризующих эффектив-
ность процесса обработки данных в вычислительных машинах, комплексах и
компьютерных сетях.
Основные задачи диссертационного исследования:
1. Разработать вероятностные модели появления компьютерных собы-
тий, возникающих при обработке (передачи, хранения) данных в вычисли-
тельных машинах, комплексах и компьютерных сетях, методы их исследова-
ния, в частности методика оценки их возможной реализации, а так же мето-
дику оценки времени эффективности процесса обработки данных.
2. Разработать алгоритмы и программное обеспечение процедур про-
гнозирования актуальных угроз, в частности, угроз возникновения негатив-
ных компьютерных событий в вычислительных машинах, комплексах и ком-
пьютерных сетях и провести экспериментальные исследования эффективно-
сти указанных процедур.
3. Разработать методику прогнозирования динамических процессов об-
работки данных в вычислительных машинах, комплексах и компьютерных
сетях и методику исследования точности прогнозирования.
Методы исследования. Для реализации намеченной цели и решения
поставленных задач применяются методы теории вероятностей и математи-
ческой статистики, математической логики, теории алгоритмов, дискретной
математики и теории множеств, численные методы.
Объект исследования. Объектом исследования являются процессы
обработки (передачи, хранения) данных в вычислительных машинах, ком-
плексах и компьютерных сетях и события, возникающие при их функциони-
ровании.
Предмет исследования. Предмет исследования определен областью
исследования п. 3 «Модели, методы, алгоритмы, языки и программные ин-
струменты для организации взаимодействия программ и программных си-
стем» и п. 10. «Оценка качества, стандартизация и сопровождение программ-
ных систем» паспорта специальности 05.13.11 «Математическое и про-
граммное обеспечение вычислительных машин, комплексов и компьютерных
сетей» и перечнем решаемых в диссертации задач.
Научная новизна.
1. Разработаны вероятностные модели и методы исследования компью-
терных событий, возникающих в процессе обработки данных в вычислитель-
ных машинах, комплексах и компьютерных сетях, и получены оценки веро-
ятности их реализации. Специфика разработанных методов позволяет рас-
считать введенный в данной работе важный параметр эффективности про-
цесса обработки данных в вычислительных комплексах время, в течение
которого обеспечивается целостность информации и возможность доступа к
ней.
2. Разработан метод прогнозирования состояний динамических процес-
сов в вычислительных машинах, комплексах и компьютерных сетях, осно-
ванный на построении непрерывных аппроксимирующих функций и предпо-
лагающий вычисление конкретного значения на прогнозируемом интервале,
а также позволяющий делать обоснованные прогнозы на более длительные
промежутки времени и снижающий ошибки прогнозирования более чем в 2
раза по сравнению с известными методами. Указанный метод является уни-
версальным и, в частности, не зависит от природы входных данных, что по-
вышает эффективность обработки данных в вычислительных машинах, ком-
плексах и компьютерных сетях.
3. Проведены теоретические и экспериментальные исследования точ-
ности прогнозирования интенсивности появления активных событий в вы-
числительных машинах, комплексах и компьютерных сетях.
4. Разработана методика оценки эффективности процесса обработки
данных в вычислительных машинах, комплексах и компьютерных сетях, ос-
нованная на построении непрерывной временной функции рисков.
Достоверность и обоснованность полученных выводов подтвержда-
ется вычислительными экспериментами в части исследования динамики по-
ведения актуальных событий, возникающих в процессе обработки данных и
корректным использованием математического аппарата прикладной матема-
тики.
Теоретическая значимость.
Теоретическая значимость научных результатов диссертационного ис-
следования заключается в построении методики описания и исследования
событий, приводящих к нарушению процессов обработки и передачи данных
в вычислительных машинах, комплексах и компьютерных сетях, а также ме-
тодики оценки эффективности указанных процессов.
Практическая значимость. Научные и практические результаты дис-
сертации использованы при проведении исследований эффективности про-
цесса обработки и передачи данных в вычислительных машинах, комплексах
и компьютерных сетях в рамках проведения ряда научно-исследовательских
и опытно-конструкторских работ, о чем свидетельствуют: акты о внедрении
результатов в работу компании ООО «Смарт-ком»; акт о внедрении резуль-
татов в научно-исследовательскую работу кафедры компьютерной безопас-
ности НИУ ВШЭ «Применение риск-ориентированного подхода к оценке
стойкости криптографических алгоритмов», акты внедрения результатов
Публикации автора в научных журналах
Помогаем с подготовкой сопроводительных документов
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!