Математическое моделирование подсистем “процессор-память” многопроцессорных систем с применением теории массового обслуживания
СПИСОК СОКРАЩЕНИЙ …………………………………………………………………………………. 5
ВВЕДЕНИЕ ………………………………………………………………………………………………………….. 6
1 ОБЗОР СОВРЕМЕННЫХ МЕТОДОВ МАТЕМАТИЧЕСКОГО
МОДЕЛИРОВАНИЯ ПОДСИСТЕМЫ «ПРОЦЕССОР-ПАМЯТЬ» В
МНОГОПРОЦЕССОРНЫХ СИСТЕМАХ, БАЗИРУЮЩИХСЯ НА ТЕОРИИ
МАССОВОГО ОБСЛУЖИВАНИЯ………………………………………………………………….. 13
1.1 Обзор подсистем «процессор-память», применяемых в
многопроцессорных системах ………………………………………………………………….. 13
1.2 Общее назначение, функции подсистемы «процессор-память» и
методы их математического моделирования …………………………………………….. 21
1.3 Обзор подходов исследования вероятностно-временных
характеристик подсистем «процессор-память» многопроцессорных систем на
основе теории массового обслуживания …………………………………………………… 27
1.4 Основные положения теории систем и сетей массового обслуживания,
применяемые в диссертационном исследовании ……………………………………….. 29
1.5 Обзор средств компьютерного моделирования на основе положений
теории массового обслуживания ………………………………………………………………. 32
1.6 Выводы по разделу 1 …………………………………………………………………….. 35
2 РАЗРАБОТКА УСОВЕРШЕНСТВОВАННЫХ АНАЛИТИЧЕСКИХ И
ЧИСЛЕННЫХ МЕТОДОВ МОДЕЛИРОВАНИЯ ПОДСИСТЕМ
«ПРОЦЕССОР-ПАМЯТЬ» МнПС НА ОСНОВЕ РАЗОМКНУТЫХ СЕТЕЙ
МАССОВОГО ОБСЛУЖИВАНИЯ………………………………………………………………….. 37
2.1 Подсистема «процессор-память» с однородным доступом с
интегрированным специализированным контроллером памяти …………………. 38
2.1.1 Метод моделирования подсистемы с общей памятью,
основанный на бесприоритетных РСеМО и с ограничением длины очереди 38
2.1.2 Численный метод моделирования подсистемы с общей памятью
с приоритетными дисциплинами обслуживания ……………………………………….. 47
2.2 Подсистема «процессор-память» с локальной памятью с
интегрированным специализированным контроллером памяти…………………. 59
2.2.1 Метод моделирования подсистемы типа NC-NUMA, основанный
на бесприоритетных РСеМО и с ограничением длины очереди …………………. 59
2.2.2 Метод моделирования подсистемы типа NC-NUMA, основанный
на приоритетных РСеМО …………………………………………………………………………. 64
2.3 Выводы по разделу 2 …………………………………………………………………….. 77
3 РАЗРАБОТКА КОМПЛЕКСА ПРОБЛЕМНО-ОРИЕНТИРОВАННЫХ
ПРОГРАММ ДЛЯ МОДЕЛИРОВАНИЯ ПОДСИСТЕМЫ «ПРОЦЕССОР-
ПАМЯТЬ» НА ОСНОВЕ РАЗОМКНУТЫХ СЕТЕЙ МАССВОГО
ОБСЛУЖИВАНИЯ ……………………………………………………………………………………………. 79
3.1 Программа для расчета вероятностно-временных характеристик
разомкнутых сетей массового обслуживания ……………………………………………. 79
3.1.1 Разработка структуры данных ……………………………………………….. 83
3.1.2 Разработка алгоритмов решения задачи …………………………………. 84
3.2 Программа для измерения временных задержек узлов и времени
обмена в подсистеме «процессор-память» ………………………………………………… 90
3.2.1 Постановка задачи ………………………………………………………………… 91
3.2.2 Разработка структуры данных и алгоритма решения задачи …… 92
3.3 Выводы к разделу 3……………………………………………………………………….. 98
4 МОДЕЛИРОВАНИЕ ВЕРОЯТНОСТНО-ВРЕМЕННЫХ
ХАРАКТЕРИСТИК ПОДСИСТЕМ «ПРОЦЕССОР-ПАМЯТЬ» С
ПРИМЕНЕНИЕМ РАЗРАБОТАННОГО КОМПЛЕКСА ПРОБЛЕМНО-
ОРИЕНТИРОВАННЫХ ПРОГРАММ …………………………………………………………… 100
4.1 Моделирование временных параметров подсистемы типа UMA с
ограничением длины очереди и бесприоритетной ДО …………………………….. 100
4.2 Моделирование вероятностно-временных характеристик подсистемы
типа NC-NUMA с ограничением длины очереди и бесприоритетной ДО…. 107
4.3 Моделирование вероятностно-временных характеристик подсистемы
типа NC-NUMA с неоднородным входящим потоком задач ……………………. 116
4.4 Моделирование временных параметров подсистемы типа UMA с
приоритетными дисциплинами обслуживания ………………………………………… 131
4.5 Анализ зависимости полученных результатов от параметров тестов
реальных многопроцессорных систем на основе показателей качества
регрессии ……………………………………………………………………………………………….. 141
4.6 Выводы по разделу 4 …………………………………………………………………… 150
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ ……………………………………………………. 153
ЛИТЕРАТУРА ………………………………………………………………………………………………….. 155
ПРИЛОЖЕНИЕ 1. Свидетельство о государственной регистрации программы … 176
ПРИЛОЖЕНИЕ 2. Акты внедрения результатов кандидатской работы …….. 177
СПИСОК СОКРАЩЕНИЙ
АП – абсолютный приоритет
БЗ – буфер записи
БЧ – буфер чтения
ДО – дисциплина обслуживания
КП – контроллер памяти
ЛП – локальная память
МнПС – многопроцессорная система
ОП – общая память
ОтнП – относительный приоритет
ОШ – общая шина
ПО – программное обеспечение
ПУ – процессорный узел
РСеМО – разомкнутая сеть массового обслуживания
СеМО – сеть массового обслуживания
СМО – система массового обслуживания
СМП – смешанный приоритет
ТМО – теория массового обслуживания
FIFO – first in first out
NUMA – Non-Uniform Memory Access
UMA – Uniform Memory Access
UML – Unified Modeling Language
Во введении приводится обоснование актуальности темы,
формулируется цель и задачи исследования, решение которых способствует
достижению поставленной цели, отражены научная новизна и практическая
значимость, обозначены выносимые на защиту основные положения.
В первом разделе рассматриваются методы математического
моделирования существующих подсистем «процессор-память, а также
известные типы архитектур. Подсистема «процессор-память» является одним
из основных узлов в МнПС, пропускная способность и производительность
подсистемы непосредственно влияет на производительность МнПС в целом.
Основными параметрами эффективности подсистемы «процессор-память»
является время реакции подсистемы на запросы процессоров, пропускная
способность ОШ, длины очередей заявок в подсистеме, коэффициенты
использования ресурсов МнПС, а также задержки и время обмена.
Как показывает анализ, в подсистеме «процессор-память» МнПС
существуют два основных способа доступа к памяти: однородный доступ
(полнодоступная память) и неоднородный (разделяемая память). Выявлен
ряд факторов, негативно влияющих на производительность МнПС с
однородным доступом в подсистеме «процессор-память», в том числе низкая
пропускная способность ОШ при увеличении числа процессорных узлов
(ПУ) и простаивание процессоров, когда ОШ занята. Для неоднородного
доступа к памяти к такими факторам относится увеличение времени обмена
процессора с локальной памятью (ЛП) другого процессора. Установлено, что
в существующих МнПС имеются ограничения на количество мест в очередях
перед узлами подсистемы «процессор-память», особенно это проявляется в
узле «ОШ», который чаще всего оказывается «узким местом» при
проектировании МнПС.
Анализ методов математического моделирования подсистем
«процессор-память» показывает, что при их моделировании обычно
применяются бесприоритетные и приоритетные СМО, где приоритеты
зависят от архитектуры подсистемы «процессор-память», от типов
задаваемых пользователем или операционной системой задач, от
направления поступающего запроса (в ЛП или ОП), а также от частоты
выполнения определенной задачи, которая поступает в память. Установлено,
что известные методы математического моделирования подсистем
«процессор-память» с однородным и неоднородным доступом, основанные
на положениях ТМО, не учитывают вышеперечисленные факторы в
совокупности, а отсутствие возможности оценки влияния архитектурных
особенностей на временные задержки узлов подсистемы «процессор-память»
приводит к погрешностям в процессе проведения математического
моделирования.
Проанализированы программные средства, применяемые для
математического моделирования с применением ТМО, выявлены их
достоинства и недостатки. Показано, что основным их недостатком являются
ограничения на вычисления при моделировании систем с ограниченными
очередями и приоритетных многоканальных систем. Кроме того,
существующие программные продукты не позволяют анализировать
задержки при функционировании подсистемы «процессор-память».
Во втором разделе представлено описание модернизированного
метода математического моделирования подсистемы «процессор-память» с
однородным доступом, учитывающий в совокупности архитектуру и
конфликты за доступ к ресурсам подсистемы, ограничения в очередях
Рассмотрена подсистема «процессор-память» с однородным доступом
(разделяемой памятью) и с ограниченными очередями (рисунок 1).
P10
O1S1
λ0
S0ОШ
P31P11
S4ОП
O2S2
P22
БуферМ1
записи λ2O4
P12P24P40
λ1
S0
P13O3S3P34
P33Буфер λ3Mn
чтения
λ4P43
Рисунок 1 – Схема МнПС с разделяемой памятью
Источником заявок (S0) выступают ПУ, которые генерируют на вход
ОШ обслуживающего прибора (S1) поток транзакций чтения и записи к
оперативной памяти (ОП), который определяется интенсивностью 0.
Потоки 1 и 2 образуют запросы ПУ через ОШ на обслуживающие
приборы, моделирующие буфер записи (БЗ) (S2), буфер чтения (БЧ) (S3),
входящие в состав КП и организации ОШ. Далее потоки распределяются по
модулям памяти, которые представлены в виде многоканальной СМО S4.
Выполнение транзакции из потока 3 проходит три фазы обработки операции
записи: ОШ(S1), КП(S2) и одним из модулей памяти (S4). Операция чтения
проходит пять фаз обслуживания: ОШ (S1), КП (S2), ОП (S4), КП (S2), ОШ
(S1).
ОП представлена многоканальной СМО типа М/М/m, а ОШ и буферы
КП – одноканальными СМО типа М/М/1, т. е. интенсивность поступления
задач в систему характеризуется экспоненциальным распределением, как и
функция распределения времени обслуживания. Число обслуживающих
устройств в многоканальной СМО равноm, число мест в очереди ограничено
во всех типах СМО сети, кроме ОШ, и равно K. Запрос от процессора,
пришедший из S0 через ОШ S1 в КП (S2, S3), становится в очереди (O2, O3) с
ограничением числа мест, при занятости обслуживающего прибора. Так как
очередь ограничена перед СМО, то при их занятости запрос поступает на
дообработку и с вероятностью P11 возвращается в очередь О1. После того, как
запрос получит полное обслуживание, он выходит из сети. Данный случай
характерен для изучения так называемых конфликтных ситуаций,
появляющихся на ОШ и в ОП, при обработке запросов от процессоров.
Также стоит учесть задержки, которые моделируются очередями О2,
О3, О4, т. е. запросы к буферам КП и ОП, заставшие их занятыми,
приостанавливаются, возвращаются в конец предыдущей очереди и
ожидают. При этом суммарный поток заявок в этих системах увеличиваться
не станет, потому что КП или процессоры не будут формировать новый
запрос, пока не выполнен предыдущий.
Исходя из вышеизложенного и структуры исследуемой подсистемы,
получено новое выражение для расчета времени обмена в подсистеме
«процессор-память», где учитываются задержки, создаваемые перед узлами
подсистемы, а также ограничения очередей:
(u qБЧ ) pОП
3( qОШ uОШ ОП ) (uБЗ qБЗ ) p12 ( БЧ) p13
pБЧ
tоб ,(1)
N cpu
где, τ – время выдачи адреса/данных на ОШ процессором, uОШ, uБЗ, uБЧ –
среднее время пребывания в ОШ, БЗ и БЧ, ωОП – среднее время ожидания в
очереди перед ОПpОП – вероятность того, что считываемые данные находятся
в ОП, pБЧ – вероятность того, что считываемые данные находятся в БЧ.
Время выдачи адреса/данных τ зависит от организации управления ОШ, Ncpu
– количество процессоров. Для расчета входящих в формулу (1) переменных
выведены соотношения:
задержка данных перед КП:
ОШ ( 1 БЗ ) (1
1 БЗ ) (1 БЧ ) (1
1 БЧ )
qОШ ,(2)
(1
1 ОШ )
задержка в работе КП при буферизации записи:
( p ) k 10 БЗБЗ 21 p12 (1 (1 p12БЗ ) k )[k (1 1 p12БЗ ) 1]
qБЗ 1 12 БЗ0 БЗ
(1 1 p12БЗ ) 2, (3)
БЗ (1 p12БЗ )k 10 БЗ
задержка при буферизации чтения:
(1 p13БЧ ) k 10 БЧ БЧ 21 p13 (1 (1 p13БЧ ) k )[k (1 1 p13БЧ ) 1]
qБЧ 0 БЧ
(1 1 p13БЧ ) 2(4)
БЧ (1 p13БЧ )k 10 БЧ
Выражения для расчета задержек и времени обмена учитывают в
совокупности тип архитектуры, конфликты за доступ к ресурсам подсистемы
и ограничения в очередях. Это позволяет уточнить вероятностно-временные
характеристики, времена задержки перед каждым узлом подсистемы
«процессор-память», а также время обмена с учетом факторов, влияющих на
производительность.
Как правило, в подсистемах «процессор-память» требуется быстрее
обслужить определенный запрос от ПУ, чем другие. Различие в значимости
типа запроса, требованиях быстродействия, а также трудоемкости данного
запроса требует введения приоритетных дисциплин обслуживания. В
диссертации рассмотрены основные типы фиксированных приоритетов –
абсолютный, относительный и смешанный.
В рассматриваемую подсистему с однородным доступом (рисунок 1),
имеющей приоритеты при обслуживании запросов, на вход поступает
суммарныйнеоднородныйпотокΛ,которыйхарактеризуется
интенсивностями потока 0 и 3. Так как системы массового обслуживания, а
именно «общая шина» (S1), «буфер записи» (S2) и «буфер чтения» (S3)
являются одноканальными, то расчет среднего времени ожидания и среднего
времени пребывания можно выполнить аналитически.
В случае же СМО S4 «общая память» является многоканальной
системой с приоритетным обслуживанием. Для аналитической оценки
характеристик такой системы требуются сложные теоретические выкладки,
которые, однако, не гарантирует точности при моделировании. В
диссертации предлагается усовершенствованный численный метод расчета
многоканальных приоритетных СМО на основе инвариантов отношений.
Инварианты теории массового обслуживания –соотношения, выражающиеся
определенным количеством начальных моментов распределений, при этом
используются инварианты отношений, которые базируются на условных
пропорциях для требуемых средних параметров. Алгоритм расчета
характеристик приоритетной многоканальной СМО с помощью численного
метода инварианта отношений предполагает следующие этапы.
Для начала требуется умножить показатель быстродействия канала на
число каналов, чтобы оценить быстродействие подобной одноканальной
системы
После этого определяются моменты {ωi,j} распределения времени
ожидания в многоканальной системе для всех типов запросов i, а также
порядок моментов j 1,3 в соответствии с типом приоритетной дисциплины
обслуживания. Значения суммарных потоков рассчитываются с учетом
новых дополнений согласно распределению интенсивностей потоков с
соответствующей вероятностью (рисунок 1):
j 1k
a j 1 (i p24 i 1 p34 ),
i 1
e ( p
i j 1
i24 i 1 p34 ),(5)
а средневзвешенные начальные моменты m-го порядка чистого времени
обслуживания можно найти по следующим формулам:
j 1k
a ,m 1
a ( p
i 1
i24 i 1 p34 )i ,m , e ,m 1
e ( p
i j 1
i24 i 1 p34 )i ,m .(6)
Загрузка системы запросами определяется по модернизированному
выражению:
j
(i p24 i 1 p34 )i ,1 ,(7)
i 1
После того как получены моменты распределения времени ожидания в
соответствии с дисциплиной обслуживания, выполняется следующий этап
вычислений, который заключается в том, что по средневзвешенным
моментам обслуживания и суммарной интенсивности входного потока Λ
вычисляется среднее число запросов в очереди, а также стационарное
распределение числа запросов:
(( p i 1 p34 )t )i t
pi (t ) i 24e , i 0,1….(8)
i!
Для многоканальной СМО таким же образом вычисляется вероятность
состояний при вышеописанных интенсивностях обслуживания и
рассчитываетсясредняядлинаочереди.Напоследнем этапе
пересчитываются моменты распределения времени ожидания в
многоканальной приоритетной СМО для всех i и j.
Далее рассматривается модернизированный метод математического
моделирования с целью определения вероятностно-временных характеристик
подсистемы «процессор-память» с неоднородным доступом (с локальной
распределенной памятью (рисунок 2)), учитывающий в совокупности
неоднородность приоритетного входного потока, конфликты за доступ к
ресурсам, распределение запросов в ЛП и ограничения в очередях.
У каждого ПУ имеется свой блок ЛП, часть ячеек которой может
использоваться, для других процессоров, таким образом, совместно
составляя ОП. Из источника S0 с интенсивностями 0, …, n поступают
запросы в память от nПУ. Исходя из того, что обслуженные заявки
поглощаются источником, суммарный поток Λ, состоящий из запросов на
чтение и запись от процессоров и выдачи читаемых данных из КП, поступает
на обработку ОШ (S1). Потоки же γ0, …, γn, направляются непосредственно в
один из модулей ЛП (S4, …, Sm).
Рассмотрим запрос ПУ к ЛП другого процессора. После обслуживания
в ОШ запрос направляется в специализированный КП. Если это запрос на
чтение, то он обслуживается в БЧ (S3), а если это запрос на запись, то в БЗ
(S2). Из КП запрос отправляется в один из модулей ЛП (S4, …, Sm).
P10
O1S1
0,…,n
S0Λλ1
ОШ
P31
P11
0,…,n
S2P04S4
P22O2O4
Буфер λ2P24λ4
ЛП1P40
записи
P12
λ1
P34…S0
O3S3P0mOmSm
P13
Буфер λ3P2mPm0
ЛПm
чтенияλm
P33P3m
λлпP43λ4
Pm3λm
Рисунок 2 – Схема подсистемы «процессор-память» с локальной памятью
В узлах S2, S3, S4, …, Sm из-за ограничения очередей возможна
ситуация, когда поступивший запрос, заставший очередь занятой, уходит на
дообработку. Вероятности приостановки в подсистеме обозначены как p11,
p22, p33. При этом обслуживающие приборы, в данном случае ОШ, БЧ и БЗ, не
будут формировать новый запрос, пока не отправлен и не обслужен
приостановленный. Таким образом, формируются задержки, связанные с
приостановкой обслуживания, которые характеризуются вероятностью
приостановки p11, p22, p33 и средним временем пребывания в узлах S1, S2, S3.
Если для СМО S2, S3 вероятность поступления на дообработку
рассчитывается аналогично подсистемы с ОП, то для систем S4, …,
Smвыведено новое выражение для расчета задержек перед модулями ЛП
q
n
m (1 m ) m m
k 1
m
1 k 1 k 1
m
p0 m m .
(9)
m4 1 m k 2
1 m
Время обращения ПУ в ЛП другого процессора определяется суммой
времени выдачи адреса/данных процессором τ, времен пребывания заявки в
ОШ, БЧ или БЗ, времени ожидания в очереди одного из модулей ЛП, а также
с учетом всех задержек перед системами S2, S3, S4, …, Sm. Так как перед ЛП
формируются два типа потока запросов, то время ожидания заявок из потока
n зависит от остаточного времени обслуживания запроса из потока γn
nПУ
(2)
ЛПm .(10)
Выражение для определения времени обмена ПУ в ЛП другого
процессора имеет вид
nПУ
(2)
(uБЧ qБЧ ) pЛПm
3( qОШ uОШ ) (uБЗ qБЗ ) p13 () p12
2pБЧ
tOm . (11)
N cpu
Чтобы найти время обмена ПУ с собственной ЛП достаточно
просуммировать время выдачи адреса/данных процессором и время
ожидания ЛПm запроса из потока γn:
ЛПm
t Lm .(12)
N cpu
где ЛПm определяется формулой
2БЗ(2)
3БЧ (2)
ЛПm
p2 m p3m . (13)
2(1 2БЗ ) 2(1 2БЧ )
Для нахождения времени обращения ПУ в собственную ЛП получена
формула
2БЗ (2)
3БЧ(2)
p2 m p3m
2(1 2БЗ ) 2(1 2БЧ )
t Lm .(14)
N cpu
Далее описывается подсистема «процессор-память» с ЛП, на вход
которой поступает неоднородный приоритетный поток запросов.
Приоритеты зависят от типа запроса и его направления. Приоритеты
суммарного входного потока запросов Λ можно разделить на три класса.
Наивысшим приоритетом обладает поток, формируемый БЧ на выдачу
читаемых данных 3p31= 1+ 2+ … + R. В свою очередь поток запросов,
формируемый ПУ, содержит в себе запросы оставшихся двух классов, т.е.
0= 02+ 01, где 02= 1+ 2+ … + W – классы запросов на запись формируемые
процессорами в зависимости от приоритетности решаемой задачи и имеют
второй уровень приоритета, 01= 1+ 2+…+ R – классы запросов на чтение,
обладающие низшим классом приоритета.
На входе СМО, представляющей БЗ, формируется неоднородный поток
запросов на запись 1 с вероятностью p12, имеющий только приоритет
ПУ 1p12= 1+ 2+…+ W. Для БЧ классы потоков распределяются несколько
иначе. Высшим приоритетом будет обладать класс запросов, приходящих от
модулей ЛП ЛП= 4+ 5+…+ m, где имеются классы приоритетов для
запрашиваемых ПУ. Вторым по уровню приоритета потоком являются
непосредственно запросы на чтение от ОШ с соответствующей вероятностью
перехода 1p13= 1+ 2+ … + R.
При назначении классов приоритета для модулей ЛП наивысший
приоритет приписывается запросам из суммарного потока Λ (случай, когда
процессор обращается в общее адресное пространство). При этом запрос на
запись получает первый уровень приоритета, т.е. 2p2m= 1+ 2+ … + W, вторым
приоритетом обслуживается запрос на чтение данных 3p3m= 1+ 2+…+ R.
Запросы из суммарного потокадля первого и последующих модулей
относятся к третьему и четвертому классам приоритета, это запросы на
запись wp0m= γ 1+ γ 2+ … + γW и чтение ПУ в свою ЛП Rp0m= γ 1+ γ 2+ … + γR.
Время обмена вычисляется согласно полученным вероятностно-
временным характеристикам в зависимости от приоритетной дисциплины
обслуживания. Например, выражение времени обмена ПУ с ЛП другого
процессора с относительными приоритетами выглядит следующим образом:
ОтнП
uБЧpЛПm
3( uОШ ЛП ) uБЗ p24 (
ОтнПОтнПОтнП
) p23
pБЧ
tOm ,(15)
N cpu
где τ – время выдачи адреса/данных на ОШ процессором, pЛПm – вероятность
того, что данные находятся в одном из модулей ЛП, pБЧ – вероятность того,
что данные находятся в БЧ, ЛП – среднее время ожидания в очереди перед
ОтнП
модулем ЛП.
Для вычисления продолжительности обмена ПУ с собственной ЛП
предложено выражение
ЛП W p2 m ЛП R p3m
ОтнПОтнП
t Lm .(16)
N cpu
Разработанный математический метод моделирования задержек и
времени обмена учитывает в совокупности неоднородность приоритетного
входного потока, распределение запросов в ЛП, ограничения в очередях и
конфликты за доступ к ресурсам и позволяет уточнить вероятностно-
временные характеристики, задержки, а также время обмена между
процессором и модулями ЛП.
В третьем разделе представлено описание разработанного проблемно-
ориентированного комплекса программ для моделирования вероятностно-
временных характеристик и задержек перед узлами подсистемы «процессор-
память», а также времени обмена процессора с модулями памяти. В
разработанный комплекс входят следующие основные программные модули.
Первый модуль – это программа для вычисления вероятностно-временных
параметров разомкнутой сети массового обслуживания (РСеМО) для
определения параметров функционирования подсистемы в составе МнПС.
На рисунке 3 отображены UML-диаграммы программы для расчета
вероятностно-временных характеристик подсистемы «процессор-память».
Запуск вычисления веротяностно-
Определение архитектурыВычисление веротяностно-временыхВвод типа доступа к памяти
временных характеристик СМО
подсистемы и ввод параметров СМОхарактеристик СМО
Сумма матрицы
Ввод входной интенсивности, для каждой
по строкам ≠1
СМО – тип обслуживания, тип очереди,Сообщить об ошибке
Проверка введенных параметров наСоздание отчета в виде таблицы ичисло каналов, времена обслуживания
предельные значенияпостроение графика
Сумма матрицы
по строкам =1
Ввод изменяемых воздействий –Загрузка
число ПУ, ОП, ср. время работы ОПСМО >1
Сообщить об ошибке
Анализ планируемых вычислений
Загрузка
СМО <1
Вычисление
Рисунок 3 – UML-диаграммы программы для расчета вероятностно-
временных характеристик подсистемы «процессор-память»
Программа для вычисления вероятностно-временных характеристик
РСеМО позволяет вводить исходную информацию и после ее обработки
вывести полученный результат в виде графиков зависимостей и сохранить в
табличном формате, а также произвести анализ характеристик узлов
подсистемы«процессор-память».Впрограммереализованы
модернизированныеметодыматематическогомоделированияи
усовершенствованный численный метод, что обеспечивает расчет
вероятностно-временных характеристик одноканальных и многоканальных
СМО с учетом приоритетных дисциплин обслуживания и ограничением на
число мест в очереди.
На рисунке 4 изображены UML-диаграммы второго модуля –
программы для измерения временных задержек узлов и времени обмена в
подсистеме «процессор-память».
Разработанная программа для расчета задержек перед узлами
подсистемы «процессор-память» и времени обмена от процессора к модулям
памяти, позволяет получить временные параметры при изменении структуры
самой подсистемы. Основные показатели, которые рассчитываются в
программевычислениявероятностно-временныххарактеристик,
выгружаются в программу расчета задержек и времени обмена. Расчет
задержек и времени обмена основан на модернизированных методах
математического моделирования, что позволяет оценить процессы,
происходящие внутри подсистемы «процессор-память», провести анализ для
устранения «узких мест», определить архитектуру подсистемы и выбрать тип
памяти.
Вычисление вероятностно-
Определение архитектуры
временных характеристик СМО или
подсистемы и ввод параметров СМО
ввести вручную
Проверка введенных параметров наВвод входных данных для расчетаСоздание отчета в виде таблицы и
предельные значениязадержки или времени обменапостроение графика
Анализ планируемых вычисленийВычисление задержки или времени
обмена
Вычисленные
вероятностно-временные
характеристики СМО
Выгрузка результатов вычисления
характеристик СМО или ввод
вручную
Выгрузка результатов вычисления
Запуск вычисления задержекзадержек перед узлами подсистемы
или ввод вручную
Расчет
однородный
Формирование результатов в видедоступВвод дополнительных параметров
таблицы и графикадля вычисления времени обмена
Расчет
неоднородный
доступ
Расчет для локальной памятиРасчет для общей памяти
Ввод дополнительных параметровВвод дополнительных параметров
для вычисления времени обмена вдля вычисления времени обмена в
локальную памятьобщую память
Запуск вычисления времени обмена
Формирование результатов в виде
таблицы и графика
Рисунок 4 – UML-диаграммы программы для измерения временных задержек
узлов и времени обмена в подсистеме «процессор-память».
В четвертом разделе представлены результаты моделирования
подсистем «процессор-память» на основе модернизированного метода
математического моделирования и усовершенствованного численного
метода. Чтобы проверить на адекватность разработанный метод
математического моделирования и численный метод, проведена
сравнительная оценка полученных результатов с тестовыми данными
существующих подсистем «процессор-память». Основной оценочной
характеристикой обмена процессора с памятью является пропускная
способность – количество данных, передаваемых за единицу времени. Для
сравнительного анализа выбраны результаты измерений пропускной
способности МнПС CrayT3E-1200 с архитектурой типа UMA, и
SGI_Origin2000-300 с архитектурой типа NUMA.
Пропускная способность исследуемых подсистем «процессор-память»
представлена в виде графиков на рисунках 5, 6, где «баз» – базовый метод
моделирования, «огр» – модернизированный метод математического
моделирования с ограничением очередей, «отн» – модернизированный метод
математического моделирования и усовершенствованный численный метод с
относительными приоритетами, «абс» – модернизированный метод
математического моделирования и усовершенствованный численный метод с
абсолютными приоритетами, «смш» – модернизированный метод
математического моделирования и усовершенствованный численный метод
со смешанными приоритетами.
Показатели качества регрессионного анализа пропускной способности
подсистемы, полученные базовым методом моделирования, относительно
пропускной способности эмпирических данных, не прошли проверку, потому
как средняя ошибка аппроксимации составила 23,55816%, а значение
средней квадратической ошибки уравнения регрессии (1837,487011) больше,
чем значение среднего квадратического отклонения эмпирических данных
(1591,31043), что приводит к погрешности вычисления вероятностно-
временных характеристик.
Рисунок 5 – Сравнение значений пропускной способности подсистемы
«процессор-память» типа UMAмежду эмпирическими данными и
результатами разработанного, численного и базового методов моделирования
Рисунок 6– Сравнение значений пропускной способности подсистемы
«процессор-память» типа NUMA между эмпирическими данными и
результатами разработанного и базового методов моделирования.
Результаты, полученные модернизированными математическими
методами моделирования, прошли проверку показателей качества
регрессионного анализа относительно эмпирических данных. Например,
коэффициенты корреляции у всех типов полученных данных близки к
единице (подтверждает тесноту связи с эмпирическими данными), а средняя
ошибка аппроксимации для методов, в которых применяются приоритетные
дисциплины обслуживания, не превышает 10% (от 4,4 % до 6,3 %), что
свидетельствует об адекватности предлагаемых методов моделирования.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Модернизирован метод математического моделирования подсистемы
«процессор-память» с однородным доступом, который в отличие
существующих методов учитывает задержки, связанные с конфликтом за
доступ к общей шине, ограничения числа мест в очередях обслуживающих
устройств, а также с неоднородным доступом, который учитывает задержки
пересылки данных из одного процессора в адресное пространство другого
процессора, а также приоритеты запросов на обслуживание и ограничения
числа мест в очередях перед блоком буферизации данных. Предлагаемые
методы позволяют повысить точность измерения вероятностно-временных
характеристик и времени обмена, и на этой основе улучшить параметры
производительности многопроцессорных систем.
2. Обоснован и разработан эффективный численный метод расчета
вероятностно-временных характеристик многоканальных систем массового
обслуживания, основанный на инвариантах теории очередей, учитывающий
особенности распределения интенсивностей потоков и моментов
обслуживания в подсистемах «процессор-память», применение которого
позволяет уточнить характеристики среднего времени ожидания и
пребывания многоканальных приоритетных систем массового обслуживания.
3. Разработан комплекс проблемно-ориентированных программ,
реализующих модернизированные методы математического моделирования,
а также усовершенствованный численный метод инвариантов теории
очередей для исследования подсистем «процессор-память». Комплекс
программ учитывает в совокупности конфликты за доступ к ресурсам
подсистемы, приоритеты запросов, ограничения в очередях, а также
распределение интенсивностей потоков и моментов обслуживания в
приоритетных многоканальных системах массового обслуживания, что
позволяет повысить точность измерения параметров задержек, времени
обмена данных между процессором и памятью.
4. С помощью разработанного комплекса проблемно-ориентированных
программвыполненомоделированиевероятностно-временных
характеристик подсистем «процессор-память», в результате которого
получены численные оценки вероятностно-временных характеристик и
времени обмена, что позволяет произвести комплексную оценку их влияния
на производительность, пропускную способность подсистем «процессор-
память» и многопроцессорные системы в целом.
Быстродействие подсистем «процессор-память» определяет
производительность многопроцессорных систем (МнПС) в целом.
Следовательно, важной задачей при проектировании МнПС является
увеличение пропускной способности подсистемы «процессор-память» –
уменьшение времени задержки распространения сигналов между узлами
подсистемы в процессе обмена данными. Данные задержки влияют на время
обмена между процессором и памятью, по которому можно определить
параметры пропускной способности.
Задержки сигналов зависят в основном от вероятностно-временных
характеристик общих ресурсов системы, таких как общая шина (ОШ),
оперативная (общая) память (ОП), каналы обслуживания и т.д. Например,
распределение потоков в ОШ может привести к возникновению задержек,
т.к. при большой загрузке шины, когда несколько процессоров одновременно
пытаются занять ее, получить к ней доступ, работу продолжит только одно
устройство, тогда как другие процессоры будут вынуждены приостановить
работу и перейти в режим ожидания, пока шина не освободится. В этой связи
для выявления так называемых «узких мест», вызывающих временные
потери при обмене данными между процессором и памятью, требуется
исследование архитектурных особенностей подсистемы «процессор-память»
МнПС на системном этапе проектирования.
Для того, чтобы получить вероятностно-временные характеристики
исследуемых подсистем, не прибегая к построению реальных образцов и
макетов, применяют различные методы математического моделирования, среди
которых в настоящее время широко применяется два из них – макроанализ и
микроанализ. Макроанализ необходим для определения конфигурации МнПС в
целом. Микроанализ требуется для исследования характеристик отдельных узлов
МнПС, где подсистема «процессор-память» как раз и является таким узлом.
Для проведения микроанализа МнПС в последнее время широко
распространился инструмент моделирования на основе теории систем и сетей
массового обслуживания (СМО и СеМО), где обслуживающими
устройствами являются узлы подсистемы «процессор-память» (например,
ОШ, контроллер памяти (КП), ОП), а входными потоками – запросы на
чтение или запись информации.
Первые работы по теории массового обслуживания (ТМО) появились
еще в 50-60 г. прошлого века. Однако примерно с 1972 года методы
математического моделирования на основе СМО и СеМО, стали применятся
для анализа МнПС. Значительный вклад в развитие методов моделирования
на основе ТМО для МнПС внесли Л. Клейнрок, Х. Таха, Н. Джейсуол,
Лоскутов А.В., Огунладе Темитопе Олу, Д. Ороско, Э. Гарсия, Р. Хан А.Д.
Хомоненко, С.А. Майоров, В.М. Вишневский, Ю.И. Рыжиков, Б.В. Гнеденко,
Т.И. Алиев, А.Я. Хинчин, Е.С. Вентцель, Р.А. Бикташев и др.
Однако ряд факторов, таких как конфликты за доступ к ресурсам,
случайный характер процесса обмена данными между процессорами и
памятью, а также приоритетность и неоднородность входного потока
запросов не учитываются в совокупности при исследовании МнПС, что не
позволяет провести точную оценку влияющих на производительность МнПС
вероятностно-временных характеристик. Следовательно, требуется
модернизация существующих методов математического моделирования
подсистем «процессор-память» МнПС, а также реализация алгоритмов их
функционирования в виде проблемно-ориентированных программ. Решение
названной задачи позволит путем моделирования уточнить вероятностно-
временные характеристики, получить необходимые статистические данные
по свойствам различных комбинаций архитектур подсистем, сократить сроки
проектирования МнПС, а также, как следствие, снизить ресурсные затраты
на проектирование. Исходя из вышеизложенного, тема диссертационного
исследования, направленного на совершенствование методов
математического моделирования подсистем «процессор-память» МнПС с
применением положений ТМО, является актуальной.
Объект исследования – подсистемы «процессор-память» в
специализированных многопроцессорных системах.
Предмет исследования – вероятностно-временные характеристики
основных узлов подсистем «процессор-память» МнПС, представленных в
виде приоритетных СеМО с ограниченным числом мест в очередях.
Цель настоящей работы – повышение производительности подсистемы
«процессор-память» МнПС путем совершенствования ее архитектуры с
учетом задержек и вероятностно-временных характеристик, полученных
путем математического моделирования с применением ТМО.
Для достижения поставленной цели в работе решаются следующие задачи:
1) развитие методов математического моделирования вероятностно-
временных характеристик подсистем «процессор-память» МнПС, основанных
на положениях теории приоритетных СМО с конечным числом мест в очереди.
2) обоснование эффективного численного метода расчета вероятностно-
временных параметров подсистем «процессор-память» МнПС и его
усовершенствование с учетом приоритетного класса запроса доступа к ОП;
3) реализация проблемно-ориентированного программного комплекса
для исследования подсистем «процессор-память» МнПС и моделирования
основных вероятностно-временных характеристик, задержек и времени
обмена с применением приоритетных разомкнутых СеМО;
4) экспериментальная проверка эффективности разработанных
комплекса программ, алгоритмов и методов математического
моделирования, путем моделирования основных вероятностно-временных
характеристик и времени обмена подсистем «процессор-память» МнПС.
Методы исследований. Для решения поставленных задач в
диссертационной работе применяются методы численного моделирования,
теории массового обслуживания, системного анализа, теории вероятностей и
математической статистики, регрессионно-корреляционного анализа,
методики планирования эксперимента.
Научная новизна работы состоит в следующем.
1. Модернизирован метод математического моделирования и расчета
вероятностно-временных характеристик подсистемы «процессор-память»
МнПС при однородном и неоднородном доступе к памяти, основанный на
ТМО, отличающийся от известных учетом задержек, обусловленных
конфликтами за доступ к ресурсам подсистемы, приоритетами запросов и
ограничениями в очередях, что позволяет более точно оценить вероятностно-
временные характеристики и время обмена данными и повысить на этой
основе производительность МнПС.
2. Разработан численный метод инвариантов теории очередей для
расчета вероятностно-временных характеристик приоритетных
многоканальных СМО. Метод отличается от известных тем, что учитывает
особенности распределения интенсивностей потоков и моментов
обслуживания в подсистемах «процессор-память» МнПС, его применение
позволяет уточнить характеристики среднего времени ожидания и
пребывания многоканальных приоритетных СМО.
3. Разработан комплекс проблемно-ориентированных программ для
расчета вероятностно-временных характеристик, задержек и времени обмена
в подсистемах «процессор-память» МнПС, реализующий
модернизированные методы математического моделирования и алгоритм
вычислений, что обеспечивает определение показателей производительности
МнПС с учетом задержек и особенностей распределения интенсивностей
потоков и моментов обслуживания в приоритетных многоканальных СМО.
4. В результате моделирования подсистем «процессор-память» МнПС
выявлены закономерности, учитывающие конфликты за доступ к ресурсам,
распределение интенсивностей потоков и моментов обслуживания
приоритетных СМО, выработаны рекомендации по повышению
производительности подсистемы «процессор-память» и МнПС в целом.
Соответствие паспорту научной специальности.
Исследование, представленное в диссертационной работе, соответствует
паспорту специальности 05.13.18 – математическое моделирование,
Помогаем с подготовкой сопроводительных документов
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!