Оглавление
Стр. Введение
Глава 1
1.1
1.2 1.3
Обзор основных подходов к динамической верификации
программногообеспечения
Основные представления и логики, используемой при моделированиисвойствпрограмм
Методы,использующиеабстракциюмодели . . . . . . . . . . . .
Индуктивные методы доказательства свойств . . . . . . . . . . . .
1.3.1 Базовые подходы к индуктивному доказательству . . . . .
1.3.2 k-индукция
1.3.3 Подходы к улучшению генерализации выражений . . . . .
1.3.4 IC3
1.3.5 Расширения методов абстрактной индукции . . . . . . . .
1.3.6 Адаптация индуктивных методов
кмоделированиюпрограмм
Направленноетестирование
1.4.1 Вариации применения направленного тестирования . . . .
Выводыпоглаве1ипостановказадачи
Методы ускорения направленного тестирования,
использующие ограничение повторных обходов ветвей кода
Введение в принцип ограничения реальтернаций . . . . . . . . . . Базовые эксперименты с ограничением реальтернаций . . . . .
2.2.1 Сопоставление с ранним исследованием . . . . . . . . . . Влияние циклов в программе на эффективность метода . . . . . . Учетконтекставызовов
Ослабление ограничения реальтернаций на основе анализа зависимостейданных
2.5.1 Представление информации о траекториях
выполненияпрограммы
2.5.2 Описание алгоритма учёта зависимостей . . . . . . . . . .
Глава 3
Стр
.5.3 Результатыпримененияалгоритма . . . . . . . . . . . . . .102
2.5.4 Выводыпоглаве2……………………103
Быстрый алгоритм нахождения доступных вершин графа
управления при ограничениях траекторий . . . . . . . . . . .
Введениевзадачу ……………………….105 Альтернативная постановка задачи. Функции доступности D и ξ.
Предварительные замечания по вычислению D . . . . . . . . . .
Репрезентативныеструктуры………………….111 Использование остовных деревьев для оптимизации вычисления ε
Вычисление интервалов вершин в архитектуре планирования тестов118 Использование «запасных» двоичных деревьев . . . . . . . . . . .
Выравниваниедвоичныхдеревьев……………….123 Вычислениемножеств«внешних»узлов . . . . . . . . . . . . . . .123
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10Обработкавызововфункций ………………….126 3.11 Замечанияпоинтеграцииалгоритма. . . . . . . . . . . . . . . . . .129 3.12Моделирование ………………………..130
3.13
3.14
Глава 4
4.1
4.2
3.12.1 Разборщик(Parser) …………………..130 3.12.2 Преобразователь интерфейса исключений . . . . . . . . .
3.12.3 Вычислениеξвграфе………………….134 Эксперименты . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.13.1 Эффективностьпоиска …………………138 3.13.2 Сравнениетиповочередей ……………….142 3.13.3 Сравнение эффективности контейнеров (куч) . . . . . . .
Выводы по главе 3 . . . . . . . . . . . . . . . . . . . . . . . . . . .
Алгоритмы реконструкции графа управления на основе
трасс событий . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Алгоритмпостроенияавтомата…………………146 4.1.1 Мотивация……………………….146 4.1.2 Введение в алгоритм построения автомата . . . . . . . . .
4.1.3 Архитектура………………………150 Результатытестированияалгоритма………………155
4.3 Использование регулярных выражений для обобщения последовательностей ……………………..160
4.3.1 Представление исходного ациклического графа для
построениярегулярныхвыражений . . . . . . . . . . . . . .163
4.3.2 Алгоритмветвящегосявыравнивания . . . . . . . . . . . .
4.3.3 Поискповторов …………………….170
4.3.4 Выводыпоглаве4……………………172
Списоксокращенийиусловныхобозначений . . . . . . . . . . . . . . . .179 Словарьтерминов …………………………..181 Списоклитературы ………………………….182 Списокрисунков ……………………………203 Списоктаблиц …………………………….206

Во введении обоснована актуальность задач диссертационного исследо-
вания и кратко характеризуются предложенные автором решения. Активное
развитие аппаратно-программных решений и сложных интегрированных при-
ложений, происходящее в последние годы, значительно повысило требования
к качеству программного кода. Существующие методы и средства верифика-
ции и тестирования программ уже не позволяют гарантировать обнаружение
некорректности за приемлемое время. В целом, можно выделить два больших
класса подходов к верификации: формальную и динамическую. Первая подра-
зумевает формальное рассмотрение возможных сценариев работы программы,
представленной в виде модели, без её фактического исполнения. Достоин-
ством формальной верификации является теоретическая полнота покрытия всех
возможных ситуаций. Главными её недостатками является высокая вычисли-
тельная сложность. Динамическая верификация основана на тестировании, то
есть реальном исполнении программы с теми или иными входными данными
(стимулами) и автоматизированным наблюдении за процессом и результатами её
работы. Несмотря на сравнительно малую ресурсоёмкость и трудоёмкость, такой
подход имеет принципиальный недостаток – даже большое число разнообраз-
ных тестов не может гарантировать обнаружение всех типов сценариев, ведущих
к ошибкам.
Направленное тестирование сочетает достоинства формального и ди-
намического подхода. С одной стороны, оно подразумевает непосредственное
исполнение программы, а с другой – автоматическое планирование вариантов
последующих запусков теста на основе наблюдения за потоком управления
в программе при исполнении предыдущих запусков, а также на основе (возмож-
но, неполной) математической модели программы. Настоящая диссертационная
работа посвящена исследованию усовершенствований эвристических подходов
к ограничению набора планируемых траекторий при направленном тестирова-
нии программных систем без существенного снижения покрытия ветвей кода
тестами. Кроме тестирования ПО, предлагаемые подходы могут применяться
для исследования широкого класса моделей, описывающих многовариантные
последовательности событий (сценарии).
В первой главе рассматриваются основные направления исследований
и разработок в области верификации и тестирования дискретных систем в це-
лом и программ в частности, в основе которых лежит поиск контрпримеров
с помощью решения уравнений относительно входных переменных. Вначале
представлены методы абстракции, в которых реальное поведение сложной си-
стемы заменяется обобщениями, как правило, в виде гиперкубов в многомерном
пространстве значений входных переменных. Выбор таких кубов в современных
средствах верификации происходит итеративно на основе двух встречно на-
правленных конкурирующих процессов: абстракции и детализации (refinement).
Другим направлением упрощения верификации соблюдения требуемых свойств
x:=0

покрытие ветвей кода, %
y:=03

51015
a≠0
да05
нетx:=c10

да
b≠020
нетy:=x
ошибка
да25 ∞
y=350

010002000
нет
время тестирования, с

Рис. 1 –– Пример программы,Рис. 2 –– Зависимость скорости покрытия
требующей перебораветвей от квоты реальтернаций. Крестиками
направлений условныхобозначено завершение тестов, кружками –
переходовисчерпание лимита времени

системы является построение индуктивных инвариантов. Таким инвариантом
называют выражение, которое (1) соблюдается в начальный момент работы
тестируемой системы и (2) соблюдается в момент i в предположении, что оно со-
блюдалось в предшествующий момент i − 1. Индуктивные методы, как правило,
более эффективны, чем непосредственное пошаговое моделирование абстра-
гированного поведения системы, в основном благодаря меньшему количеству
рассматриваемых шагов во времени. Самые эффективные алгоритмы такого ти-
па (IC3 – Incremental Construction of Inductive Clauses for Indubitable Correctness
– и его варианты) применяют итеративный процесс абстракции и уточнения не
к единственному выражению инварианта (индуктивно верному для любого но-
мера шага), а к набору отдельных инвариантов для каждого шага в диапазоне
0..k. Благодаря «встречному» поиску усиления инварианта (1) возможного раз-
вития состояния системы за i шагов и (2) некоторого условия, не приводящее за
k − i шагов к опровержению самого себя, число исследуемых вариантов сокра-
щается, и ответ достигается быстрее.

Наконец, рассматриваются формально-динамическое и динамические ме-
тоды, объединенные идеей наблюдения за (реальным или симулируемым) пове-
дением тестируемой программы при различных вариантах входных стимулов.
Стратегии тестирования делятся на поведенческие и структурные . Первые рас-
сматривают тестируемый объект как «чёрный ящик», вторые же опираются на
знание внутренней логики объекта. Направленное тестирование стремится гар-
монично сочетать два перечисленных подхода. Например, основополагающая
идея метода DART (Directed Automated Random Testing) состоит в целена-
правленном изменении направления одного условного перехода по сравнению
с траекторией одного из предшествующих запусков. Для этого программа ин-
струментируется средствами, позволяющими наблюдать и документировать её
выполнение одновременно в конкретном и символическом виде (такое представ-
ление обозначается термином concolic, от “concrete” + “symbolic”).
Несмотря на различия подходов, упомянутых в обзоре, можно заметить,
что фокус оптимизации обычно направлен на решение статической системы
уравнений, описывающей тестируемую систему. Влияние многовариантности
самой системы, вызванной различными присваиваниями внутренних перемен-
ных программы, обычно рассматривается на уровне перебора комбинаций.1
Поскольку количество комбинаций такого перебора выходит за пределы вычис-
лительных возможностей для большинства реальных программ, предлагаются
различные эвристики для его ограничения. Наиболее системным и коррект-
ным решением является построение абстрактного дерева достижимости (ART –
Abstract reachability tree), в котором различные состояния выполнения програм-
мы с одинаковыми инвариантами (и только они) в идеальном случае сливаются
в одно состояние . Подобные идеи применяются и в рамках DART . В данном
классе решений можно найти ряд недостатков, адресованных в настоящем дис-
сертационном исследовании.
Вторая глава посвящена исследованию ускорения тестирования про-
грамм за счёт сокращения повторных обходов (реальтернаций) ветвей
условных переходов.
«Базовый» алгоритм направленного динамического тестирования исполь-
зует перебор по возможности всех путей выполнения программы. Такая необ-
ходимость вызвана тем, что условия переходов могут прямо или косвенно
содержать переменные, присваиваемые в коде, выполняемом или опускаемом
в зависимости от выбора направлений предшествующих переходов. Поэтому
символьный вид выражения условия может зависеть от предыдущих переходов,
отчего ветвь, недоступная при одном пути выполнения, может оказаться доступ-
ной при каком-либо другом. На рис. 1 показан простейший пример такого рода.
Если в первом запуске теста были выбраны значения x = 0, y = 1, а во втором –
x = 0, y = 1, зависимость условия ошибки от y не прослеживается, отчего ветвь
с ошибкой кажется недоступной (ее условие при x = 0 будет всегда ложно); все
остальные ветви успешно покрыты, поэтому тест выглядит успешно завершён-
ным. Только перебор всех четырёх комбинаций (x,y) даёт возможность найти
ошибку (при x = 1, y = 1). Хотя метод полного перебора путей универсален, его
сложность экспоненциальна относительно длины пути, что практически означа-
ет необходимость ограничения области поиска.

1 Это исторически связано с тем, что средства верификации изначально создавались для аппарат-

ных систем и лишь впоследствии адаптировались для ПО.
В основе предлагаемой автором стратегии ограничения лежит гипотеза
о том, что для покрытия всех достижимых ветвей или создания ситуации в про-
грамме, выявляющей ошибку, достаточно изменить сравнительно небольшое
число условий переходов. Иными словами, цепочки зависимостей, подобные
изображённой на рис. 1, обычно включают в себя лишь небольшое количе-
ство переходов. Хотя выделение таких цепочек формальными методами в общем
случае весьма сложно, предположение об ограниченности их размера позво-
ляет свести число итераций поиска к полиномиальному относительно размера
программы вместо экспоненциального, ограничив число переходов, участвую-
щих в полном переборе, некоторым параметром Q. Технически это выражается
в ограничении числа планируемых направлений, отличных от направлений,
наблюдаемых при первом выполнении каждого соответствующего перехода
в рамках серии тестов. Квота не включает первичные посещения ветвей, так
как такие посещения непосредственно увеличивают покрытие; отсюда название
«ограничение реальтернаций».
«Строгое» ограничение числа реальтернаций константным параметром
представляет собой простейший (но наиболее интересный для исследования)
случай. Поскольку требуемое значение Q для ожидаемой полноты тестирова-
ния заранее неизвестно, целесообразно использовать приоритизацию тестов по
числу реальтернаций q (тесты с меньшим q выполняются в первую очередь). Сле-
дующим шагом является исследование оптимизации распределения повторных
обходов. В случае равномерного распределения (который был выбран в качестве
базового) достаточно применять к планируемым комбинациям переходов слу-
чайный фильтр с вероятностью (Q/A)q , где A – число возможных переходов, обе
ветви которых посещались. Альтернативные методы распределения повторных
обходов предполагали их концентрацию в корневой либо периферийных обла-
стях дерева ветвлений. Эксперименты показывают, что покрытие ветвей втором
случае в 96% случаев не снижается, хотя сложность поиска становится линей-
ной по отношению к размеру программы. Приемлемым компромиссом оказалось
равномерное распределение h = 1..2 реальтернаций при концентрации остав-
шейся квоты в хвосте траектории. Уже при h = 1, Q = 15 все доступные ветви
в тестовой подборке программ были покрыты. Заметим, что, хотя теоретиче-
ски порядок сложности тестирования может достигать N h˙2q , на практике из-за
неудовлетворимости условий большинства планируемых путей выполнения на-
блюдается «сжатие показателя»: N αh˙2αQ , α ≈ 0.35. На рис. 2 показан пример
покрытия ветвей кода в зависимости от времени теста.
Ветвления, выполняемые в различных итерациях тела цикла (в том числе
условный переход к следующей итерации) в базовом алгоритме DART считаются
различными условными переходами. В результате вся доступная квота реаль-
тернаций может быть израсходована в пределах небольшого числа инструкций
исходного кода. Автор предлагает эвристически ограничить число различимых
контекстов для каждого перехода в коде. Для цикла это может означать рас-
смотрение первых m итераций и одной итерации с «экстремально» большим
номером в качестве кандидатов для реальтернаций переходов.2 Стек вызовов
функций также порождает множественные контексты для одних и тех же ветв-
лений в исходном коде. Случай рекурсивного вызова по существу не отличается
от вышеупомянутого случая цикла. В общем случае автором предложено огра-
ничивать размер рассматриваемого фрагмента стека несколькими вершинными
элементами (относительно перехода, направление которого выбирается). Те-
стирование реальных примеров показало, что выбор такого числа равным 5
обеспечивает более 99.6% покрытия ветвей от возможного.
Однако такие агностические по отношению к зависимостям по данным
эвристики неизбежно допускают избыточные комбинации планируемых пере-
ходов, многократно превосходящие своим числом комбинации, существенные
для полноты покрытия ветвей. Теоретически, необходимо комбинировать ре-
альтернации только тогда, когда в результате возможно возникновение нового
символического выражения для условия перехода к ещё не покрытой ветви. Од-
нако в общем случае такая зависимость выявляется с низкой точностью. Автором
предложено использовать выявленные зависимости для регулирования разре-
шенного числа реальтернаций: для комбинаций предположительно независимых
переходов применяется меньшая квота Qi , а для зависимых – увеличенная Qd .
Эмпирически, для текущего тестирования средней программ-утилиты можно ре-
комендовать Qt ≈ 25 . . . 30, Qd ≈ 45 − 50.
Третья глава посвящена постановке и решению задачи о целесообразно-
сти альтернации единичного условного перехода.
Информация о зависимостях условий переходов от присваиваний перемен-
ных может быть достаточно легко получена в процессе тестирования, например,
путем одновременного динамического мониторинга доступа к адресам памяти
для чтения или записи данных и позиции в исполняемом коде. Однако, исполь-
зование таких зависимостей при планировании тестов сопряжено с проблемой
сложности – нужно обеспечить быстрый поиск точек ветвлений в графе управле-
ния, изменение порядка прохода которых потоком управления может приводить
к существенному для тестирования изменению символической формы вычисля-
емых в программе выражений, являющихся условиями переходов. Обозначим
вершины графа управления, посещение которых влияет на интересующие усло-
вия, как v1, v2 и т.д. Тогда планируемая траектория представляется в виде
отрезков S1, S2 и т.д., каждый из которых содержит соответствующую вершину
v и произвольное множество вершин, не принадлежащих последовательности R
и не влияющих на условия переходов:

T = [S1 ,S2 , . . . ], Si = [vi, x∗ ],(1)

2 Обычно нескольких первых итераций достаточно для выявления всех сценариев основного ал-

горитма тестируемой программы. Рассмотрение итерации с большим номером («много») позволяет
наблюдать реакцию программы на исчерпание каких-либо ресурсов, например, выделение новых
диапазонов индексов или участков памяти, сбор мусора.
а)
y’
yr1
y ’’
v2

б)
y’
yv2
y ’’r1

Рис. 3 –– Пример принятия решений о целесообразности (а) и необязательности
(б) альтернации

где V = {v1 , v2 , . . . }, R = {r1 , r2 , . . . } содержат вершины, влияющие через
присвоения на условия «интересных» ветвлений и еще не исследованные в та-
кой комбинации; x∗ – произвольная последовательность вершин, не входящих ни
в V , ни в R.
Теперь можно сформулировать «атомарную» задачу планирования пути:
имея целью посещение последовательности вершин v1 , v2 и т.д., следует ли
форсировать посещение ветви условного перехода, ведущей из вершины yi в вер-
шину yi0 при альтернативе y 00 ? Пусть D(v + ,V − ) –- функция на графе управления,
возвращающая множество вершин, доступных из v + по путям, не проходящим
через вершины из множества V − . Тогда утверждение «необходимо посетить yj0 »
эквивалентно выражению
vi+1 ∈ ξ(y 0 ,y 00 ,R)

ξ(y 0 ,y 00 ,R) ≡ D(y 0 ,R) D(y 00 ,R)(2)

На рис. 3 показаны примеры такой задачи о необходимости альтернации
перехода в вершине y. На верхнем рисунке альтернация (показанная жирной
пунктирной стрелкой) необходима, так как, следуя ретроспективной траектории,
показанной сплошными жирными стрелками, невозможно попасть в «интерес-
ную» вершину v2 , минуя «запрещённую» вершину r1 . На нижнем рисунке это
сделать можно независимо от выбора направления перехода в вершине y.
В практике анализа и компиляции программ широко применяется пред-
ставление участков графа управления программы в виде иерархии вложенных
гамаков. Такое представление помогает значительно упростить вычисление D.
ε = {1}
ε= ∅I ={2..5}
I ={1..8}
1ε = {4,5}
I ={6..8}
ε = {4}
I ={5}26ε = {4,5}
I ={7}
ε = {1}
I ={3..4}
358ε = {4,6}
7I ={8}

ε=∅
I ={4}
Рис. 4 –– Пример аннотирования графа управления

Однако, поскольку в реальных программах «идеальная» структура гамаков ис-
кажена (сравнительно малочисленными) передачами управления вовне гамака
(например, выход цикла в произвольной точке его тела или обработка исключе-
ния), в диссертационной работе предлагается использовать для представления
блоков кода квазигамаки, в которых, в отличие от гамаков, допускается более
одной выходной вершины. Назначение квазигамаков производится с помощью
остовного дерева. Экспериментальное подтверждение гипотезы об эффективно-
сти такого представления являлось одной из целей настоящего исследования.
В предлагаемом алгоритме вычисления D множество R(x) всех доступ-
ных из вершины x вершин графа управления распадается на два подмножества:
R(x) = I(x)∪ (x), где I(x) – множество узлов, содержащихся в конусе остовного
дерева со входной вершиной x; – множество узлов, не принадлежащих данному
конусу, соединенных входящим рёбрами хотя бы с одной вершиной, принадле-
жащей данному конусу.
Чтобы избежать увеличения сложности, связанного с несбалансированно-
стью остовного дерева, предлагается использовать дополнительное диадическое
дерево, построенное для полученной сортировки графа управления остов-
ным деревом. Обращение к диадическому дереву, которое гарантированно
сбалансировано, происходит только при наличии в конусе остовного дерева
«запрещённых» вершин, то есть членов множества V − . Для уменьшения числа
рассматриваемых интервалов диадического дерева оказалось целесообразным
частично выравнивать последнее с остовным деревом, допуская для этого огра-
ниченный дисбаланс.
Вычисление и хранение отдельных контейнеров для множеств внешних
вершин-получателей каждого конуса дерева внесло бы сложность порядка O(K ∗
N ) по времени и по размеру памяти, где K – средний размер множества, N –
число вершин. Чтобы уменьшить сложность до O(N log(K)), применяется куча
число итераций поиска
31030100300
число вершин в графе функции, содержащей начало поиска

(v+,v-:)предок и потомокв теле одной функциипроизвольно

Рис. 5 –– Число итераций поиска при вычислении ξ в зависимости от числа
вершин в графе функции, содержащей начало поиска (v + ). Высота столбиков
примерно пропорциональна частотности примеров

(heap), построенная с использованием совместно графа выражений для различ-
ных её экземпляров. Автором разработан код для реализации таких куч.
Для изучения возможностей описанного подхода была разрабо-
тана специальная моделирующая система (код доступен по ссылке
https://github.io/cgsnap). Эксперименты продемонстрировали, что
сложность вычисления ξ в среднем не превышает 3..5 итераций для одной вер-
шины, входящей в V + (Рис. 5), что примерно в 10 раз меньше среднего числа
обрабатываемых узлов при непосредственном обходе графа (более 40).
Четвёртая глава посвящена алгоритму реконструкции графа управления
на основе трасс событий. В случае, если граф управления недоступен (напри-
мер, отсутствует исходный код приложения), для анализа возможных ошибок
и планирования тестов возможно использовать автомат, построенный на осно-
ве наблюдаемых путей выполнения программы.3
3 Построенный таким образом граф не обязательно соответствует ветвям кода, но представляет

собой пригодную для анализа генерализацию наблюдаемых последовательностей событий.
В основе предложенного алгоритма лежит оптимальное выравнивание
строк относительно графа автомата на основе расстояния редактирования. Алго-
ритм способен производить сравнительно точные модели на основе небольшого
по объёму множества обучающих данных. Каждая итерация обучения исполь-
зует текущую версию автомата и одну из строк-образцов в качестве модифи-
цируемого и константного операндов, соответственно. Алгоритм выравнивания
в принципе аналогичен алгоритму Нидлмана–Вунша , но имеет следующие ос-
новные отличия:
1. Разрешается рассмотрение любого ребра автомата (в том числе несу-
ществующего (перспективного), с фиксированным штрафом) в качестве
возможного перехода между позициями в первом операнде.
2. К рассматриваемым состояниям добавляются возможные новые со-
стояния, по одному для каждого символа строки-образца; решение
о включении новых состояний в автомат зависит от того, уменьшают
ли проходящие через них пути итоговое расстояние редактирования.
Обработка каждой строки y в процессе обучения включает построение
матрицы счетов выравнивания Si,j между префиксом строки и путём в автома-
те, где i ∈ 0..n,n + j – существующие или предполагаемые состояния автомата,
j ∈ 1..|y| – позиция в строке-образце. Чтобы найти максимальный счёт Si,j , про-
изводится трансфер счетов-кандидатов из элементов S∗,j−1 двумя способами:
1. через уже построенные ребра автомата, метки которых соответствуют
символу y j строки;
2. посредством «телепортации», то есть из любого состояния автомата,
включая перспективное состояние для позиции j − 1.
Фактически, для каждой строки строится взвешенный конечный транс-
дьюсер (weighted finite-state transducer (WFST)), преобразующий автомат в дан-
ную строку.4
В работе также рассматривается вариант алгоритма, в котором граф все-
гда соответствует автомату для какого либо регулярного выражения (РВ). РВ
являются стандартным способом представления выражений, обобщающих на-
боры последовательностей элементов. Обобщение трасс событий в виде РВ
сопряжено с принятием гипотез, которые не могут быть доказаны или опроверг-
нуты наблюдением конечного числа последовательностей (например, гипотеза
о неограниченности числа итераций цикла), поэтому неизбежно использова-
ние эвристических правил. Однако, поскольку структура программы (и, соот-
ветственно, её графа управления) в основном состоит из гамаков и циклов,
регулярные выражения являются эффективным способом генерализации трасс
выполнения программы. Предложено расширение синтаксиса РВ для менее за-
тратного учёта выходов потока управления из блоков кода.
В заключении перечислены важные составляющие проделанной работы:
4 Для уменьшения сложности число рассматриваемых входящих в каждое состояние WFST ребер

ограничивается константным гиперпараметром K, при этом строятся только ребра, доставляющие
наибольшие значения счета в данное Si,j .
1. Предложен и экспериментально подтверждён эвристический метод оп-
тимизации скорости направленного тестирования с помощью ограниче-
ния числа повторных обходов ветвей условных переходов. Исследована
динамика покрытия кода. В числе других предложен вариант метода,
учитывающий приблизительную информацию о зависимостях данных
в программе, получаемую при анализе траекторий выполнения тестов
и обращений к памяти.
2. Сформулирован критерий целесообразности посещения ветвей услов-
ного перехода, вычисляемый как дополнения множеств доступных по
альтернативным путям непокрытых ветвей графа управления. Разра-
ботана технология быстрого вычисления критерия и реализующее её
программное средство. Продемонстрирована эффективность использу-
емого алгоритма для выборки программ с открытым кодом.
3. Разработаны и экспериментально изучены алгоритмы аппроксимации
графа управления путем автоматического выравнивания последователь-
ностей событий, наблюдаемых при работе тестируемой программы.
В целом, были разработаны основные элементы технологии, позволяющей учи-
тывать зависимости по данным при планировании тестов в рамках парадигмы
направленного тестирования без неприемлемого роста затрат вычислитель-
ных ресурсов.

Актуальность темы. Проблема поддержания качества программного обес- печения (ПО) в последние годы стала одним из наиболее существенных предме- тов научных исследований и инженерных разработок. Затраты на верификацию и тестирование программных и аппаратных систем сравнимы с затратами на их создание, а зачастую и превосходят их. На сегодняшний день существуют десятки широко используемых приложений для проверки работоспособности ПО и его со- ответствия требуемым свойствам. В целом, такие средства (и лежащие в их основе подходы) можно разделить на два больших класса: формальную и динамическую верификацию. Первая подразумевает формальное рассмотрение возможных сце- нариев работы программы, представленной в виде модели, без её фактического исполнения. В общих чертах этот процесс можно описать как поиск решения системы уравнений, описывающей возникновение недопустимой ситуации во время предполагаемого выполнения программы. Достоинством формальной ве- рификации является теоретическая полнота покрытия всех возможных ситуаций. Главными её недостатками являются, во-первых, весьма высокая вычислительная сложность, требуемая для полноценного доказательства корректности современ- ных программ, состоящих из десятков или сотен тысяч операторов, и во-вторых, необходимость построения исчерпывающей модели всего задействованного кода (что на практике часто вызывает большие затруднения, т.к. в системе могут ис- пользоваться модули с недоступным исходным кодом, в том числе с удаленным доступом; могут возникать непредсказуемые ситуации в операционной системе или аппаратных средствах и т.п.). Динамическая верификация является расши- рением подхода, основанного на тестировании, то есть реальном исполнении программы с теми или иными входными данными (стимулами) и автоматизи- рованным наблюдении за процессом и результатами её работы. Несмотря на сравнительно малую ресурсоёмкость и трудоёмкость, такой подход имеет прин- ципиальный недостаток – даже большое число разнообразных тестов не могут гарантировать обнаружение всех типов сценариев, ведущих к ошибкам (и в боль- шинстве случаев вероятность обнаружения многих из них исчезающе мала).
Аппаратно-программные решения занимают всё более значительное место в вычислительных и коммуникационных системах. Даже в микропроцессорах, традиционно рассматриваемых как устройства с фиксированной логикой работы, всё большая часть аппаратной реализации заменяется микропрограммами. Требо- вания к тестированию таких микропрограмм – такие же, как и к спецификациям аппаратуры (например, на языке Verilog) – абсолютное отсутствие ошибок, так как в случае обнаружения ошибки у потребителя единственной возможностью её устранить является замена устройства. Поэтому только применение формальных методов может дать гарантию корректности.
Отладка драйверов устройств для операционных систем также представляет серьёзную проблему и требует значительных ресурсов. Размерность таких задач слишком велика для непосредственной формальной верификации. Динамиче- ская валидация не даёт приемлемой гарантии выявления ошибок, так как многие сценарии, возможные в аппаратно-программных комплексах, имеют исчезающе низкую вероятность при случайном тестировании и практически непредсказуемы при «ручном» планировании тестов. К этому добавляется необходимость учёта различных окружений, платформ, операционных систем, совместно с которыми предполагается использовать тот или иной продукт.
В связи с этим постоянно предпринимаются исследования возможностей решений, соединяющих достоинства формальной и динамической верифика- ции. Одним из наиболее перспективных направлений верификации ПО является направленное тестирование, использующее методы формальной верификации в динамическом контексте. Оно подразумевает непосредственное исполнение программы с целенаправленным планированием траекторий условных переходов в её коде на основе динамически обновляемой математической модели програм- мы.
Использование моделей, учитывающей зависимости условий переходов че- рез присвоения переменных, при этом оказывается сложным из-за недостаточной разработанности соответствующих алгоритмов и эвристик. Из-за возникающей в общем случае необходимости перебора различных комбинаций направлений переходов требуемое для достижения заданной полноты тестирования количе- ство единичных тестов оказывается экспоненциальным относительно размера программы. Это исключает полноценное применение направленного тестирова- ния для большинства разрабатываемых программ. Чтобы сделать возможным использование современных методов моделирования дискретных систем в на- правленном тестирования ПО, данный недостаток должен быть устранён.
Направленное тестирование фактически одновременно преследует две вза- имоисключающие цели: с одной стороны, обеспечить максимальное покрытие ветвей кода и различных комбинаций их выполнения, а с другой стороны, исклю- чить из рассмотрения комбинации, которые с большой вероятностью не приведут к расширению такого покрытия. Например, нет смысла в переборе всех комби- наций значений двух входных переменных, если известно, что они используются в независимых друг от друга участках кода.
В то время как первая из указанных целей реализуется достаточно просто – автоматическим подбором входных переменных, изменяющих условия какого- либо множества условных переходов в программе –, вторая представляет собой серьезную проблему. Применение полноценных формальных доказательств для оценки целесообразности тех или иных траекторий выполнения тестируемой программы перед каждым перезапуском теста намного превышает современные вычислительные возможности. Поэтому, как правило, применяются достаточно простые эвристики, не связанные с подробным анализом графа управления про- граммы и взаимозависимостей фрагментов кода.
Особую трудность представляет учет зависимостей через присваивания зна- чений в динамически выделяемых областях памяти, так как:
– из-за разнообразия способов прямой и непрямой адресации перемен- ной или элемента структуры (массива) установить соответствие операций чтения данных операциям их записи возможно далеко не всегда;
– даже в случае, когда операции возможно сопоставить, без ресурсоёмкого анализа графа управления невозможно принять адекватные решения по планированию последующих тестов.
Настоящая диссертационная работа посвящена исследованием усовершен- ствований эвристических подходов к ограничению набора планируемых траек- торий при направленном тестировании программных систем без существенного снижения покрытия ветвей кода тестами.
Кроме тестирования ПО, предлагаемые подходы могут применяться для исследования широкого класса моделей, описывающих многовариантные после- довательности событий (сценарии), например, планирование производственных или образовательных процессов, экономические модели и т.п. При этом термин «тестирование программы» может пониматься в самом общем смысле – напри- мер, как рассмотрение некоторого возможного при заданных входных значений сценария или как поиск по шаблону в базе данных.
В диссертационном исследовании рассматриваются следующие основ- ные вопросы: – Исследование возможности повышения скорости тестирования с приме- нением эвристических подходов, основанных на ограничении полного количества отклонений направлений переходов управления от направле- ний, наблюдаемых в некотором наборе базовых траекторий
– Разработка простого универсального способа формулирования условий для планирования траекторий выполнения с учетом обнаруженных зави- симостей через присвоения значений данных.
– Исследование оптимизации анализа графа управления программы при планировании траекторий с учетом таких зависимостей с помощью сор- тировок графа, приблизительно соответствующих структуре программы.
– Исследованиесжатияпредставленийтраекторийтестовпутемгенерации регулярных выражений и автоматов. Разработка универсального алгорит- ма аппроксимации графа управления на основе наблюдаемых траекторий с линейной относительно числа образцов траекторий сложностью.
Степень разработанности темы. Теоретические изыскания в области обеспечения качества программ появились практически одновременно с самими компьютерными программами. Ранние исследования Ч. Хоара [82] и У.Крейга [45; 47] в области математической логики во многом определили современное состояние моделирования и верификации цифровых систем, сделали возможным применение индуктивных методов доказательства свойств. Однако широкое раз- витие верификации программ как технической дисциплины, ориентированной в большей степени на оптимизацию потребления вычислительных ресурсов, происходило намного позднее, уже в 2000-е годы. В этой связи можно упомя- нуть работы зарубежных авторов, таких как Д. Бейер [53; 54; 72; 77––81; 116], А. Брэдли [89; 91––94; 99; 101], Годефройд [120; 132; 133], Д. Кронинг [49; 69; 135], К. Макмиллан [37; 48; 50; 86; 112], Ф. Соменци [95; 99; 100; 107], А. Ци- матти [102; 105; 109; 110; 114; 116], и отечественные исследования Б.М. Баска [126], В.С. Буренкова [18––20], А.Г. Зыкова [125; 147; 150––152; 154; 163; 165], В.В. Липаева [121], А.С. Камкина [131; 157; 170; 171], О.Ф. Немолочнова [147; 150––154; 163; 164] и других. Несмотря на впечатляющий прогресс, достигну- тый в моделировании свойств цифровых систем, можно отметить существенный общий недостаток предлагаемых в литературе подходов к верификации ПО, заключающийся в отсутствии внимания к анализу возможности развития опреде- лённых ситуаций в программе в зависимости от выбранного пути её выполнения. По-видимому, это исторически обусловлено тем, что подходы к верификации программ во многом являются адаптацией подходов к верификации аппаратных решений. Поэтому алгоритмы большей частью основываются на рассмотрении различных возможных состояний программы. Однако количество различных состояний обычно на порядки больше, чем количество существенно различаю- щихся сценариев развития тех или иных ситуаций. Поэтому анализ состояний требует неоправданно больших затрат ресурсов. Настоящая диссертационная работа, в частности, призвана внести вклад в устранение данного недостатка.
Целью данной работы является разработка и исследование алгоритми- ческих решений, сокращающих среднее число тестов и затраты ресурсов на планирование каждого теста при направленном тестировании компьютерных про- грамм.
Для достижения поставленной цели необходимо было решить следую- щие задачи:
1. Исследоватьзависимостьпокрытиякодатестамивзависимостиотчисла комбинаций перебора вариантов путей выполнения программы и пред- ложить соответствующие эвристические стратегии оптимизации.
2. Исследовать возможность учёта неточной информации о зависимостях по данным в указанных стратегиях.
3. Исходяиздоступностиинформациионаблюдаемыхприсваиванияхиис- пользованиях объектов данных, сформулировать задачу поиска перспек- тивных с точки зрения увеличения покрытия теста путей выполнения.
4. Разработатьбыстрыйалгоритмдлявычислительногорешенияуказанной в предыдущем пункте задачи и экспериментально исследовать его эф- фективность.
5. Разработать и исследовать алгоритмы аппроксимации графа управления на основе наблюдаемых путей выполнения тестов.
Научная новизна:
1. Предложены и исследованы парадигма ограничения числа повторных обходов и модификация данной парадигмы, учитывающая зависимости по данным.
2. Предложено использование разностной функции (ξ) доступности вер- шин в графе управления для планирования направления выбранного условного перехода при тестировании программ.
3. Разработаниэкспериментальноподтверждёналгоритмбыстроговычис- ления дополнения множеств доступных вершин в графе управления при различных наборах исключаемых из рассмотрения вершин, реализую-
щий упомянутую в предыдущем пункте функцию ξ.
4. Предложены алгоритмы построения аппроксимации графа на основе
набора примеров путей в нём с помощью минимизации расстояния ре-
дактирования между примером и графом.
Практическая значимость. Предложенные решения легко интегрируются
в системы направленного тестирования программ и аппаратно-программных ком- плексов, при этом время тестирования снижается в 6 и более раз без ухудшения покрытия ветвей тестируемой программы. Результаты исследований были ис- пользованы при разработке внутренних средств тестирования компании Intel.
Методология и методы исследования. В диссертационном исследовании преимущественно применялись экспериментально-аналитический и эксперимен- тальный методы исследования гипотез.
Основные положения, выносимые на защиту:
1. Метод оптимизации числа тестов путём ограничения количества изме- няемых направлений условных переходов в траекториях выполнения программ при их направленном тестировании.
2. Алгоритмреконструкцииграфауправленияпрограммыизнаблюдаемых при её выполнении трасс событий, основанный на поиске минимального расстояния редактирования между трассой и графом.
3. Алгоритмбыстрогопоискаразностимножествдоступныхвершинвгра- фе управления, использующий комбинацию остовного и диадического деревьев для сокращения числа итераций.
4. Структура хранения списков доступных вершин графа управления, ис- пользующая контейнеры-кучи с совместным графом выражений для минимизации размера потребляемой памяти.
Достоверность полученных результатов обеспечивается исследованиями эффективности предложенных методов непосредственным измерением ряда ста- тистических величин в экспериментах. Эксперименты проводились с репрезента- тивной выборкой из более 100 практических приложений, в основном, из числа общедоступных проектов с открытым кодом.
Апробация работы. Основные результаты работы докладывались на все- российских научно-технических конференциях “Проблемы разработки перспек- тивных микро- и наноэлектронных систем” (МЭС) 2012, 2014, 2016, 2018 гг., пятой международной конференции «Анализ изображений, социальных сетей и текстов» (AIST 2016), конференции “The 17th Annual Workshop of the Australasian Language Technology Association” (2019).
Личный вклад. Автору принадлежит:
1. выделениеисследуемыхнаправленийоптимизациитестированияифор-
мулирование соответствующих им критериев целесообразности отдель-
ных тестов;
2. разработка предложенных в диссертационной работе алгоритмов:
– алгоритма ограничения реальтернаций условных переходов при направленном тестировании (варианты: без учета завиcимостей по данным и с учётом таких зависимостей);
– алгоритма быстрого вычисления функций доступности узлов в графе управления;
– алгоритмов реконструкции графа управления из наблюдаемых трасс выполнения тестов (в произвольном виде и в виде авто- мата для регулярного выражения)
3. разработка методик и проведение экспериментальных подтверждений;
4. создание программных приложений, реализующих предложенные алго-
ритмы;
5. выработка рекомендаций по применимости и выбору параметров алго-
ритмов и эвристик.
В работе, выполненной в соавторстве, вклад автора составляет 50%.
Публикации. Основные результаты по теме диссертации изложены в 6 пе- чатных изданиях, 4 из которых изданы в журналах, рекомендованных ВАК, 1 –– впериодическихнаучныхжурналах,индексируемыхWebofScienceиScopus,1–– в тезисах докладов [1––6].
Объем и структура работы. Диссертация состоит из введения, четырёх глав и заключения. Полный объём диссертации составляет 206 страниц, включая 40 рисунков и 5 таблиц. Список литературы содержит 214 наименований.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Читать

Помогаем с подготовкой сопроводительных документов

Совместно разработаем индивидуальный план и выберем тему работы Подробнее

Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее

Поможем в написании научных статей для публикации в журналах ВАК Подробнее

Структурируем работу и напишем автореферат Подробнее

Хочешь уникальную работу?

Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все

Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.

#Кандидатские #Магистерские

18 Выполненных работ

После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все

После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.

#Кандидатские #Магистерские

300 Выполненных работ

Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все

Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.

#Кандидатские #Магистерские

66 Выполненных работ

Специализация: диссертации; дипломные и курсовые работы; научные статьи.

#Кандидатские #Магистерские

335 Выполненных работ

Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной с... Читать все

Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной специальности 12.00.14 административное право, административный процесс.

#Кандидатские #Магистерские

216 Выполненных работ

Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все

#Кандидатские #Магистерские

551 Выполненная работа

Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все

#Кандидатские #Магистерские

37 Выполненных работ

Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все

Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.

#Кандидатские #Магистерские

47 Выполненных работ

Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все

Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!

#Кандидатские #Магистерские

138 Выполненных работ