ОГЛАВЛЕНИЕ
Стр. ВВЕДЕНИЕ
ГЛАВА 1. ПОДХОДЫ К ПОСТРОЕНИЮ СИСТЕМ РАСПОЗНАВАНИЯ ЛИЦПОИЗОБРАЖЕНИЮВУСЛОВИЯХСЛАБОЙОСВЕЩЕННОСТИ……….14 1.1. Биометрическая система распознавания лиц
1.2. Проблемы, возникающие в процессе распознавания лиц
1.3. Анализ источников, обеспечивающих спектральные системы визуализации
1.4. Методы, обеспечивающие распознавание лиц с использованием
ближнего инфракрасного источника
1.4.1. Гетерогенная биометрия лица
1.4.2. Анализ методов и алгоритмов, используемых в задаче гетерогенного распознавания лиц
1.5. Методы, обеспечивающие шумоподавление с использованием
нейронных сетей
1.6. Формализация задачи системы распознавания лиц
1.7. Выводы по главе 1
ГЛАВА 2. РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ РЕШЕНИЯ ЗАДАЧ ГЕТЕРОГЕННОГО РАСПОЗНАВАНИЯ ЛИЦ
2.1. Архитектура системы распознавания лиц
2.2. Методология построения предлагаемой гетерогенной системы распознавания лиц
2.2.1. Что такое глубокое обучение?
2.2.2. Искусственная нейронная сеть
2.2.3. Функция активации
2.2.4. Свёрточный слой
2.2.5. Пулинговый слой
3
Стр
.2.6. Полностью соединенные слои
2.2.7. Нормализация
2.2.8. Функция потерь
2.2.9. Методы регуляризации
2.2.10. Градиент и обратное распространение
2.2.11. Оптимизационные методы
2.3. Модель шумоподавления на основе автоэнкодера
2.4. Обнаружение лиц
2.4.1. Проблемы в области обнаружения лиц
2.4.2. Алгоритм на основе каскада Хаара
2.4.3. Алгоритм гистограммы направленных градиентов (HOG)
2.4.4. DNN детектор лица
2.5. Построение кросс-доменной модели на основе базовой модели ЦГСС
2.6. Детектирование признаков
2.7. Классификация признаков
2.7.1. Теория SVM
2.7.2. Алгоритм классификации SVM
2.7.3. Алгоритм «один-против-покоя» (One-against-rest)
2.7.4. Алгоритм «один-против-одного» (One-against-one)
2.8. Выводы по главе 2
ГЛАВА 3. РЕАЛИЗАЦИЯ РАЗРАБОТАННЫХ АЛГОРИТМОВ В СИСТЕМЕ ГЕТЕРОГЕННОГО РАСПОЗНАВАНИЯ ЛИЦ
3.1 Выбор средств разработки
3.1.1. Средства для разработки программного обеспечения
3.1.2. Аппаратные средства для разработки

4
Стр
.2. Реализация разработанных алгоритмов с помощью ПО и использование
необходимых предварительно обученных моделей
3.2.1. Реализация разработанных алгоритмов
3.2.2. Реализация пред-обученных моделей
3.3. Выводы по главе 3
ГЛАВА 4. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ОЦЕНКИ ЭКСПЕРИМЕНТОВ

4.1. Планирование эксперимента
4.2. База данных
4.2.1. CASIA NIR-VIS 2.0 Face Database
4.2.2. Собственная база данных
4.3. Блок-схема алгоритма функционирования гетерогенной системы распознавания лиц
4.4. Методы оценки распознавания лиц
4.4.1. Общая Точность (Accuracy)
4.4.2. Частота ошибок (Error rate)
4.4.3. Точность (Precision)
4.4.4. Полнота (Recall)
4.4.5. F-мера (F-measure)
4.5. Результаты экспериментов
4.4. Выводы по главе 4
ОБШИЕ ВЫВОДЫ И ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ

Во введении содержится обоснование актуальности темы диссертации, формулируются цели и задачи исследования, научная новизна, практическая ценность результатов, а также кратко изложено содержание разделов диссертации.
В первой главе содержатся общие сведения о биометрических системах. Описываются процессы формирования нового биометрического шаблона на основе данных, основные принципы построения систем распознавания лиц и процедура решения биометрической системой задачи «список наблюдения».
Рассматриваются различные проблемы, с которыми приходится сталкиваться в задаче распознавания лиц. Рассматриваются способы решения проблемы вариаций освещения и отсутствия освещения. Для решения проблемы низкого освещения проведен анализ источников, обеспечивающих спектральные системы визуализации. В качестве подсветки выбирается ближний
инфракрасный диапазон. Анализируются методы, обеспечивающие распознавание лиц с использованием изображений в ближнем ИК-диапазоне.
Гетерогенные системы распознавания лиц обеспечивают соответствие между различными системами визуализации, либо различными спектральными полосами, либо модальностями. Рассматриваются области применения гетерогенного распознавания лиц.
Проведен анализ методов и алгоритмов, используемых в задаче преобразования ближнего инфракрасного домена в визуальный домен. Проведен анализ методов шумоподавления с использованием нейронных сетей в качестве предварительной обработки. Представлена формализация задачи системы распознавания лиц в соответствии данной работы.
Вторая глава посвящена методами и алгоритмами решения задач гетерогенного распознавания лиц. Проведена разработка архитектуры системы распознавания лиц, обеспечивающая возможность использования в зашумленной и темной окружающей среде (см. Рисунок. 1). Приводится описание методов, используемых в построении предложенной гетерогенной системы распознавания лиц.
Рисунок 1.
Процедура функционирования гетерогенной системы распознавания лиц.
Разработана модель шумоподавления на основе автоэнкодера и её структура функционирования (Рисунок 2).
Рисунок 2.
Функционирование автоэнкодера по шумоподавлению изображения.
5

Математическая модель автоэнкодера имеет следующий вид:
: →
: → ′
, = argmin‖ −( ∘ ) ′‖2
,
где , − функции энкодера и декодера. , ′, − входное изображение, реконструированное изображение и латентный вектор, соответственно. сопоставляет входное изображение с латентным вектором . сопоставляет латентный вектор с выходное изображение ′.
Сеть энкодера может быть представлена стандартной функцией нейронной сети через функцию активации:
= ( + )
Аналогично, сеть декодера может быть представлена в той же форме, но с другим весом, смещением и используемой функцией активации.
′ = ′( ′ + ′)
где, ′, ′, ′ параметры сети декодера могут быть не связаны, а , , – параметры сети энкодера.
Разработана кросс-доменная модель на основе существующей модели ЦГСС для решения задачи преобразования модальности изображения. Результаты преобразования модальности изображения, генерируемые существующей моделью ЦГСС, являются не высокими по качеству формирования изображения, что может привести к плохой производительности системы идентификации лиц (см. Рисунок 3).
Рисунок 3.
Пример результата преобразования модальности изображения с помощью существующей модели ЦГСС.
На Рисунке 4 представлена разработанная кросс-доменная модель с использованием существующей модели ЦГСС. Модифицированная часть предлагаемой модели представлена в красном пунктирном прямоугольнике.
Рисунок 4.
Предложенная кросс-доменная модель для преобразования модальности изображения.
Существующая модель ЦГСС состоит из двух генераторов ( , ) и двух дискриминаторов ( , ). Каждый генератор имеет соответствующую модель дискриминатора. Функция генератора состоит в создании синтезированных изображений, а функция дискриминатора состоит в определении различий между реальными изображениями и синтезированными изображениями.
Генератор производит синтезированные изображения и дискриминатор пытается различить эти синтезированные изображения и реальные изображения из домена ; дискриминатор различает реальные изображения из домена и синтезированные изображения, произведенные генератором .
Для генератора : → существующей модели ЦГСС и связанного дискриминатор , состязательная потеря формулируется следующим образом:
2 ( , , , ) = ~ ( ) [( ( ( )) − 1) ]
где

22 ( , , , ) = ~ ( ) [( ( ) − 1) ] + ~ ( ) [ ( ( )) ]
, − исходные данные из доменов и , ∈ , ∈ .
( , , , ), ( , , , )− состязательные потери генератора и дискриминатора для прямого цикла модели ЦГСС. , − матожидание для реальных данных и синтезированных данных. ( ) и ( ) обозначают
выборочные распределения в доменах и , соответственно. Для генератора
: → и связанного с ним дискриминатора , состязательная представлена следующим образом:
2 ( , , , )= ~ ( ) [( ( ( ))−1) ]
потеря

2 ( , , , )= ~ ( )[( ( )−1) ]+ ~ ( ) [ ( ( )) ]
2
где ( , , , ), ( , , , )−состязательные потери генератора и дискриминатора для обратного цикла модели ЦГСС.
Таким образом, общая потеря состязательности может быть записана следующим образом:
,
= ( , , , )+ ( , , , )

= ( , , , )+ ( , , , )
, = +
,
где − общая состязательная потеря для генератора и генератора . −
общая состязательная потеря для дискриминатора и дискриминатора . − общая состязательная потеря для всех состязательных потерь генераторов и дискриминаторов.
Для восстановления исходного изображения после цикла преобразования, в качестве второго набора функций потерь, потери цикл-консистенции представляется следующим образом:
= ~ ( ) [‖ ( ( )) − ‖1] + ~ ( ) [‖ ( ( )) − ‖1] где − потеря цикла-консистенции.
Полная потеря существующей модели ЦГСС может быть представлена следующим образом:
= 1 + 2
где − полная функция потеря. 1, 2 − весовые значения. Результаты преобразования модальности изображения не удовлетворяются при использовании существующей модели ЦГСС, как показано на Рисунке 3. Разработана модификация существующей модели ЦГСС добавлением новых функций потери, называемых потерей идентичности и потерей края. Функция потери идентичности и потери удержания края представлены следующим образом:
= ~ ( )[‖ ( ) − ‖1] + ~ ( )[‖ ( ) − ‖1]
= ~ ( ) [‖ ( ( )) − ( )‖1] + ~ ( ) [‖ ( ( )) − ( )‖1]

где , − потеря идентичности и потеря удержания края. − Сеть для извлечения границ изображения с целью вычисления предполагаемой потери удержания границ.
Функция потери идентичности и потери удержания края оптимизируют существующую модель ЦГСС во время обучения. Новая модифицированная полная функция потерь представлена следующим образом:
= 1 + 2 + 3 + 4
где 3, 4 − весовые значения.
Рассмотрены известные методы обнаружения лиц, метод детектирования
признаков и метод классификации признаков как предварительно обученных моделей.
В третьей главе приведена реализация разработанного комбинированного метода для решения задачи распознавания личности в зашумленной и темной окружающей среде. Проведен выбор средств для разработки аппаратного и программного обеспечения.
Реализована модель шумоподавления на основе метода автоэнкодера (Рисунок 5).
xZx
Входноеизображение (128 х 128 х 3)
Входной слой (128 х 128 х 3)
Латентное пространство
Выходное изображение (128 х 128 х 3)
Conv2D (128 х 128 х 64)(128 х 128 х 3)
Conv2D x 2 (128 х 128 х 64)
Upsampli ng2d
Maxpooli ng2d (64 х 64 х 64)
Conv2D x 2 (64 х 64 х 32)
Maxpooli ng2d (32 х 32 х 32)
Conv2D x 2 (32 х 32 х 32)
Upsampli ng2d (64 х 64 х 32)
Conv2D x 2 (64 х 64 х 64)
Рисунок 5.
Архитектура модели шумоподавления на основе метода модифицированного автоэнкодера.
В разработанной модели настройки были изменены путем дублирования сверточных слоев в энкодере и декодере.
Приведен сравнительный анализ разработанной модели шумоподавления с другими методами шумоподавления за счет пикового отношения сигнал / шум (PSNR). Чтобы вычислить PSNR, используется следующее уравнение:
PSNR=10log  R2  10MSE
где R – максимально возможное значение яркости пикселя изображения. MSE представляет собой среднеквадратичную ошибку между сжатым и исходным изображением:
 
 = 0.10  = 0.15  = 0.20
19.99 29.80 16.45 26.62 14.03 24.50
29.73 26.69 27.89 23.73 26.84 21.67
31.91 29.88 27.35
MN Результаты сравнения представлены в Таблице 1.
I (m,n)−I (m,n)2 12
MSE = M ,N 
где M и N — это количество строк и столбцов во входных изображениях.

Таблица 1. Сравнительные результаты различных методов шумоподавления за счет
пикового отношения сигнал / шум.
значение параметра помехи
С шумом
Медианный метод
Байесшринк
Висушринк
Модифициров- анный автоэнкодер
Результаты шумоподавления на случайно выбранном тестовом изображении из ORL базы данных представлены на Рисунке 6.
Рисунок 6.
Сравнение результатов на зашумленном изображении с использованием различных методов шумоподавления.
Проведена реализация модели преобразования модальности изображения в виде программного обеспечения. Предложенная модифицированная кросс- доменная модель построена с пропускными соединениями для генераторов, U- Net для два детектора границ и обычные свёрточные сети для дискриминаторов. Построены модели с использованием Keras API, а оптимизатор Adam был использован для изменения атрибутов нейронной сети, таких как вес и скорость обучения, чтобы уменьшить потери.
Для построения предложенной кросс-доменной модели необходимо реализовать два генератора, два дискриминатора и два детектора границ. Сетевые архитектуры генератора, дискриминатора и детектор границ представлены на Рисунке 7, Рисунке 8 и Рисунке 9., соответственно. График потери во время обучения генераторов и дискриминаторов на основе базовой модели ЦГСС и модифицированной модели ЦГСС показаны на Рисунке 10.
Рисунок 7.
Сетевая архитектура генератора.
Рисунок 8.
Сетевая архитектура дискриминатора.
Рисунок 9.
Сетевая архитектура краевого детектора.
Рисунок 10.
График потери при обучении базовой модели ЦГСС и предложенной кросс- доменной модели (а) потери генераторов (б) потери дискриминаторов.
Разработанная кросс-доменная модель была обучена на базе данных CASIA NIR-VIS 2.0 после построения сетей генераторов и дискриминаторов, результаты представлены на Рисунке 11.
Рисунок 11.
Результаты преобразования домена изображения с использованием предложенной кросс-доменной модели.
Осуществлена реализация методов обнаружения лиц, детектирования признаков и классификации признаков в виде программного обеспечения. Произведен сравнительный анализ трех известных методов обнаружения лиц и представлен обзор преимуществ и недостатков этих методов.
Использована модель “FaceNet” в качестве предварительно обученной модели детектирования признаков. Для классификации личностей использован метод опорных векторов.
В четвертой главе приводятся результаты экспериментальных исследований описанных методов. В начале главы проведено планирование эксперимента. Задача идентификации решается для трех различных условий: статические изображения без шумов, статические изображения с шумами и идентификация лиц на видеопоследовательности в режиме реального времени.
Тестирование алгоритма предложенного комбинированного метода проводилось на следующих наборах данных:
– База данных CASIA NIR-VIS 2.0 включает в себя в общей сложности 725 различных людей. На одного человека приходится 1-22 изображения лица в видимом спектре и 5-50 изображений лица в ближнем инфракрасном спектре. База данных использована для тестирования статистических изображений.
– Собственная база данных содержит набор изображений лица 10 разных людей. В базе содержится набор видимого спектра и набор инфракрасного спектра (по 10 изображений на одного человека). База данных использована с целью тестирования видеопоследовательности в режиме реального времени.
Для оценки эффективности системы идентификации лиц с использованием предложенного комбинированного метода применяются следующие критерии:
– критерий полноты системы (Recall), показывающий отношение количества верных идентификаций лиц к общему числу лиц на изображениях.
= +
где , − истинно-положительное решение и ложноотрицательное решение, соответственно.
– критерий точности системы (Precision), показывающий долю верных идентификаций лиц среди всех результатов идентификации.
= +
где − ложноположительное решение.
– кривая точности и полноты (precision and recall curve – PRC),
используемая для оценки качества классификатора, что является полезным показателем успешности прогнозирования, когда классы изображений несбалансированные.
– общая точность, определяющаяся как доля количества правильной классификации во всем числе образцов.
Результаты эксперимента идентификации лиц на статических изображениях при отсутствии и наличии шумов представлены на Рисунке 12, сравнение с другими альтернативными методами гетерогенного распознавания лиц представлено в Таблице 2.
13

Рисунок 12.
Различные точности идентификации в виде кривой PRC при отсутствии и наличии шумов.
Таблица 2. Сравнение точности (%) на базе данных CASIA NIR-VIS 2.0 и сравнение
времени обработки на видеопоследовательности.
Метод
Точность
Время обработки (кадров в секунду)
DSIFT
CDFL Gabor+RBM LCFS H2(LBP3) CEFD HFR-CNN TRIVET
IDNet IDR-128
ADFL
VGG SeetaFace CenterLoss Light CNN Предложеный метод
В
видеопоследовательность в режиме реального времени. В этом эксперименте рассматривались вопросы использования разработанной кросс-доменной модели и отказа от использования этой модели в темной среде. Результаты приведены на Рисунке 13.
73.3 ±1.10 71.5±1.40 86.2±0.98 35.4±2.80 43.8
85.6 85.9±0.90 95.7±0.52 87.1±0.88 97.3±0.43 98.2±0.34 62.1±1.88 68.0±1.66 87.7±1.45 96.7±0.23 98.7±0.39
–
–
–
–
–
–
≈ 1.18 ≈ 1.43 ≈ 1.67 ≈ 1.53 ≈ 2.23 ≈ 1.25 ≈ 1.82 ≈ 2.01 ≈ 3.34 ≈ 4.02
14
конце главы для
идентификации
людей
используется

Рисунок 13.
Результаты тестирования на видеопоследовательности при отказе от использования разработанной кросс-доменной модели и при использовании её в предложенном комбинированном методе.
По результатам идентификации лиц на видеопоследовательности в режиме реального времени, можно заметить, что предложенный комбинированный метод без разработанной кросс-доменной модели дал низкую производительность идентификации лиц, а при использовании разработанной кросс-доменной модели в предлагаемом комбинированном методе можно получить надежную производительность для идентификации лиц.
ЗАКЛЮЧЕНИЕ
В диссертационной работе решена актуальная научно-техническая задача исследования и разработки алгоритмов идентификации лиц на статических изображениях и на видеопоследовательностях в условиях слабого освещения или абсолютно тёмной окружающей среды.
Представленная диссертационная работа в соответствии своими с целями и задачами содержит следующие результаты:
1. Разработаны алгоритмы распознавания личности в условиях слабого освещения, или полного отсутствии освещения с применением методов шумоподавления, обнаружения лиц, преобразования домена изображения, детектирования и классификации признаков.
2. Разработана модель шумоподавления на основе сети автоэнкодера, обеспечивающая уменьшение шума в изображениях, позволяющая распознавать личность в зашумленных сценариях.
3. Разработана модифицированная кросс-доменная модель на основе существующей модели ЦГСС, позволяющие генерировать видимые изображения лучшего качества из изображений в ближнем ИК диапазоне.
4. Разработаны структура и алгоритмы функционирования системы на основе совокупности разработанных моделей и предварительно
обученных моделей, позволяющие идентифицировать личность в условиях
слабого освещения.
5. Разработано и внедрено в автоматизированные системы программное
обеспечение для распознавания лиц в условиях слабого освещения или отсутствия освещения для статических изображений и видеопоследовательностей.

Актуальность выбора темы данного исследования обусловлена тем, что на сегодняшний день технология распознавания лиц является одним из самых перспективных и востребованных направлений, так как несмотря на то, что основными сферами применения данной технологии остаются безопасность и системы обеспечения физического доступа, уже сейчас ученые и разработчики задумываются о распространении алгоритмов во всех сферах деятельности человека.
К примеру, биометрическое распознавание лиц позволяет диагностировать заболевания, которые проявляются в изменении мимики, что даст возможность выявлять болезнь Альцгеймера на ранней стадии, либо обнаруживать генетические заболевания, такие как синдром Ди Джорджа с вероятностью успеха 96,6%. Транспортные компании начинают внедрять биометрические технологии для мониторинга усталости водителей.
Еще одним перспективным сценарием развития распознавания лиц является использование в области маркетинга, так как биометрические технологии в десятки раз ускоряют контроль планограмм, позволяют анализировать покупательские предпочтения, чем повышают продажи. Кроме того, с их помощью можно сократить убытки торговых предприятий за счет того, что системы распознавания лиц правильно идентифицируют потенциальных преступников, готовых на кражу.
Биометрические технологии используются в качестве идентификатора для платежных систем, когда покупку становится возможно оплатить с помощью сканирования лица покупателя, и др.
Как уже говорилось выше, на сегодняшний день наиболее часто система распознавания лиц используется в охранных системах и правоохранительными органами. Технологии интеллектуального распознавания лиц совмещены с системами видеонаблюдения на улицах городов, в общественном транспорте, в магазинах, банках, что позволяет ежедневно анализировать миллионы лиц, среди которых может скрываться как потенциальный преступник, уже занесенный в базу МВД, так и готовящийся совершить преступление.
Однако несмотря на растущую популярность и широкое применение технологий интеллектуального распознавания лиц, в настоящее время существует и ряд недостатков, выявленных при их применении.
Во-первых, одним из существенных недостатков системы распознавания лиц является то, что в действительности камеры видеонаблюдения, установленные на улицах, в транспорте и других общественных местах, не способны прицельно следить за всеми перемещениями каждого отдельного человека.
Во-вторых, существенно снижают качество распознавания лиц так называемые «шумы» – помехи, которые могут быть вызваны различного рода световыми бликами, воздействием влажности, тумана, дождя, посторонних предметов, изменением позы, окклюзией, и что особенно важно – недостаточной освещенностью объекта наблюдения.
Однако несмотря на то, что в ученой среде разрабатываются так называемые «методы глубокого обучения» искусственного интеллекта, который играет ведущую роль в системах распознавания лиц, до сих пор не удалось полностью нивелировать влияние шумов и освещенности на качество идентификации объектов наблюдения.
Так, если в развитых странах данную проблему можно решить за счет оптимизации освещенности мест возможного расположения систем видеонаблюдения с функцией распознавания лиц, то в странах развивающихся правоохранительные органы зачастую сталкиваются с невозможностью получить качественное изображение для идентификации ввиду частичного или полного отсутствия освещенности.
С учетом вышесказанного, представляется важным разработка такой системы распознавания лиц, которая могла быть использована на объектах с повышенным визуальным шумом, а также в условиях слабой освещенности, что позволит правоохранительным органам и охранным структурам контролировать как можно больше территорий и объектов с повышенной криминогенной обстановкой.
Как и многие современные задачи визуализации, проблемы освещения, как правило, решаются с помощью программного обеспечения, предназначенного либо для максимального использования доступного света, либо для генерирования света, чтобы видеокамеры наблюдения могли создавать более качественные видеоизображения в условиях низкой освещенности.
По большей части, проблемы, связанные с условиями низкой освещенности, могут быть решены с помощью ряда технологий, к которым относятся видеокамеры наблюдения с современными режимами работы день/ночь, и путем объединения ряда распространенных технологий обработки изображений.
Однако система распознавания лиц действует неэффективно при использовании инфракрасного изображения, которое производится видеокамерой ночного видения, так как многие приложения требуют, чтобы регистрация шаблонов лиц основывалась на видимых изображениях (VIS), которые используются при регистрации с использованием паспорта или удостоверения личности. Таким образом, необходимо преобразовать изображения ближнего инфракрасного диапазона в видимые изображения. Такая система распознавания лиц, преобразующая изображение из одного диапазона в другое, называется гетерогенной системой распознавания лиц.
Существует две основные задачи, решаемые системами распознавания лиц: система верификации и система идентификации. В настоящей работе автором предлагаются методы совокупности для построения системы идентификации лиц по спискам для использования в ночное время, которая является частным случаем системы идентификации. Данный вид систем имеет широкую область применения, ниже перечислены наиболее актуальные приложения:
– Системы наблюдения, устанавливаемые в общественных местах, на улицах, транспорте. Список идентификации в таком случае может включать пропавших детей, людей, находящихся в розыске, и др. В этом случае система распознавания будет осуществлять мониторинг лиц, появляющихся в области видимости камер наблюдения;
– Системы безопасности финансовых организаций (к примеру банки, кредитные учреждения), где вероятность возникновения угроз весьма велика, причем кража или повреждение имущества в таких организациях обычно происходит в ночное время. Имея систему безопасности, которая способна идентифицировать лица в условиях низкой освещенности, можно значительно повысить защищенность собственности и имущества подобных организаций и их вкладчиков;
– Системы распознавания лиц, используемые правоохранительными органами, например, для судебно-медицинского исследования, когда автоматическое распознавание лиц позволит идентифицировать личность человека.
Итак, решение задач автоматической идентификации лиц на изображениях, полученных в неконтролируемых условиях, включает в себя создание алгоритмов шумоподавления, преобразование изображения и распознавание лиц на изображениях. В данной диссертации автором представлена система идентификации лиц с помощью алгоритмов шумоподавления и преобразования изображения.
Цель диссертационной работы:
Разработка алгоритмов идентификации лиц по изображениям, а также видеопоследовательностям, полученным в условиях недостаточной освещенности или повышенного шумового фона.
Основные задачи исследования:
1. Провести аналитический обзор существующих методов и алгоритмов, применяющихся в системах гетерогенного распознавания лиц.
2. Разработать структуру системы гетерогенного распознавания лиц, включающую в себя модель шумоподавления, модель преобразования модальности изображения и модель распознавания лиц. 3. Разработать модель шумоподавления на основе нейронных сетей.
4. Разработать модифицированную математическую модель на основе
циклических генеративных состязательных сетей (ЦГСС), позволяющую преобразовать модальность изображения с учетом требуемого формата.
5. Разработать гетерогенную систему идентификации лиц для условий недостаточной освещенности и проблемно-ориентированное ПО.
6. Провести сравнение эффективности разработанного подхода с использующимися на сегодняшний день альтернативными методами гетерогенного распознавания лиц.
Научная новизна
Научная новизна работы, выносимая на защиту, состоит в следующем:
1. Предложен комбинированный подход к решению задачи идентификации лиц на основе метода глубокого обучения, отличающийся наличием автоэнкодера и позволяющий повысить качество работы системы распознавания лиц по сравнению с другими современными альтернативными методами гетерогенного распознавания лиц за счет эффективного шумоподавления.
2. На основе комбинированного подхода предложена оригинальная структура гетерогенной системы распознавания лиц для работы в условиях пониженной освещенности и зашумленной окружающей среды.
3. Предложена модифицированная математическая модель на основе существующей модели циклических генеративных состязательных сетей (ЦГСС) для преобразования модальности изображения, отличающаяся от известных функцией потерь, и обеспечивающая повышение точности распознавания лиц.
4. Разработан новый алгоритм, основанный на применении предложенного комбинированного подхода, дающий возможность идентифицировать личность на статических изображениях и на видеопоследовательности в режиме реального времени. Научная ценность
Научная ценность диссертационной работы заключается в предложенном оригинальном комбинированном подходе, основанном на использовании методов обнаружения лиц, шумоподавления, преобразования модальности изображения, встраивания признаков и классификации признаков, увеличивающем качество работы системы идентификации лиц как на статических изображениях, так и на видеопоследовательности в реальном времени в условиях низкой освещенности и зашумленной окружающей среды.
Практическая ценность
Практическая ценность диссертационной работы состоит в том, что разработанные алгоритмы в виде программного обеспечения могут применяться в системах правоохранительных органов для идентификации личности, осуществления судебной экспертизы. Реализованные алгоритмы представлены для решения задач гетерогенной системы распознавания лиц на статических изображениях и на видеопоследовательности в режиме реального времени.
Основные положения, выносимые на защиту:
1. Комбинированный подход к решению задачи идентификации личности с использованием оригинальных моделей обнаружения лиц, шумоподавления, преобразования домена изображения, встраивания признаков и классификации признаков, позволяющий повысить качество работы гетерогенной системы распознавания лиц в условиях низкой освещенности и зашумленной окружающей среды.
2. Алгоритм шумоподавления для существенно зашумленных изображений, отличающийся настройками автоэнкодера, и позволяющий повысить качество шумоподавления по сравнению с другими современными альтернативными алгоритмами.
3. Модифицированная математическая модель ЦГСС для преобразования модальности изображения, отличающаяся от известных функцией потерь. Средства моделирования с использованием языка программирования Python, библиотеки глубокого обучения Keras и Tensorflow.
4. Оригинальные структура и алгоритмы функционирования гетерогенной системы распознавания лиц, позволяющие реализовать предложенную методику определения сходства изображений в ближнем ИК диапазоне (NIR) с визуальными эталонами (VIS), хранящимися в базе данных.
Объект исследования
Объектом исследования диссертационной работы является система компьютерного зрения, осуществляющая идентификацию лиц на изображениях и видеопоследовательности в режиме реального времени.
Предмет исследования
Предметом исследования является комбинированный подход к решению задачи идентификации и алгоритмы идентификации лиц.
Методы исследования
В работе использовались методы цифровой обработки изображений, математической статистики, теории глубокого обучения, вероятностных моделей.
Реализация результатов и предложения об использовании.
Материалы диссертационной работы и полученные результаты использованы на кафедре информационных технологий машиностроения из технологического университета (Тханлин) под руководством министерства образования Союза Мьянмы.
Полученные в диссертационной работе результаты рекомендуется использовать для внедрения системы идентификации лиц в условиях недостаточной освещенности и шумовой окружающей среды.
Апробация
1. Международная научно-техническая конференция «Пром- Инжиниринг», (Сочи, 2019).
2. IEEE Conference of Russia Young Researchers in Electrical and Electronic Engineering (2020 EIConRus), organized by Moscow, National Research University of Electronic Technology «MIET», (Зеленоград, 2020).
3. Международная научно-техническая конференция «Пром- Инжиниринг», (Сочи, 2020).
4. Всероссийская студенческая конференция «Студенческая научная весна», (Москва, 2018).
5. Всероссийская студенческая конференция «Студенческая научная весна», (Москва, 2019).
Публикации
По результатам исследований опубликовано 7 научных работ, в числе которых 2 работы в журналах, входящих в список, утвержденный ВАК, 4 в материалах конференций, включенных в базу данных SCOPUS и 1 тезис доклада на научных конференциях.
Структура работы
Диссертация состоит из введения, четырех глав, заключения, списка сокращений, списка литературы, который содержит 131 наименований. Объем диссертации: 130 страниц, включая 60 рисунков, 15 таблиц и 3 листинга.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Читать

Помогаем с подготовкой сопроводительных документов

Совместно разработаем индивидуальный план и выберем тему работы Подробнее

Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее

Поможем в написании научных статей для публикации в журналах ВАК Подробнее

Структурируем работу и напишем автореферат Подробнее

Хочешь уникальную работу?

Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все

Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.

#Кандидатские #Магистерские

5 Выполненных работ

Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все

Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.

#Кандидатские #Магистерские

592 Выполненных работы

Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все

Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.

#Кандидатские #Магистерские

27 Выполненных работ

Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все

Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ

#Кандидатские #Магистерские

117 Выполненных работ

Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все

Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.

#Кандидатские #Магистерские

55 Выполненных работ

Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях

#Кандидатские #Магистерские

495 Выполненных работ

Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных... Читать все

Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных исследований, связанных с журналистикой, филологией и литературой

#Кандидатские #Магистерские

33 Выполненных работы

Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных с... Читать все

Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных статей в области экономики.

#Кандидатские #Магистерские

56 Выполненных работ

Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все

Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.

#Кандидатские #Магистерские

213 Выполненных работ