Синтез структуры и алгоритмов функционирования кросс-доменной системы распознавания лиц для условий низкой освещенности

Найнг Мин Тун
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

ОГЛАВЛЕНИЕ
Стр. ВВЕДЕНИЕ
ГЛАВА 1. ПОДХОДЫ К ПОСТРОЕНИЮ СИСТЕМ РАСПОЗНАВАНИЯ ЛИЦПОИЗОБРАЖЕНИЮВУСЛОВИЯХСЛАБОЙОСВЕЩЕННОСТИ……….14 1.1. Биометрическая система распознавания лиц
1.2. Проблемы, возникающие в процессе распознавания лиц
1.3. Анализ источников, обеспечивающих спектральные системы визуализации
1.4. Методы, обеспечивающие распознавание лиц с использованием
ближнего инфракрасного источника
1.4.1. Гетерогенная биометрия лица
1.4.2. Анализ методов и алгоритмов, используемых в задаче гетерогенного распознавания лиц
1.5. Методы, обеспечивающие шумоподавление с использованием
нейронных сетей
1.6. Формализация задачи системы распознавания лиц
1.7. Выводы по главе 1
ГЛАВА 2. РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ РЕШЕНИЯ ЗАДАЧ ГЕТЕРОГЕННОГО РАСПОЗНАВАНИЯ ЛИЦ
2.1. Архитектура системы распознавания лиц
2.2. Методология построения предлагаемой гетерогенной системы распознавания лиц
2.2.1. Что такое глубокое обучение?
2.2.2. Искусственная нейронная сеть
2.2.3. Функция активации
2.2.4. Свёрточный слой
2.2.5. Пулинговый слой
3
Стр
.2.6. Полностью соединенные слои
2.2.7. Нормализация
2.2.8. Функция потерь
2.2.9. Методы регуляризации
2.2.10. Градиент и обратное распространение
2.2.11. Оптимизационные методы
2.3. Модель шумоподавления на основе автоэнкодера
2.4. Обнаружение лиц
2.4.1. Проблемы в области обнаружения лиц
2.4.2. Алгоритм на основе каскада Хаара
2.4.3. Алгоритм гистограммы направленных градиентов (HOG)
2.4.4. DNN детектор лица
2.5. Построение кросс-доменной модели на основе базовой модели ЦГСС
2.6. Детектирование признаков
2.7. Классификация признаков
2.7.1. Теория SVM
2.7.2. Алгоритм классификации SVM
2.7.3. Алгоритм «один-против-покоя» (One-against-rest)
2.7.4. Алгоритм «один-против-одного» (One-against-one)
2.8. Выводы по главе 2
ГЛАВА 3. РЕАЛИЗАЦИЯ РАЗРАБОТАННЫХ АЛГОРИТМОВ В СИСТЕМЕ ГЕТЕРОГЕННОГО РАСПОЗНАВАНИЯ ЛИЦ
3.1 Выбор средств разработки
3.1.1. Средства для разработки программного обеспечения
3.1.2. Аппаратные средства для разработки

4
Стр
.2. Реализация разработанных алгоритмов с помощью ПО и использование
необходимых предварительно обученных моделей
3.2.1. Реализация разработанных алгоритмов
3.2.2. Реализация пред-обученных моделей
3.3. Выводы по главе 3
ГЛАВА 4. РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ И ОЦЕНКИ ЭКСПЕРИМЕНТОВ

4.1. Планирование эксперимента
4.2. База данных
4.2.1. CASIA NIR-VIS 2.0 Face Database
4.2.2. Собственная база данных
4.3. Блок-схема алгоритма функционирования гетерогенной системы распознавания лиц
4.4. Методы оценки распознавания лиц
4.4.1. Общая Точность (Accuracy)
4.4.2. Частота ошибок (Error rate)
4.4.3. Точность (Precision)
4.4.4. Полнота (Recall)
4.4.5. F-мера (F-measure)
4.5. Результаты экспериментов
4.4. Выводы по главе 4
ОБШИЕ ВЫВОДЫ И ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ

Во введении содержится обоснование актуальности темы диссертации, формулируются цели и задачи исследования, научная новизна, практическая ценность результатов, а также кратко изложено содержание разделов диссертации.
В первой главе содержатся общие сведения о биометрических системах. Описываются процессы формирования нового биометрического шаблона на основе данных, основные принципы построения систем распознавания лиц и процедура решения биометрической системой задачи «список наблюдения».
Рассматриваются различные проблемы, с которыми приходится сталкиваться в задаче распознавания лиц. Рассматриваются способы решения проблемы вариаций освещения и отсутствия освещения. Для решения проблемы низкого освещения проведен анализ источников, обеспечивающих спектральные системы визуализации. В качестве подсветки выбирается ближний
инфракрасный диапазон. Анализируются методы, обеспечивающие распознавание лиц с использованием изображений в ближнем ИК-диапазоне.
Гетерогенные системы распознавания лиц обеспечивают соответствие между различными системами визуализации, либо различными спектральными полосами, либо модальностями. Рассматриваются области применения гетерогенного распознавания лиц.
Проведен анализ методов и алгоритмов, используемых в задаче преобразования ближнего инфракрасного домена в визуальный домен. Проведен анализ методов шумоподавления с использованием нейронных сетей в качестве предварительной обработки. Представлена формализация задачи системы распознавания лиц в соответствии данной работы.
Вторая глава посвящена методами и алгоритмами решения задач гетерогенного распознавания лиц. Проведена разработка архитектуры системы распознавания лиц, обеспечивающая возможность использования в зашумленной и темной окружающей среде (см. Рисунок. 1). Приводится описание методов, используемых в построении предложенной гетерогенной системы распознавания лиц.
Рисунок 1.
Процедура функционирования гетерогенной системы распознавания лиц.
Разработана модель шумоподавления на основе автоэнкодера и её структура функционирования (Рисунок 2).
Рисунок 2.
Функционирование автоэнкодера по шумоподавлению изображения.
5

Математическая модель автоэнкодера имеет следующий вид:
: →
: → ′
, = argmin‖ −( ∘ ) ′‖2
,
где , − функции энкодера и декодера. , ′, − входное изображение, реконструированное изображение и латентный вектор, соответственно. сопоставляет входное изображение с латентным вектором . сопоставляет латентный вектор с выходное изображение ′.
Сеть энкодера может быть представлена стандартной функцией нейронной сети через функцию активации:
= ( + )
Аналогично, сеть декодера может быть представлена в той же форме, но с другим весом, смещением и используемой функцией активации.
′ = ′( ′ + ′)
где, ′, ′, ′ параметры сети декодера могут быть не связаны, а , , – параметры сети энкодера.
Разработана кросс-доменная модель на основе существующей модели ЦГСС для решения задачи преобразования модальности изображения. Результаты преобразования модальности изображения, генерируемые существующей моделью ЦГСС, являются не высокими по качеству формирования изображения, что может привести к плохой производительности системы идентификации лиц (см. Рисунок 3).
Рисунок 3.
Пример результата преобразования модальности изображения с помощью существующей модели ЦГСС.
На Рисунке 4 представлена разработанная кросс-доменная модель с использованием существующей модели ЦГСС. Модифицированная часть предлагаемой модели представлена в красном пунктирном прямоугольнике.
Рисунок 4.
Предложенная кросс-доменная модель для преобразования модальности изображения.
Существующая модель ЦГСС состоит из двух генераторов ( , ) и двух дискриминаторов ( , ). Каждый генератор имеет соответствующую модель дискриминатора. Функция генератора состоит в создании синтезированных изображений, а функция дискриминатора состоит в определении различий между реальными изображениями и синтезированными изображениями.
Генератор производит синтезированные изображения и дискриминатор пытается различить эти синтезированные изображения и реальные изображения из домена ; дискриминатор различает реальные изображения из домена и синтезированные изображения, произведенные генератором .
Для генератора : → существующей модели ЦГСС и связанного дискриминатор , состязательная потеря формулируется следующим образом:
2 ( , , , ) = ~ ( ) [( ( ( )) − 1) ]
где

22 ( , , , ) = ~ ( ) [( ( ) − 1) ] + ~ ( ) [ ( ( )) ]
, − исходные данные из доменов и , ∈ , ∈ .
( , , , ), ( , , , )− состязательные потери генератора и дискриминатора для прямого цикла модели ЦГСС. , − матожидание для реальных данных и синтезированных данных. ( ) и ( ) обозначают
выборочные распределения в доменах и , соответственно. Для генератора
: → и связанного с ним дискриминатора , состязательная представлена следующим образом:
2 ( , , , )= ~ ( ) [( ( ( ))−1) ]
потеря

2 ( , , , )= ~ ( )[( ( )−1) ]+ ~ ( ) [ ( ( )) ]
2
где ( , , , ), ( , , , )−состязательные потери генератора и дискриминатора для обратного цикла модели ЦГСС.
Таким образом, общая потеря состязательности может быть записана следующим образом:
,
= ( , , , )+ ( , , , )

= ( , , , )+ ( , , , )
, = +
,
где − общая состязательная потеря для генератора и генератора . −
общая состязательная потеря для дискриминатора и дискриминатора . − общая состязательная потеря для всех состязательных потерь генераторов и дискриминаторов.
Для восстановления исходного изображения после цикла преобразования, в качестве второго набора функций потерь, потери цикл-консистенции представляется следующим образом:
= ~ ( ) [‖ ( ( )) − ‖1] + ~ ( ) [‖ ( ( )) − ‖1] где − потеря цикла-консистенции.
Полная потеря существующей модели ЦГСС может быть представлена следующим образом:
= 1 + 2
где − полная функция потеря. 1, 2 − весовые значения. Результаты преобразования модальности изображения не удовлетворяются при использовании существующей модели ЦГСС, как показано на Рисунке 3. Разработана модификация существующей модели ЦГСС добавлением новых функций потери, называемых потерей идентичности и потерей края. Функция потери идентичности и потери удержания края представлены следующим образом:
= ~ ( )[‖ ( ) − ‖1] + ~ ( )[‖ ( ) − ‖1]
= ~ ( ) [‖ ( ( )) − ( )‖1] + ~ ( ) [‖ ( ( )) − ( )‖1]

где , − потеря идентичности и потеря удержания края. − Сеть для извлечения границ изображения с целью вычисления предполагаемой потери удержания границ.
Функция потери идентичности и потери удержания края оптимизируют существующую модель ЦГСС во время обучения. Новая модифицированная полная функция потерь представлена следующим образом:
= 1 + 2 + 3 + 4
где 3, 4 − весовые значения.
Рассмотрены известные методы обнаружения лиц, метод детектирования
признаков и метод классификации признаков как предварительно обученных моделей.
В третьей главе приведена реализация разработанного комбинированного метода для решения задачи распознавания личности в зашумленной и темной окружающей среде. Проведен выбор средств для разработки аппаратного и программного обеспечения.
Реализована модель шумоподавления на основе метода автоэнкодера (Рисунок 5).
xZx
Входноеизображение (128 х 128 х 3)
Входной слой (128 х 128 х 3)
Латентное пространство
Выходное изображение (128 х 128 х 3)
Conv2D (128 х 128 х 64)(128 х 128 х 3)
Conv2D x 2 (128 х 128 х 64)
Upsampli ng2d
Maxpooli ng2d (64 х 64 х 64)
Conv2D x 2 (64 х 64 х 32)
Maxpooli ng2d (32 х 32 х 32)
Conv2D x 2 (32 х 32 х 32)
Upsampli ng2d (64 х 64 х 32)
Conv2D x 2 (64 х 64 х 64)
Рисунок 5.
Архитектура модели шумоподавления на основе метода модифицированного автоэнкодера.
В разработанной модели настройки были изменены путем дублирования сверточных слоев в энкодере и декодере.
Приведен сравнительный анализ разработанной модели шумоподавления с другими методами шумоподавления за счет пикового отношения сигнал / шум (PSNR). Чтобы вычислить PSNR, используется следующее уравнение:
PSNR=10log  R2  10MSE
где R – максимально возможное значение яркости пикселя изображения. MSE представляет собой среднеквадратичную ошибку между сжатым и исходным изображением:
 
 = 0.10  = 0.15  = 0.20
19.99 29.80 16.45 26.62 14.03 24.50
29.73 26.69 27.89 23.73 26.84 21.67
31.91 29.88 27.35
MN Результаты сравнения представлены в Таблице 1.
I (m,n)−I (m,n)2 12
MSE = M ,N 
где M и N — это количество строк и столбцов во входных изображениях.

Таблица 1. Сравнительные результаты различных методов шумоподавления за счет
пикового отношения сигнал / шум.
значение параметра помехи
С шумом
Медианный метод
Байесшринк
Висушринк
Модифициров- анный автоэнкодер
Результаты шумоподавления на случайно выбранном тестовом изображении из ORL базы данных представлены на Рисунке 6.
Рисунок 6.
Сравнение результатов на зашумленном изображении с использованием различных методов шумоподавления.
Проведена реализация модели преобразования модальности изображения в виде программного обеспечения. Предложенная модифицированная кросс- доменная модель построена с пропускными соединениями для генераторов, U- Net для два детектора границ и обычные свёрточные сети для дискриминаторов. Построены модели с использованием Keras API, а оптимизатор Adam был использован для изменения атрибутов нейронной сети, таких как вес и скорость обучения, чтобы уменьшить потери.
Для построения предложенной кросс-доменной модели необходимо реализовать два генератора, два дискриминатора и два детектора границ. Сетевые архитектуры генератора, дискриминатора и детектор границ представлены на Рисунке 7, Рисунке 8 и Рисунке 9., соответственно. График потери во время обучения генераторов и дискриминаторов на основе базовой модели ЦГСС и модифицированной модели ЦГСС показаны на Рисунке 10.
Рисунок 7.
Сетевая архитектура генератора.
Рисунок 8.
Сетевая архитектура дискриминатора.
Рисунок 9.
Сетевая архитектура краевого детектора.
Рисунок 10.
График потери при обучении базовой модели ЦГСС и предложенной кросс- доменной модели (а) потери генераторов (б) потери дискриминаторов.
Разработанная кросс-доменная модель была обучена на базе данных CASIA NIR-VIS 2.0 после построения сетей генераторов и дискриминаторов, результаты представлены на Рисунке 11.
Рисунок 11.
Результаты преобразования домена изображения с использованием предложенной кросс-доменной модели.
Осуществлена реализация методов обнаружения лиц, детектирования признаков и классификации признаков в виде программного обеспечения. Произведен сравнительный анализ трех известных методов обнаружения лиц и представлен обзор преимуществ и недостатков этих методов.
Использована модель “FaceNet” в качестве предварительно обученной модели детектирования признаков. Для классификации личностей использован метод опорных векторов.
В четвертой главе приводятся результаты экспериментальных исследований описанных методов. В начале главы проведено планирование эксперимента. Задача идентификации решается для трех различных условий: статические изображения без шумов, статические изображения с шумами и идентификация лиц на видеопоследовательности в режиме реального времени.
Тестирование алгоритма предложенного комбинированного метода проводилось на следующих наборах данных:
– База данных CASIA NIR-VIS 2.0 включает в себя в общей сложности 725 различных людей. На одного человека приходится 1-22 изображения лица в видимом спектре и 5-50 изображений лица в ближнем инфракрасном спектре. База данных использована для тестирования статистических изображений.
– Собственная база данных содержит набор изображений лица 10 разных людей. В базе содержится набор видимого спектра и набор инфракрасного спектра (по 10 изображений на одного человека). База данных использована с целью тестирования видеопоследовательности в режиме реального времени.
Для оценки эффективности системы идентификации лиц с использованием предложенного комбинированного метода применяются следующие критерии:
– критерий полноты системы (Recall), показывающий отношение количества верных идентификаций лиц к общему числу лиц на изображениях.
= +
где , − истинно-положительное решение и ложноотрицательное решение, соответственно.
– критерий точности системы (Precision), показывающий долю верных идентификаций лиц среди всех результатов идентификации.
= +
где − ложноположительное решение.
– кривая точности и полноты (precision and recall curve – PRC),
используемая для оценки качества классификатора, что является полезным показателем успешности прогнозирования, когда классы изображений несбалансированные.
– общая точность, определяющаяся как доля количества правильной классификации во всем числе образцов.
Результаты эксперимента идентификации лиц на статических изображениях при отсутствии и наличии шумов представлены на Рисунке 12, сравнение с другими альтернативными методами гетерогенного распознавания лиц представлено в Таблице 2.
13

Рисунок 12.
Различные точности идентификации в виде кривой PRC при отсутствии и наличии шумов.
Таблица 2. Сравнение точности (%) на базе данных CASIA NIR-VIS 2.0 и сравнение
времени обработки на видеопоследовательности.
Метод
Точность
Время обработки (кадров в секунду)
DSIFT
CDFL Gabor+RBM LCFS H2(LBP3) CEFD HFR-CNN TRIVET
IDNet IDR-128
ADFL
VGG SeetaFace CenterLoss Light CNN Предложеный метод
В
видеопоследовательность в режиме реального времени. В этом эксперименте рассматривались вопросы использования разработанной кросс-доменной модели и отказа от использования этой модели в темной среде. Результаты приведены на Рисунке 13.
73.3 ±1.10 71.5±1.40 86.2±0.98 35.4±2.80 43.8
85.6 85.9±0.90 95.7±0.52 87.1±0.88 97.3±0.43 98.2±0.34 62.1±1.88 68.0±1.66 87.7±1.45 96.7±0.23 98.7±0.39






≈ 1.18 ≈ 1.43 ≈ 1.67 ≈ 1.53 ≈ 2.23 ≈ 1.25 ≈ 1.82 ≈ 2.01 ≈ 3.34 ≈ 4.02
14
конце главы для
идентификации
людей
используется

Рисунок 13.
Результаты тестирования на видеопоследовательности при отказе от использования разработанной кросс-доменной модели и при использовании её в предложенном комбинированном методе.
По результатам идентификации лиц на видеопоследовательности в режиме реального времени, можно заметить, что предложенный комбинированный метод без разработанной кросс-доменной модели дал низкую производительность идентификации лиц, а при использовании разработанной кросс-доменной модели в предлагаемом комбинированном методе можно получить надежную производительность для идентификации лиц.
ЗАКЛЮЧЕНИЕ
В диссертационной работе решена актуальная научно-техническая задача исследования и разработки алгоритмов идентификации лиц на статических изображениях и на видеопоследовательностях в условиях слабого освещения или абсолютно тёмной окружающей среды.
Представленная диссертационная работа в соответствии своими с целями и задачами содержит следующие результаты:
1. Разработаны алгоритмы распознавания личности в условиях слабого освещения, или полного отсутствии освещения с применением методов шумоподавления, обнаружения лиц, преобразования домена изображения, детектирования и классификации признаков.
2. Разработана модель шумоподавления на основе сети автоэнкодера, обеспечивающая уменьшение шума в изображениях, позволяющая распознавать личность в зашумленных сценариях.
3. Разработана модифицированная кросс-доменная модель на основе существующей модели ЦГСС, позволяющие генерировать видимые изображения лучшего качества из изображений в ближнем ИК диапазоне.
4. Разработаны структура и алгоритмы функционирования системы на основе совокупности разработанных моделей и предварительно
обученных моделей, позволяющие идентифицировать личность в условиях
слабого освещения.
5. Разработано и внедрено в автоматизированные системы программное
обеспечение для распознавания лиц в условиях слабого освещения или отсутствия освещения для статических изображений и видеопоследовательностей.

Актуальность выбора темы данного исследования обусловлена тем, что на сегодняшний день технология распознавания лиц является одним из самых перспективных и востребованных направлений, так как несмотря на то, что основными сферами применения данной технологии остаются безопасность и системы обеспечения физического доступа, уже сейчас ученые и разработчики задумываются о распространении алгоритмов во всех сферах деятельности человека.
К примеру, биометрическое распознавание лиц позволяет диагностировать заболевания, которые проявляются в изменении мимики, что даст возможность выявлять болезнь Альцгеймера на ранней стадии, либо обнаруживать генетические заболевания, такие как синдром Ди Джорджа с вероятностью успеха 96,6%. Транспортные компании начинают внедрять биометрические технологии для мониторинга усталости водителей.
Еще одним перспективным сценарием развития распознавания лиц является использование в области маркетинга, так как биометрические технологии в десятки раз ускоряют контроль планограмм, позволяют анализировать покупательские предпочтения, чем повышают продажи. Кроме того, с их помощью можно сократить убытки торговых предприятий за счет того, что системы распознавания лиц правильно идентифицируют потенциальных преступников, готовых на кражу.
Биометрические технологии используются в качестве идентификатора для платежных систем, когда покупку становится возможно оплатить с помощью сканирования лица покупателя, и др.
Как уже говорилось выше, на сегодняшний день наиболее часто система распознавания лиц используется в охранных системах и правоохранительными органами. Технологии интеллектуального распознавания лиц совмещены с системами видеонаблюдения на улицах городов, в общественном транспорте, в магазинах, банках, что позволяет ежедневно анализировать миллионы лиц, среди которых может скрываться как потенциальный преступник, уже занесенный в базу МВД, так и готовящийся совершить преступление.
Однако несмотря на растущую популярность и широкое применение технологий интеллектуального распознавания лиц, в настоящее время существует и ряд недостатков, выявленных при их применении.
Во-первых, одним из существенных недостатков системы распознавания лиц является то, что в действительности камеры видеонаблюдения, установленные на улицах, в транспорте и других общественных местах, не способны прицельно следить за всеми перемещениями каждого отдельного человека.
Во-вторых, существенно снижают качество распознавания лиц так называемые «шумы» – помехи, которые могут быть вызваны различного рода световыми бликами, воздействием влажности, тумана, дождя, посторонних предметов, изменением позы, окклюзией, и что особенно важно – недостаточной освещенностью объекта наблюдения.
Однако несмотря на то, что в ученой среде разрабатываются так называемые «методы глубокого обучения» искусственного интеллекта, который играет ведущую роль в системах распознавания лиц, до сих пор не удалось полностью нивелировать влияние шумов и освещенности на качество идентификации объектов наблюдения.
Так, если в развитых странах данную проблему можно решить за счет оптимизации освещенности мест возможного расположения систем видеонаблюдения с функцией распознавания лиц, то в странах развивающихся правоохранительные органы зачастую сталкиваются с невозможностью получить качественное изображение для идентификации ввиду частичного или полного отсутствия освещенности.
С учетом вышесказанного, представляется важным разработка такой системы распознавания лиц, которая могла быть использована на объектах с повышенным визуальным шумом, а также в условиях слабой освещенности, что позволит правоохранительным органам и охранным структурам контролировать как можно больше территорий и объектов с повышенной криминогенной обстановкой.
Как и многие современные задачи визуализации, проблемы освещения, как правило, решаются с помощью программного обеспечения, предназначенного либо для максимального использования доступного света, либо для генерирования света, чтобы видеокамеры наблюдения могли создавать более качественные видеоизображения в условиях низкой освещенности.
По большей части, проблемы, связанные с условиями низкой освещенности, могут быть решены с помощью ряда технологий, к которым относятся видеокамеры наблюдения с современными режимами работы день/ночь, и путем объединения ряда распространенных технологий обработки изображений.
Однако система распознавания лиц действует неэффективно при использовании инфракрасного изображения, которое производится видеокамерой ночного видения, так как многие приложения требуют, чтобы регистрация шаблонов лиц основывалась на видимых изображениях (VIS), которые используются при регистрации с использованием паспорта или удостоверения личности. Таким образом, необходимо преобразовать изображения ближнего инфракрасного диапазона в видимые изображения. Такая система распознавания лиц, преобразующая изображение из одного диапазона в другое, называется гетерогенной системой распознавания лиц.
Существует две основные задачи, решаемые системами распознавания лиц: система верификации и система идентификации. В настоящей работе автором предлагаются методы совокупности для построения системы идентификации лиц по спискам для использования в ночное время, которая является частным случаем системы идентификации. Данный вид систем имеет широкую область применения, ниже перечислены наиболее актуальные приложения:
– Системы наблюдения, устанавливаемые в общественных местах, на улицах, транспорте. Список идентификации в таком случае может включать пропавших детей, людей, находящихся в розыске, и др. В этом случае система распознавания будет осуществлять мониторинг лиц, появляющихся в области видимости камер наблюдения;
– Системы безопасности финансовых организаций (к примеру банки, кредитные учреждения), где вероятность возникновения угроз весьма велика, причем кража или повреждение имущества в таких организациях обычно происходит в ночное время. Имея систему безопасности, которая способна идентифицировать лица в условиях низкой освещенности, можно значительно повысить защищенность собственности и имущества подобных организаций и их вкладчиков;
– Системы распознавания лиц, используемые правоохранительными органами, например, для судебно-медицинского исследования, когда автоматическое распознавание лиц позволит идентифицировать личность человека.
Итак, решение задач автоматической идентификации лиц на изображениях, полученных в неконтролируемых условиях, включает в себя создание алгоритмов шумоподавления, преобразование изображения и распознавание лиц на изображениях. В данной диссертации автором представлена система идентификации лиц с помощью алгоритмов шумоподавления и преобразования изображения.
Цель диссертационной работы:
Разработка алгоритмов идентификации лиц по изображениям, а также видеопоследовательностям, полученным в условиях недостаточной освещенности или повышенного шумового фона.
Основные задачи исследования:
1. Провести аналитический обзор существующих методов и алгоритмов, применяющихся в системах гетерогенного распознавания лиц.
2. Разработать структуру системы гетерогенного распознавания лиц, включающую в себя модель шумоподавления, модель преобразования модальности изображения и модель распознавания лиц. 3. Разработать модель шумоподавления на основе нейронных сетей.
4. Разработать модифицированную математическую модель на основе
циклических генеративных состязательных сетей (ЦГСС), позволяющую преобразовать модальность изображения с учетом требуемого формата.
5. Разработать гетерогенную систему идентификации лиц для условий недостаточной освещенности и проблемно-ориентированное ПО.
6. Провести сравнение эффективности разработанного подхода с использующимися на сегодняшний день альтернативными методами гетерогенного распознавания лиц.
Научная новизна
Научная новизна работы, выносимая на защиту, состоит в следующем:
1. Предложен комбинированный подход к решению задачи идентификации лиц на основе метода глубокого обучения, отличающийся наличием автоэнкодера и позволяющий повысить качество работы системы распознавания лиц по сравнению с другими современными альтернативными методами гетерогенного распознавания лиц за счет эффективного шумоподавления.
2. На основе комбинированного подхода предложена оригинальная структура гетерогенной системы распознавания лиц для работы в условиях пониженной освещенности и зашумленной окружающей среды.
3. Предложена модифицированная математическая модель на основе существующей модели циклических генеративных состязательных сетей (ЦГСС) для преобразования модальности изображения, отличающаяся от известных функцией потерь, и обеспечивающая повышение точности распознавания лиц.
4. Разработан новый алгоритм, основанный на применении предложенного комбинированного подхода, дающий возможность идентифицировать личность на статических изображениях и на видеопоследовательности в режиме реального времени. Научная ценность
Научная ценность диссертационной работы заключается в предложенном оригинальном комбинированном подходе, основанном на использовании методов обнаружения лиц, шумоподавления, преобразования модальности изображения, встраивания признаков и классификации признаков, увеличивающем качество работы системы идентификации лиц как на статических изображениях, так и на видеопоследовательности в реальном времени в условиях низкой освещенности и зашумленной окружающей среды.
Практическая ценность
Практическая ценность диссертационной работы состоит в том, что разработанные алгоритмы в виде программного обеспечения могут применяться в системах правоохранительных органов для идентификации личности, осуществления судебной экспертизы. Реализованные алгоритмы представлены для решения задач гетерогенной системы распознавания лиц на статических изображениях и на видеопоследовательности в режиме реального времени.
Основные положения, выносимые на защиту:
1. Комбинированный подход к решению задачи идентификации личности с использованием оригинальных моделей обнаружения лиц, шумоподавления, преобразования домена изображения, встраивания признаков и классификации признаков, позволяющий повысить качество работы гетерогенной системы распознавания лиц в условиях низкой освещенности и зашумленной окружающей среды.
2. Алгоритм шумоподавления для существенно зашумленных изображений, отличающийся настройками автоэнкодера, и позволяющий повысить качество шумоподавления по сравнению с другими современными альтернативными алгоритмами.
3. Модифицированная математическая модель ЦГСС для преобразования модальности изображения, отличающаяся от известных функцией потерь. Средства моделирования с использованием языка программирования Python, библиотеки глубокого обучения Keras и Tensorflow.
4. Оригинальные структура и алгоритмы функционирования гетерогенной системы распознавания лиц, позволяющие реализовать предложенную методику определения сходства изображений в ближнем ИК диапазоне (NIR) с визуальными эталонами (VIS), хранящимися в базе данных.
Объект исследования
Объектом исследования диссертационной работы является система компьютерного зрения, осуществляющая идентификацию лиц на изображениях и видеопоследовательности в режиме реального времени.
Предмет исследования
Предметом исследования является комбинированный подход к решению задачи идентификации и алгоритмы идентификации лиц.
Методы исследования
В работе использовались методы цифровой обработки изображений, математической статистики, теории глубокого обучения, вероятностных моделей.
Реализация результатов и предложения об использовании.
Материалы диссертационной работы и полученные результаты использованы на кафедре информационных технологий машиностроения из технологического университета (Тханлин) под руководством министерства образования Союза Мьянмы.
Полученные в диссертационной работе результаты рекомендуется использовать для внедрения системы идентификации лиц в условиях недостаточной освещенности и шумовой окружающей среды.
Апробация
1. Международная научно-техническая конференция «Пром- Инжиниринг», (Сочи, 2019).
2. IEEE Conference of Russia Young Researchers in Electrical and Electronic Engineering (2020 EIConRus), organized by Moscow, National Research University of Electronic Technology «MIET», (Зеленоград, 2020).
3. Международная научно-техническая конференция «Пром- Инжиниринг», (Сочи, 2020).
4. Всероссийская студенческая конференция «Студенческая научная весна», (Москва, 2018).
5. Всероссийская студенческая конференция «Студенческая научная весна», (Москва, 2019).
Публикации
По результатам исследований опубликовано 7 научных работ, в числе которых 2 работы в журналах, входящих в список, утвержденный ВАК, 4 в материалах конференций, включенных в базу данных SCOPUS и 1 тезис доклада на научных конференциях.
Структура работы
Диссертация состоит из введения, четырех глав, заключения, списка сокращений, списка литературы, который содержит 131 наименований. Объем диссертации: 130 страниц, включая 60 рисунков, 15 таблиц и 3 листинга.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ

    Последние выполненные заказы

    Другие учебные работы по предмету