Идентификация пользователей компьютерных систем на основе динамических характеристик клавиатурного почерка
В процессе исследования проводились работы по исследованию существующих алгоритмов и методик анализа клавиатурного почерка. В результате работы был создан алгоритм, а также спроектирована и реализована система идентификации пользователей компьютерных сетей на основе динамических характеристик клавиатурного почерка.
РЕФЕРАТ ………………………………………………………………………………………………… 11
Определения, обозначения, сокращения, нормативные ссылки …………………. 12
Введение ………………………………………………………………………………………………….. 16
1 Обзор технологий и решений …………………………………………………………………. 17
1.1 Цели и задачи …………………………………………………………………………………… 17
1.2 Современное состояние проблемы ……………………………………………………. 18
1.2.1 Характеристики клавиатурного почерка ……………………………………… 18
1.2.2. Сбор данных ……………………………………………………………………………… 20
1.2.3 Алгоритмы распознавания на основе клавиатурного почерка………. 21
1.2.4 Показатели эффективности алгоритмов ………………………………………. 26
1.3 Прикладные задачи ………………………………………………………………………….. 28
1.4 Актуальность исследования ……………………………………………………………… 29
2 Проектирование …………………………………………………………………………………….. 31
2.1 Функциональные возможности системы …………………………………………… 31
2.2 Алгоритм работы программы ………………………………………………………… 32
2.3 Выбор средств разработки ……………………………………………………………….. 40
2.4 Архитектура системы ……………………………………………………………………. 42
3 Реализация и тестирование…………………………………………………………………….. 45
3.1 Описание интерфейса ………………………………………………………………………. 45
3.2 Сбор тестовых данных ………………………………………………………………….. 47
3.3 Тестирование программы …………………………………………………………………. 50
4 Финансовый менеджмент ………………………………………………………………………. 58
4.1 Предпроектный анализ …………………………………………………………………….. 58
4.1.1 Потенциальные потребители результатов исследования ……………… 58
4.1.2 Анализ конкурентных технических решений с позиции ………………. 59
ресурсоэффективности и ресурсосбережения ……………………………………… 59
4.1.3 SWOT-анализ ……………………………………………………………………………… 60
4.1.4 Оценка готовности проекта к коммерциализации ………………………… 61
4.1.5 Методы коммерциализации результатов научно-технического
исследования………………………………………………………………………………………. 61
4.2 Инициация проекта ………………………………………………………………………….. 62
4.2.1 Ограничения и допущения проекта. ……………………………………………. 63
4.3 Планирование управления научно-техническим проектом ………………… 64
4.3.1 План проекта………………………………………………………………………………. 64
4.3.2 Бюджет научного исследования ………………………………………………….. 64
4.3.2 Организационная структура проекта …………………………………………… 66
4.3.3 План управления коммуникациями проекта ………………………………… 67
4.3.4 Реестр рисков проекта ………………………………………………………………… 68
4.4 Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности исследования . 68
4.4.1 Оценка абсолютной эффективности исследования ………………………. 68
4.4.2 Оценка сравнительной эффективности исследования ………………….. 70
5 Социальная ответственность ………………………………………………………………….. 74
5.1 Введение ………………………………………………………………………………………….. 74
5.2 Производственная безопасность……………………………………………………….. 74
5.3 Экологическая безопасность …………………………………………………………….. 81
5.4 Безопасность в чрезвычайных ситуациях ………………………………………….. 82
5.5 Правовые и организационные вопросы обеспечения безопасности……. 83
5.6 Вывод ………………………………………………………………………………………………. 84
Заключение………………………………………………………………………………………………. 85
Conclusion ………………………………………………………………………………………………… 87
Список литературы…………………………………………………………………………………… 88
Список публикаций ………………………………………………………………………………….. 92
Приложение А………………………………………………………………………………………….. 93
Приложение Б ………………………………………………………………………………………… 100
1 Overview of technologies and solutions …………………………………………………… 101
1.1 Goals and objectives…………………………………………………………………………. 101
1.2 Present state of the problem ………………………………………………………………. 102
1.3 Practical application …………………………………………………………………………. 108
1.4 Relevance of the research ………………………………………………………………….. 109
Приложение В ………………………………………………………………………………………… 110
В современном мире важность информации сложно переоценить. Для
её защиты широко применяется аутентификация и авторизация.
Аутентификация – это процедура проверки подлинности. Под авторизацией
понимается процедура предоставления пользователю определенных прав.
Различают три типа методов аутентификации:
• Парольные;
• Имущественные;
• Биометрические.
Наиболее распространены в настоящее время парольные методы. Они
просты в реализации и обладают высокой точностью: всегда можно
определить, совпадают пароли или нет. Имущественные методы
предполагают использование специальных устройств, например, USB-
ключей, для подтверждения личности.
Биометрические методы основаны на определении личности человека
по присущим только ему признакам. Основное достоинство биометрических
методов состоит в том, что такие признаки невозможно украсть или передать
другому человеку.
Биометрические методы делятся на физиологические и
поведенческие. К физиологическим методам относится сканирование
отпечатков пальца, радужной оболочки глаза, формы лица и т.д.
Поведенческие методы предполагают анализ речи, рукописного и
клавиатурного почерка, походки. Поведенческие характеристики сложнее
распознать с высокой точностью, но вместе с тем, сложнее и подделать.
Целью работы является разработка методики и программного
обеспечения для идентификации пользователей компьютерных систем по
динамическим характеристикам клавиатурного почерка.
1 Обзор технологий и решений
1.1 Цели и задачи
Цель работы: Развитие задач теории распознавания, формирование
новых динамических характеристик клавиатурного почерка (КП) и
разработка на этой основе способов и алгоритмов идентификации и
аутентификации пользователя с реализацией прототипа программного
приложения.
Для достижения поставленной цели необходимо решить следующие
задачи.
1. Анализ тенденций и подходов к проблематике использования
биометрических параметров в целях аутентификации пользователя.
2. Исследование современных подходов к распознаванию КП
пользователей.
3. Анализ существующих характеристик КП. Анализ их
идентификационной способности для распознавания пользователей по
существующим характеристикам. Создание векторного динамического
показателя КП для сравнения двух и более образцов клавиатурного почерка.
4. Анализ механизма формирования характеристик КП при нажатии
клавиш. Получение математической модели формирования характеристик
КП.
5. Разработка алгоритма сбора образцов КП для получения
векторного динамического показателя. Создание программного приложения
для сбора статистики.
6. Сбор статистики показателей КП пользователей. Создание банка
данных показателей КП для разных категорий населения.
7. Анализ статистических данных, обработка данных, выделение
закономерностей. Исследование разрешающей способности статистических
данных.
8. Исследование существующих критериев различия (близости)
характеристик КП. Создание векторного дискриминантного критерия оценки
совпадения образцов КП с использованием частотности букв русского языка
и существующих метрик близости.
9. Разработка гибридного метода анализа КП для выявления
попытки несанкционированного входа и аутентификация
зарегистрированного пользователя.
10. Разработка программного приложения для получения образцов
КП пользователей, аутентификации зарегистрированных пользователей и
предотвращения попыток несанкционированного доступа.
1.2 Современное состояние проблемы
1.2.1 Характеристики клавиатурного почерка
В [1] и [2] приводится характеристика стабильности почерка
пользователей. Оценка означает пригодность почерка для анализа
клавиатурного почерка. Предлагается отсеивать пользователей, чей почерк
недостаточно стабилен, во избежание дискредитации системы.
Таблица 1 – Характеристики стабильности клавиатурного почерка
пользователей
Ошибки Аритмичность Скорость Характеристика Оценка
,% ,% , зн./мин перекрытий
Число Используемо
перекрытий е число
,% пальцев
Менее 2 Менее 10 Более 200 Более 50 Все Отличн
о
Менее 4 Менее 15 Более 150 Более 30 Большинство Хорошо
Менее 8 Менее 20 Более 100 Более 10 Несколько Удовл.
Более 8 Более 20 Менее Менее 10 По одному Неуд.
18
Как правило, необходимо 6 месяцев работы с клавиатурой, для того
чтобы клавиатурный почерк стабилизировался.
Клавиатурный почерк характеризуется рядом параметров:
• Время удержания клавиши (ВУК);
• Паузы между нажатиями;
• Наличие наложений;
• Число ошибок при вводе;
• Степень аритмичности при наборе;
• Скорость набора;
• Особенности использования служебных клавиш.
На рисунке 1 показаны основные характеристики КП: время
удержания клавиши и пауза между нажатиями.
В результате работы были получены новые теоретические сведения об
отличительных особенностях клавиатурного почерка, пригодные для
использования в качестве дискриминантного признака. В работе
рассматривались существующие характеристики КП и был сформирован
векторный динамический показатель. Была создана математическая модель
клавиатурного нажатия при использовании персонального компьютера.
Составлен алгоритм и реализовано программное приложение для
сбора динамических характеристик КП и создания банка данных с образцами
почерка пользователей. Полученная таким образом база данных образцов КП
содержит образцы КП более 50 пользователей. В ней сохраняются такие
сведения как среднее время удержания каждой клавиши, среднее время пауз
между нажатиями, количество ошибок ввода, а также уникальные
идентификаторы пользователей. Для каждого пользователя сохранено от 1 до
10 образцов почерка.
Кроме того, собранные сведения были дополнены данными из БД
европейских пользователей, накопленной учеными из Мадридского
автономного университета, Испания. В результате удалось собрать БД из 300
пользователей различного возраста, пола, национальности и рода
деятельности.
Был составлен алгоритм, реализующий гибридный метод для решения
задачи аутентификации зарегистрированного пользователя или
идентификации попытки несанкционированного доступа. Для сравнения
образов КП использовался векторный дискриминантный критерий
эффективности.
Реализовано программное приложение, имеющее клиент-серверную
архитектуру. Серверная часть системы отвечает за хранение и обработку
данных о характеристиках КП пользователей. Клиентская часть системы
собирает необходимые сведения путем мониторинга клавиатурных нажатий.
Для повышения эффективности алгоритма распознавания
планируется исследовать возможность применения биоинспирированных
методов анализа. Кроме того, планируется продолжать сбор статистики
динамических характеристик клавиатурного почерка и проведение более
масштабного тестирования.
Conclusion
As a result of the work, new theoretical knowledge was acquired on the
features of keystroke dynamics, suitable for use as a discriminant characteristic.
The existing characteristics of keystroke dynamics were considered and a vector
dynamic indicator was generated in this work. A mathematical model of keyboard
pressing was created for a user with a personal computer.
An algorithm was developed and a software application was implemented
to collect the dynamic characteristics of keystroke dynamics and create a data bank
with samples of users’ keystroke dynamics. The obtained database of keystroke
dynamics samples contains data for more than 50 users. It stores such information
as the average dwell time of each key, the average flight time, the number of input
errors, and unique user IDs. From 1 to 10 keystroke dynamics samples is saved for
each user.
Additionally, the collected information was supplemented with data from
the database of European users, gained by scientists from the Madrid Autonomous
University, Spain. As a result, it was possible to collect a database of 300 users of
different ages, gender, nationality and occupation.
An algorithm was implemented. It uses a hybrid method to solve the
problem of authenticating a registered user or identifying an attempted
unauthorized access. A vector discriminant efficiency criterion was used to
compare keystroke dynamics samples.
A software application that has client-server architecture was implemented.
The server part of the system is responsible for storing and processing data of the
characteristics of user keystroke dynamics. The client part of the system collects
the necessary information by monitoring keyboard pressings.
To increase the efficiency of the recognition algorithm, it is planned to
investigate the possibility of using bioinspired methods of analysis. In addition, it
is planned to continue collecting statistics on the characteristics of keystroke
dynamics and to conduct more tests.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!