Разработка библиотеки нейросетевого распознавания рукописных символов на машинопечатаемых бланках

Авдеев, Николай Геннадьевич Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Объектом исследования являются алгоритмы распознавания рукописных символов на изображении. Цель работы – разработка алгоритмов и библиотеки распознавания машиночитаемых бланков на основе сверточных нейронных сетей. Реализованная библиотека используется в модуле верификации системы для проведения диагностических работ ЕГЭ в РЦОИ Томской области.

ВВЕДЕНИЕ…………………………………………………………………………………… 18

1 СУЩЕСТВУЮЩИЙ БИЗНЕС-ПРОЦЕСС ………………………………. 20

2 ШАБЛОНИЗАЦИЯ БЛАНКОВ ……………………………………………….. 26

3 ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ РАСПОЗНАВАНИЯ … 28

3.1 Искусственные нейронные сети …………………………………………. 28

3.1.1 Сверточные нейронные сети ………………………………………… 33

4 РЕАЛИЗАЦИЯ МЕТОДОВ РАСПОЗНАВАНИЯ НА ОСНОВЕ
СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТИ ……………………………………………………….. 38

4.1 Подготовка обучающей выборки ……………………………………….. 38

4.1.1 Метод эластичных искажений………………………………………. 39

4.2 Обучение нейронной сети ………………………………………………….. 43

4.2.1 Подбор архитектуры нейронной сети для распознавания
букв 47

4.2.2 Подбор архитектуры нейронной сети для распознавания
цифр, минусов и запятых…………………………………………………………………… 49

4.3 Результаты обучения …………………………………………………………. 51

4.4 Реализация программной части ………………………………………….. 54

5 ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ
И РЕСУРСОСБЕРЕЖЕНИЕ ……………………………………………………………………… 56

5.1 Организация и планирование ОКР (НИР) работ …………………. 56

5.1.1 Определение продолжительности этапов работ …………….. 57

5.2 Расчет затрат на выполнение проекта…………………………………. 59

5.2.1 Расчет основной заработной платы ………………………………. 59
5.2.2 Расчет затрат на социальный налог ………………………………. 60

5.2.3 Расчет затрат на электроэнергию ………………………………….. 60

5.2.4 Расчет амортизационных расходов ……………………………….. 61

5.2.5 Расчет прочих расходов ……………………………………………….. 62

5.2.6 Расчет общей себестоимости проекта …………………………… 62

5.2.7 Расчет прибыли ……………………………………………………………. 63

5.2.8 Расчет НДС ………………………………………………………………….. 63

5.2.9 Цена разработки НИР …………………………………………………… 63

5.3 Оценка экономической эффективности проекта …………………. 63

5.3.1 Определение срока окупаемости инвестиций (PP – payback
period) 64

6 СОЦИАЛЬНАЯ ОТВЕТСТВЕННОСТЬ …………………………………… 70

6.1 Правовые и организационные вопросы обеспечения
безопасности ………………………………………………………………………………………… 71

6.1.1 Правовые нормы трудового законодательства для рабочей
зоны оператора ПЭВМ ……………………………………………………………………… 71

6.1.2 Влияние разработанного программного обеспечения на
рабочий процесс ……………………………………………………………………………….. 74

6.2 Производственная безопасность ………………………………………… 75

6.2.1 Вредные производственные факторы ……………………………. 77

6.2.2 Опасные производственные факторы……………………………. 84

6.3 Экологическая безопасность ……………………………………………… 85

6.4 Безопасность в чрезвычайных ситуациях …………………………… 86

6.5 Выводы по разделу ……………………………………………………………. 89

ЗАКЛЮЧЕНИЕ …………………………………………………………………………….. 90
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ ………………………………. 91

Приложение А ………………………………………………………………………………. 96

Overview of existing recognition methods ……………………………………… 97

Artifical neural networks ………………………………………………………….. 97

Implementation of recognition methods based on the convolutional
neural network ……………………………………………………………………………………… 104

Training sample preparation ……………………………………………………. 104

Приложение Б ……………………………………………………………………………… 109

Приложение В …………………………………………………………………………….. 111

Приложение Г ……………………………………………………………………………… 113

Приложение Д …………………………………………………………………………….. 115

Контроль знаний, умений и навыков является важным звеном
учебного процесса. От его организации во многом зависит результат
обучения. В процессе контроля выявляются как достоинства, так и
недостатки знаний и умений учащихся, что позволяет управлять учебным
процессом, совершенствуя формы и методы обучения. Массовые
тестирования проводятся по регламентируемым процедурам и требуют
особого подхода к организации и обработке. К такому методу контроля
знаний относится и Государственная итоговая аттестация (ГИА) – форма
оценки степени и уровня освоения обучающимися основных
образовательных программ, соответствующим требованиям федерального
государственного образовательного стандарта. Для ознакомления учеников 9
и 11 классов с заданиями ГИА, а также его процедурой проведения
проводятся диагностические работы ОГЭ и ЕГЭ. Существующий формат
проведения данного мероприятия ставит перед организаторами задачу
анализа информации, представленной в виде изображений – произвести так
называемое off-line распознавание уже написанного на бумаге текста. Задача
обработки и распознавания изображений относится к разряду трудно
формализуемых задач и является одной из наиболее важных на сегодняшний
день.
Целью данной работы является разработка алгоритма и библиотеки
распознавания машиночитаемых бланков на основе сверточной нейронной
сети.
Для решения поставленной задачи необходимо решить следующие
задачи:
 подготовка обучающей, валидационной и тестовой выборки для
нейронной сети;
 выбор оптимальных архитектур сверточных нейронных сетей для
решения поставленных задач;
 проектирование и разработка библиотеки для решения задачи
классификации символов русского алфавита, а также цифр, минусов и
запятых.
Объектом исследования в данной работе выступают алгоритмы
распознавания символов русского алфавита, а также цифр, минусов и
запятых на изображении.
Предметом исследования является задача разработки библиотеки
распознавания, реализующей алгоритм распознавания на основе сверточной
нейронной сети.

В ходе выполнения работы был изучен существующий в копании
бизнес-процесс, актуальная проблема автоматического распознавания
рукописных символов, требующая решения, и архитектура информационной
системы, решающая данную проблему на текущий момент.
В результате проделанной работы было описано решение задачи
шаблонизации бланков. Также был предложен и реализован алгоритм
распознавания бланков на основе сверточных нейронных сетей. Были
проведены эксперименты по подбору архитектур сверточных нейронных
сетей.
Наилучший результат распознавания для символов русского алфавита
показала сеть, имеющая следующую конфигурацию:
Номер сверточного слоя Размер ядра свертки Количество карт признаков
1 5×5 25
2 3×3 50
3 7×7 100
4 3×3 200
Наилучший результат распознавания цифр, минусов и запятых
показала сеть, имеющая следующую конфигурацию:
Номер сверточного слоя Размер ядра свертки Количество карт признаков
1 5×5 25
2 3×3 50
3 3×3 100
4 5×5 200
В вышеперечисленных сетях подвыборочном слое использовалась
операция MaxPooling с размером окна и шагом 2.
По результатам сравнения результатов распознавания с программой
Abbyy FormReader разработанная программа лучше справляется с
распознаванием ответов, содержащих цифры, минусы и запятые, однако
хуже справляется с ответами, содержащими символы русского алфавита.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Андрей С. Тверской государственный университет 2011, математический...
    4.7 (82 отзыва)
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на... Читать все
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на продолжение диссертационной работы... Всегда готов помочь! ;)
    #Кандидатские #Магистерские
    164 Выполненных работы
    Антон П. преподаватель, доцент
    4.8 (1033 отзыва)
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публик... Читать все
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публикуюсь, имею высокий индекс цитирования. Спикер.
    #Кандидатские #Магистерские
    1386 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)