Разработка алгоритма и реализация библиотеки предобработки и сегментации машиночитаемых бланков

Золтуев, Владислав Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа посвящена реализации этапа автоматизированной предварительной обработки машиночитаемых (с рукописным заполнением полей) бланков процедур массового тестирования выпускников общеобразовательных организаций и подготовки полей к распознаванию.

ВВЕДЕНИЕ ………………………………………………………………………………………………………………………….. 15
1. Обзор алгоритмов предобработки и сегментации ……………………………………………………………. 17
1.1. Предварительная обработка…………………………………………………………………………………….. 17
1.2. Препроцессинг ……………………………………………………………………………………………………….. 17
1.3. Выделение региона интереса …………………………………………………………………………………… 17
1.4. Сегментация изображения ………………………………………………………………………………………. 18
1.5. Алгоритмы сегментации …………………………………………………………………………………………. 19
1.6. Анализ алгоритмов сегментации………………………………………………………………………………….. 22
2. Проектирование и реализация ………………………………………………………………………………………… 26
2.1. Блоки обработки входного бланка и эталонных ответов …………………………………………… 26
2.2. Реализация программного обеспечения …………………………………………………………………… 31
3. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………………. 35
3.1. Предпроектный анализ ……………………………………………………………………………………………. 35
3.1.1. Потенциальные потребители результатов исследования……………………………………. 35
3.1.2. Анализ конкурентных технических решений ……………………………………………………. 36
3.1.3. QuaD-анализ ……………………………………………………………………………………………………. 37
3.1.4. SWOT-анализ ………………………………………………………………………………………………….. 39
3.2. Определение возможных альтернатив разработки ……………………………………………………. 40
3.3. Планирование научно-исследовательских работ………………………………………………………. 41
3.3.1. Структура работ в рамках проекта ……………………………………………………………………. 41
3.3.2. Определение трудоемкости выполнения работ …………………………………………………. 42
3.4. Бюджет научно-технического исследования ……………………………………………………………. 46
3.4.1. Расчет материальных затрат …………………………………………………………………………….. 46
3.4.2. Расчет основной заработной платы исполнителей системы……………………………….. 46
3.4.3. Расчет затрат по дополнительной заработной плате ………………………………………….. 47
3.4.4. Расчет отчислений во внебюджетные фонды ……………………………………………………. 47
3.4.5. Расчет накладных расходов ……………………………………………………………………………… 48
3.4.6. Формирование бюджета затрат проекта ……………………………………………………………. 48
3.5. Вывод …………………………………………………………………………………………………………………….. 51
4. Социальная ответственность ………………………………………………………………………………………….. 53
4.1. Производственная безопасность ……………………………………………………………………………… 53
4.1.1. Повышенная или пониженная температура воздуха рабочей среды …………………… 54
4.1.2 Недостаточная освещенность рабочей зоны ……………………………………………………………. 55
4.1.3 Опасность поражения электрическим током …………………………………………………………… 56
4.1.4 Опасность возникновения пожара ………………………………………………………………………….. 57
4.1.5 Мероприятия и рекомендации по устранению и минимизации ………………………………… 58
4.2. Экологическая безопасность ……………………………………………………………………………………….. 60
4.3 Безопасность в чрезвычайных ситуациях………………………………………………………………………. 61
4.4 Правовые и организационные вопросы обеспечения безопасности. ……………………………….. 61
4.4.1 Организационные мероприятия обеспечения безопасности рабочей зоны ……………….. 62
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………………………………….. 63
СПИСОК ЛИТЕРАТУРЫ ……………………………………………………………………………………………………… 64
ПРИЛОЖЕНИЕ А …………………………………………………………………………………………………………………. 65
ПРИЛОЖЕНИЕ Б …………………………………………………………………………………………………………………. 72

В настоящее время существует различные направления науки и техники,
ориентированные на развитие систем, анализирующих информацию,
представленную в цифровом виде. Одними из важнейших задач являются
предобработка и распознавание изображений.
Целью данной работы является разработка алгоритма и реализация
библиотеки предобработки и сегментации машиночитаемых бланках.
Для достижения поставленной цели необходимо решить ряд задач:
− изучение и анализ предметной области;
− выявление и документирование требований к разрабатываемой
библиотеке предобработки;
− разработка алгоритма сегментации;
− реализация программного обеспечения.
Сегментация содержимого машиночитаемого бланка реализуется на
основе подхода «сверху-вниз». На вход поступает бланк, пропускается через
сканирующее устройство. Благодаря, заданным на нем маркерам,
содержимое бланка обрабатывается не под углом, в следствии чего строки
ровные. Дальнейшая сегментация строк происходит по методу отталкивания-
притягивания. Далее производится сегментация каждого символа слева на
право.
В работе был проведен анализ методов сегментирования текста и
строк. В результате анализа были выбраны наиболее подходящие для
поставленной задачи – обработки машиночитаемых бланков. Вследствие,
было принято решение разработки алгоритма сегментации, позволяющий
упростить процесс распознавания рукописных символов с машиночитаемых
бланков.
Объектом исследования в данной работе являются алгоритмы
сегментации объектов – рукописных символов.
Предметом исследования выступает разработка программного
продукта, содержащего в себе алгоритм сегментации и распознавания на
основе сверточной нейросети.
1. Обзор алгоритмов предобработки и сегментации
В литературе [1, 2, 3] доступна информация об основных методах
цифровой обработки изображений, с целью повышения эффективности
последующей сегментации. В источниках [7, 8], приводится обзор основных
алгоритмов сегментации для разных типов изображений и способы их
реализации.
1.1. Предварительная обработка
Основные задачи предварительной обработки заключаются в:
1. Улучшение качества изображения, зачёт методов обработки
изображений. В качестве таких методов могут выступать шумоподавление или
фильтрация;
2. Выделение области на изображении. Включает в себя методы анализа
изображений. Так же имеет цель избавления от пятен, помарок;
1.2. Препроцессинг
Данный этап заключается в фильтрация изображения от недочетов
сканирования. Фильтрация реализуется, с помощью методов обработки
изображений. Для шумоподавления применяется фильтр Гаусса [24].
Следующим пунктом этого этапа является пороговая бинаризация, которая
переводит изображение из оттенков серого в чёрно-белый формат. После чего
становится возможным разделение символов и фона, что так же избавляет от
помех и облегчает использование алгоритмов. Области тёмных пикселей,
соответствует символам, области светлых, соответствует фону изображения.
Поиск порогового значения яркости заключается в нахождении приемлемого
значения между двумя пиками.

Распознавание рукописного текста является одной из важнейших задач
при обработке машиночитаемых бланков. В качестве метода сегментирования
текста был выбран подход «сверху-вниз», для сегментирования строк выбран
метод отталкивания-притягивания.
В данной работе был проведен сравнительный анализ использования
различным методов сегментации. В результате проведенных исследований
было установлено, что использования метода отталкивания-притягивания
будет наиболее оптимальным для сегментации рукописного текста.
Преимуществом данного метода является меньшее количество настраиваемых
параметров, высокая скорость и точность сегментирования машиночитаемого
бланка.
Итогом проделанной работы является разработка библиотеки,
включающая в себя основные классы и функции необходимые для реализации
предобработки и сегментирования машиночитаемых бланков. Точность
распознавания рукописных символов составила 96,43%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Сергей Н.
    4.8 (40 отзывов)
    Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных с... Читать все
    Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных статей в области экономики.
    #Кандидатские #Магистерские
    56 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Екатерина С. кандидат наук, доцент
    4.6 (522 отзыва)
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    #Кандидатские #Магистерские
    1077 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)