Разработка алгоритма и реализация библиотеки предобработки и сегментации машиночитаемых бланков

Золтуев, Владислав Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа посвящена реализации этапа автоматизированной предварительной обработки машиночитаемых (с рукописным заполнением полей) бланков процедур массового тестирования выпускников общеобразовательных организаций и подготовки полей к распознаванию.

ВВЕДЕНИЕ ………………………………………………………………………………………………………………………….. 15
1. Обзор алгоритмов предобработки и сегментации ……………………………………………………………. 17
1.1. Предварительная обработка…………………………………………………………………………………….. 17
1.2. Препроцессинг ……………………………………………………………………………………………………….. 17
1.3. Выделение региона интереса …………………………………………………………………………………… 17
1.4. Сегментация изображения ………………………………………………………………………………………. 18
1.5. Алгоритмы сегментации …………………………………………………………………………………………. 19
1.6. Анализ алгоритмов сегментации………………………………………………………………………………….. 22
2. Проектирование и реализация ………………………………………………………………………………………… 26
2.1. Блоки обработки входного бланка и эталонных ответов …………………………………………… 26
2.2. Реализация программного обеспечения …………………………………………………………………… 31
3. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………………. 35
3.1. Предпроектный анализ ……………………………………………………………………………………………. 35
3.1.1. Потенциальные потребители результатов исследования……………………………………. 35
3.1.2. Анализ конкурентных технических решений ……………………………………………………. 36
3.1.3. QuaD-анализ ……………………………………………………………………………………………………. 37
3.1.4. SWOT-анализ ………………………………………………………………………………………………….. 39
3.2. Определение возможных альтернатив разработки ……………………………………………………. 40
3.3. Планирование научно-исследовательских работ………………………………………………………. 41
3.3.1. Структура работ в рамках проекта ……………………………………………………………………. 41
3.3.2. Определение трудоемкости выполнения работ …………………………………………………. 42
3.4. Бюджет научно-технического исследования ……………………………………………………………. 46
3.4.1. Расчет материальных затрат …………………………………………………………………………….. 46
3.4.2. Расчет основной заработной платы исполнителей системы……………………………….. 46
3.4.3. Расчет затрат по дополнительной заработной плате ………………………………………….. 47
3.4.4. Расчет отчислений во внебюджетные фонды ……………………………………………………. 47
3.4.5. Расчет накладных расходов ……………………………………………………………………………… 48
3.4.6. Формирование бюджета затрат проекта ……………………………………………………………. 48
3.5. Вывод …………………………………………………………………………………………………………………….. 51
4. Социальная ответственность ………………………………………………………………………………………….. 53
4.1. Производственная безопасность ……………………………………………………………………………… 53
4.1.1. Повышенная или пониженная температура воздуха рабочей среды …………………… 54
4.1.2 Недостаточная освещенность рабочей зоны ……………………………………………………………. 55
4.1.3 Опасность поражения электрическим током …………………………………………………………… 56
4.1.4 Опасность возникновения пожара ………………………………………………………………………….. 57
4.1.5 Мероприятия и рекомендации по устранению и минимизации ………………………………… 58
4.2. Экологическая безопасность ……………………………………………………………………………………….. 60
4.3 Безопасность в чрезвычайных ситуациях………………………………………………………………………. 61
4.4 Правовые и организационные вопросы обеспечения безопасности. ……………………………….. 61
4.4.1 Организационные мероприятия обеспечения безопасности рабочей зоны ……………….. 62
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………………………………….. 63
СПИСОК ЛИТЕРАТУРЫ ……………………………………………………………………………………………………… 64
ПРИЛОЖЕНИЕ А …………………………………………………………………………………………………………………. 65
ПРИЛОЖЕНИЕ Б …………………………………………………………………………………………………………………. 72

В настоящее время существует различные направления науки и техники,
ориентированные на развитие систем, анализирующих информацию,
представленную в цифровом виде. Одними из важнейших задач являются
предобработка и распознавание изображений.
Целью данной работы является разработка алгоритма и реализация
библиотеки предобработки и сегментации машиночитаемых бланках.
Для достижения поставленной цели необходимо решить ряд задач:
− изучение и анализ предметной области;
− выявление и документирование требований к разрабатываемой
библиотеке предобработки;
− разработка алгоритма сегментации;
− реализация программного обеспечения.
Сегментация содержимого машиночитаемого бланка реализуется на
основе подхода «сверху-вниз». На вход поступает бланк, пропускается через
сканирующее устройство. Благодаря, заданным на нем маркерам,
содержимое бланка обрабатывается не под углом, в следствии чего строки
ровные. Дальнейшая сегментация строк происходит по методу отталкивания-
притягивания. Далее производится сегментация каждого символа слева на
право.
В работе был проведен анализ методов сегментирования текста и
строк. В результате анализа были выбраны наиболее подходящие для
поставленной задачи – обработки машиночитаемых бланков. Вследствие,
было принято решение разработки алгоритма сегментации, позволяющий
упростить процесс распознавания рукописных символов с машиночитаемых
бланков.
Объектом исследования в данной работе являются алгоритмы
сегментации объектов – рукописных символов.
Предметом исследования выступает разработка программного
продукта, содержащего в себе алгоритм сегментации и распознавания на
основе сверточной нейросети.
1. Обзор алгоритмов предобработки и сегментации
В литературе [1, 2, 3] доступна информация об основных методах
цифровой обработки изображений, с целью повышения эффективности
последующей сегментации. В источниках [7, 8], приводится обзор основных
алгоритмов сегментации для разных типов изображений и способы их
реализации.
1.1. Предварительная обработка
Основные задачи предварительной обработки заключаются в:
1. Улучшение качества изображения, зачёт методов обработки
изображений. В качестве таких методов могут выступать шумоподавление или
фильтрация;
2. Выделение области на изображении. Включает в себя методы анализа
изображений. Так же имеет цель избавления от пятен, помарок;
1.2. Препроцессинг
Данный этап заключается в фильтрация изображения от недочетов
сканирования. Фильтрация реализуется, с помощью методов обработки
изображений. Для шумоподавления применяется фильтр Гаусса [24].
Следующим пунктом этого этапа является пороговая бинаризация, которая
переводит изображение из оттенков серого в чёрно-белый формат. После чего
становится возможным разделение символов и фона, что так же избавляет от
помех и облегчает использование алгоритмов. Области тёмных пикселей,
соответствует символам, области светлых, соответствует фону изображения.
Поиск порогового значения яркости заключается в нахождении приемлемого
значения между двумя пиками.

Распознавание рукописного текста является одной из важнейших задач
при обработке машиночитаемых бланков. В качестве метода сегментирования
текста был выбран подход «сверху-вниз», для сегментирования строк выбран
метод отталкивания-притягивания.
В данной работе был проведен сравнительный анализ использования
различным методов сегментации. В результате проведенных исследований
было установлено, что использования метода отталкивания-притягивания
будет наиболее оптимальным для сегментации рукописного текста.
Преимуществом данного метода является меньшее количество настраиваемых
параметров, высокая скорость и точность сегментирования машиночитаемого
бланка.
Итогом проделанной работы является разработка библиотеки,
включающая в себя основные классы и функции необходимые для реализации
предобработки и сегментирования машиночитаемых бланков. Точность
распознавания рукописных символов составила 96,43%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Елена Л. РЭУ им. Г. В. Плеханова 2009, Управления и коммерции, пре...
    4.8 (211 отзывов)
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно исполь... Читать все
    Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно использую в работе графический материал (графики рисунки, диаграммы) и таблицы.
    #Кандидатские #Магистерские
    362 Выполненных работы
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ
    Мария М. УГНТУ 2017, ТФ, преподаватель
    5 (14 отзывов)
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.
    #Кандидатские #Магистерские
    27 Выполненных работ
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)