Разработка алгоритма и реализация библиотеки предобработки и сегментации машиночитаемых бланков

Золтуев, Владислав Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа посвящена реализации этапа автоматизированной предварительной обработки машиночитаемых (с рукописным заполнением полей) бланков процедур массового тестирования выпускников общеобразовательных организаций и подготовки полей к распознаванию.

ВВЕДЕНИЕ ………………………………………………………………………………………………………………………….. 15
1. Обзор алгоритмов предобработки и сегментации ……………………………………………………………. 17
1.1. Предварительная обработка…………………………………………………………………………………….. 17
1.2. Препроцессинг ……………………………………………………………………………………………………….. 17
1.3. Выделение региона интереса …………………………………………………………………………………… 17
1.4. Сегментация изображения ………………………………………………………………………………………. 18
1.5. Алгоритмы сегментации …………………………………………………………………………………………. 19
1.6. Анализ алгоритмов сегментации………………………………………………………………………………….. 22
2. Проектирование и реализация ………………………………………………………………………………………… 26
2.1. Блоки обработки входного бланка и эталонных ответов …………………………………………… 26
2.2. Реализация программного обеспечения …………………………………………………………………… 31
3. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………………. 35
3.1. Предпроектный анализ ……………………………………………………………………………………………. 35
3.1.1. Потенциальные потребители результатов исследования……………………………………. 35
3.1.2. Анализ конкурентных технических решений ……………………………………………………. 36
3.1.3. QuaD-анализ ……………………………………………………………………………………………………. 37
3.1.4. SWOT-анализ ………………………………………………………………………………………………….. 39
3.2. Определение возможных альтернатив разработки ……………………………………………………. 40
3.3. Планирование научно-исследовательских работ………………………………………………………. 41
3.3.1. Структура работ в рамках проекта ……………………………………………………………………. 41
3.3.2. Определение трудоемкости выполнения работ …………………………………………………. 42
3.4. Бюджет научно-технического исследования ……………………………………………………………. 46
3.4.1. Расчет материальных затрат …………………………………………………………………………….. 46
3.4.2. Расчет основной заработной платы исполнителей системы……………………………….. 46
3.4.3. Расчет затрат по дополнительной заработной плате ………………………………………….. 47
3.4.4. Расчет отчислений во внебюджетные фонды ……………………………………………………. 47
3.4.5. Расчет накладных расходов ……………………………………………………………………………… 48
3.4.6. Формирование бюджета затрат проекта ……………………………………………………………. 48
3.5. Вывод …………………………………………………………………………………………………………………….. 51
4. Социальная ответственность ………………………………………………………………………………………….. 53
4.1. Производственная безопасность ……………………………………………………………………………… 53
4.1.1. Повышенная или пониженная температура воздуха рабочей среды …………………… 54
4.1.2 Недостаточная освещенность рабочей зоны ……………………………………………………………. 55
4.1.3 Опасность поражения электрическим током …………………………………………………………… 56
4.1.4 Опасность возникновения пожара ………………………………………………………………………….. 57
4.1.5 Мероприятия и рекомендации по устранению и минимизации ………………………………… 58
4.2. Экологическая безопасность ……………………………………………………………………………………….. 60
4.3 Безопасность в чрезвычайных ситуациях………………………………………………………………………. 61
4.4 Правовые и организационные вопросы обеспечения безопасности. ……………………………….. 61
4.4.1 Организационные мероприятия обеспечения безопасности рабочей зоны ……………….. 62
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………………………………….. 63
СПИСОК ЛИТЕРАТУРЫ ……………………………………………………………………………………………………… 64
ПРИЛОЖЕНИЕ А …………………………………………………………………………………………………………………. 65
ПРИЛОЖЕНИЕ Б …………………………………………………………………………………………………………………. 72

В настоящее время существует различные направления науки и техники,
ориентированные на развитие систем, анализирующих информацию,
представленную в цифровом виде. Одними из важнейших задач являются
предобработка и распознавание изображений.
Целью данной работы является разработка алгоритма и реализация
библиотеки предобработки и сегментации машиночитаемых бланках.
Для достижения поставленной цели необходимо решить ряд задач:
− изучение и анализ предметной области;
− выявление и документирование требований к разрабатываемой
библиотеке предобработки;
− разработка алгоритма сегментации;
− реализация программного обеспечения.
Сегментация содержимого машиночитаемого бланка реализуется на
основе подхода «сверху-вниз». На вход поступает бланк, пропускается через
сканирующее устройство. Благодаря, заданным на нем маркерам,
содержимое бланка обрабатывается не под углом, в следствии чего строки
ровные. Дальнейшая сегментация строк происходит по методу отталкивания-
притягивания. Далее производится сегментация каждого символа слева на
право.
В работе был проведен анализ методов сегментирования текста и
строк. В результате анализа были выбраны наиболее подходящие для
поставленной задачи – обработки машиночитаемых бланков. Вследствие,
было принято решение разработки алгоритма сегментации, позволяющий
упростить процесс распознавания рукописных символов с машиночитаемых
бланков.
Объектом исследования в данной работе являются алгоритмы
сегментации объектов – рукописных символов.
Предметом исследования выступает разработка программного
продукта, содержащего в себе алгоритм сегментации и распознавания на
основе сверточной нейросети.
1. Обзор алгоритмов предобработки и сегментации
В литературе [1, 2, 3] доступна информация об основных методах
цифровой обработки изображений, с целью повышения эффективности
последующей сегментации. В источниках [7, 8], приводится обзор основных
алгоритмов сегментации для разных типов изображений и способы их
реализации.
1.1. Предварительная обработка
Основные задачи предварительной обработки заключаются в:
1. Улучшение качества изображения, зачёт методов обработки
изображений. В качестве таких методов могут выступать шумоподавление или
фильтрация;
2. Выделение области на изображении. Включает в себя методы анализа
изображений. Так же имеет цель избавления от пятен, помарок;
1.2. Препроцессинг
Данный этап заключается в фильтрация изображения от недочетов
сканирования. Фильтрация реализуется, с помощью методов обработки
изображений. Для шумоподавления применяется фильтр Гаусса [24].
Следующим пунктом этого этапа является пороговая бинаризация, которая
переводит изображение из оттенков серого в чёрно-белый формат. После чего
становится возможным разделение символов и фона, что так же избавляет от
помех и облегчает использование алгоритмов. Области тёмных пикселей,
соответствует символам, области светлых, соответствует фону изображения.
Поиск порогового значения яркости заключается в нахождении приемлемого
значения между двумя пиками.

Распознавание рукописного текста является одной из важнейших задач
при обработке машиночитаемых бланков. В качестве метода сегментирования
текста был выбран подход «сверху-вниз», для сегментирования строк выбран
метод отталкивания-притягивания.
В данной работе был проведен сравнительный анализ использования
различным методов сегментации. В результате проведенных исследований
было установлено, что использования метода отталкивания-притягивания
будет наиболее оптимальным для сегментации рукописного текста.
Преимуществом данного метода является меньшее количество настраиваемых
параметров, высокая скорость и точность сегментирования машиночитаемого
бланка.
Итогом проделанной работы является разработка библиотеки,
включающая в себя основные классы и функции необходимые для реализации
предобработки и сегментирования машиночитаемых бланков. Точность
распознавания рукописных символов составила 96,43%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Шиленок В. КГМУ 2017, Лечебный , выпускник
    5 (20 отзывов)
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертац... Читать все
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертационной работ. Помогу в медицинских науках и прикладных (хим,био,эколог)
    #Кандидатские #Магистерские
    13 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)