Разработка алгоритма и реализация библиотеки предобработки и сегментации машиночитаемых бланков

Золтуев, Владислав Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Работа посвящена реализации этапа автоматизированной предварительной обработки машиночитаемых (с рукописным заполнением полей) бланков процедур массового тестирования выпускников общеобразовательных организаций и подготовки полей к распознаванию.

ВВЕДЕНИЕ ………………………………………………………………………………………………………………………….. 15
1. Обзор алгоритмов предобработки и сегментации ……………………………………………………………. 17
1.1. Предварительная обработка…………………………………………………………………………………….. 17
1.2. Препроцессинг ……………………………………………………………………………………………………….. 17
1.3. Выделение региона интереса …………………………………………………………………………………… 17
1.4. Сегментация изображения ………………………………………………………………………………………. 18
1.5. Алгоритмы сегментации …………………………………………………………………………………………. 19
1.6. Анализ алгоритмов сегментации………………………………………………………………………………….. 22
2. Проектирование и реализация ………………………………………………………………………………………… 26
2.1. Блоки обработки входного бланка и эталонных ответов …………………………………………… 26
2.2. Реализация программного обеспечения …………………………………………………………………… 31
3. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………………. 35
3.1. Предпроектный анализ ……………………………………………………………………………………………. 35
3.1.1. Потенциальные потребители результатов исследования……………………………………. 35
3.1.2. Анализ конкурентных технических решений ……………………………………………………. 36
3.1.3. QuaD-анализ ……………………………………………………………………………………………………. 37
3.1.4. SWOT-анализ ………………………………………………………………………………………………….. 39
3.2. Определение возможных альтернатив разработки ……………………………………………………. 40
3.3. Планирование научно-исследовательских работ………………………………………………………. 41
3.3.1. Структура работ в рамках проекта ……………………………………………………………………. 41
3.3.2. Определение трудоемкости выполнения работ …………………………………………………. 42
3.4. Бюджет научно-технического исследования ……………………………………………………………. 46
3.4.1. Расчет материальных затрат …………………………………………………………………………….. 46
3.4.2. Расчет основной заработной платы исполнителей системы……………………………….. 46
3.4.3. Расчет затрат по дополнительной заработной плате ………………………………………….. 47
3.4.4. Расчет отчислений во внебюджетные фонды ……………………………………………………. 47
3.4.5. Расчет накладных расходов ……………………………………………………………………………… 48
3.4.6. Формирование бюджета затрат проекта ……………………………………………………………. 48
3.5. Вывод …………………………………………………………………………………………………………………….. 51
4. Социальная ответственность ………………………………………………………………………………………….. 53
4.1. Производственная безопасность ……………………………………………………………………………… 53
4.1.1. Повышенная или пониженная температура воздуха рабочей среды …………………… 54
4.1.2 Недостаточная освещенность рабочей зоны ……………………………………………………………. 55
4.1.3 Опасность поражения электрическим током …………………………………………………………… 56
4.1.4 Опасность возникновения пожара ………………………………………………………………………….. 57
4.1.5 Мероприятия и рекомендации по устранению и минимизации ………………………………… 58
4.2. Экологическая безопасность ……………………………………………………………………………………….. 60
4.3 Безопасность в чрезвычайных ситуациях………………………………………………………………………. 61
4.4 Правовые и организационные вопросы обеспечения безопасности. ……………………………….. 61
4.4.1 Организационные мероприятия обеспечения безопасности рабочей зоны ……………….. 62
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………………………………….. 63
СПИСОК ЛИТЕРАТУРЫ ……………………………………………………………………………………………………… 64
ПРИЛОЖЕНИЕ А …………………………………………………………………………………………………………………. 65
ПРИЛОЖЕНИЕ Б …………………………………………………………………………………………………………………. 72

В настоящее время существует различные направления науки и техники,
ориентированные на развитие систем, анализирующих информацию,
представленную в цифровом виде. Одними из важнейших задач являются
предобработка и распознавание изображений.
Целью данной работы является разработка алгоритма и реализация
библиотеки предобработки и сегментации машиночитаемых бланках.
Для достижения поставленной цели необходимо решить ряд задач:
− изучение и анализ предметной области;
− выявление и документирование требований к разрабатываемой
библиотеке предобработки;
− разработка алгоритма сегментации;
− реализация программного обеспечения.
Сегментация содержимого машиночитаемого бланка реализуется на
основе подхода «сверху-вниз». На вход поступает бланк, пропускается через
сканирующее устройство. Благодаря, заданным на нем маркерам,
содержимое бланка обрабатывается не под углом, в следствии чего строки
ровные. Дальнейшая сегментация строк происходит по методу отталкивания-
притягивания. Далее производится сегментация каждого символа слева на
право.
В работе был проведен анализ методов сегментирования текста и
строк. В результате анализа были выбраны наиболее подходящие для
поставленной задачи – обработки машиночитаемых бланков. Вследствие,
было принято решение разработки алгоритма сегментации, позволяющий
упростить процесс распознавания рукописных символов с машиночитаемых
бланков.
Объектом исследования в данной работе являются алгоритмы
сегментации объектов – рукописных символов.
Предметом исследования выступает разработка программного
продукта, содержащего в себе алгоритм сегментации и распознавания на
основе сверточной нейросети.
1. Обзор алгоритмов предобработки и сегментации
В литературе [1, 2, 3] доступна информация об основных методах
цифровой обработки изображений, с целью повышения эффективности
последующей сегментации. В источниках [7, 8], приводится обзор основных
алгоритмов сегментации для разных типов изображений и способы их
реализации.
1.1. Предварительная обработка
Основные задачи предварительной обработки заключаются в:
1. Улучшение качества изображения, зачёт методов обработки
изображений. В качестве таких методов могут выступать шумоподавление или
фильтрация;
2. Выделение области на изображении. Включает в себя методы анализа
изображений. Так же имеет цель избавления от пятен, помарок;
1.2. Препроцессинг
Данный этап заключается в фильтрация изображения от недочетов
сканирования. Фильтрация реализуется, с помощью методов обработки
изображений. Для шумоподавления применяется фильтр Гаусса [24].
Следующим пунктом этого этапа является пороговая бинаризация, которая
переводит изображение из оттенков серого в чёрно-белый формат. После чего
становится возможным разделение символов и фона, что так же избавляет от
помех и облегчает использование алгоритмов. Области тёмных пикселей,
соответствует символам, области светлых, соответствует фону изображения.
Поиск порогового значения яркости заключается в нахождении приемлемого
значения между двумя пиками.

Распознавание рукописного текста является одной из важнейших задач
при обработке машиночитаемых бланков. В качестве метода сегментирования
текста был выбран подход «сверху-вниз», для сегментирования строк выбран
метод отталкивания-притягивания.
В данной работе был проведен сравнительный анализ использования
различным методов сегментации. В результате проведенных исследований
было установлено, что использования метода отталкивания-притягивания
будет наиболее оптимальным для сегментации рукописного текста.
Преимуществом данного метода является меньшее количество настраиваемых
параметров, высокая скорость и точность сегментирования машиночитаемого
бланка.
Итогом проделанной работы является разработка библиотеки,
включающая в себя основные классы и функции необходимые для реализации
предобработки и сегментирования машиночитаемых бланков. Точность
распознавания рукописных символов составила 96,43%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    AleksandrAvdiev Южный федеральный университет, 2010, преподаватель, канд...
    4.1 (20 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    28 Выполненных работ
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Анастасия Б.
    5 (145 отзывов)
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическо... Читать все
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическому и гуманитарному направлениях свыше 8 лет на различных площадках.
    #Кандидатские #Магистерские
    224 Выполненных работы
    Олег Н. Томский политехнический университет 2000, Инженерно-эконо...
    4.7 (96 отзывов)
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Явл... Читать все
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Являюсь действующим преподавателем одного из ВУЗов.
    #Кандидатские #Магистерские
    177 Выполненных работ
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Андрей С. Тверской государственный университет 2011, математический...
    4.7 (82 отзыва)
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на... Читать все
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на продолжение диссертационной работы... Всегда готов помочь! ;)
    #Кандидатские #Магистерские
    164 Выполненных работы
    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)