Нейросетевое распознавание данных финансовой отчетности компаний России

Кулигин, Сергей Михайлович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В работе предложена программная реализация считывания данных из финансовых отчетов организаций и их перевода в более удобный для работы формат с помощью машинного обучения.

Введение………………………………………………………………………………………………………………….9
Основные термины ………………………………………………………………………………………………..10
1. Теоретическая часть ………………………………………………………………………………………..11
1.1 OpenCV………………………………………………………………………………………………………..11
1.2 Tesseract OCR……………………………………………………………………………………………….16
1.3 Нейронные сети ……………………………………………………………………………………………18
1.4 Алгоритм Рамера-Дугласа-Пекера ………………………………………………………………..21
2. Практическая часть ………………………………………………………………………………………….25
2.1 Выбор среды программирования…………………………………………………………………..25
2.2 Реализация распознавания ……………………………………………………………………………25
2.2.1 Загрузка и фильтрация изображения ………………………………………………………….26
2.2.2 Выделение таблиц …………………………………………………………………………………….31
2.2.3 Распознавание текста и запись в файл ……………………………………………………….32
2.3 Оценка точности…………………………………………………………………………………………..33
3. Социальная ответственность ……………………………………………………………………………35
3.1 Правовые и организационные вопросы обеспечения безопасности ………………..36
3.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые
нормы трудового законодательства ………………………………………………………………………..36
3.1.2 Организационные мероприятия при компоновке рабочей зоны ………………….37
3.2 Производственная безопасность ……………………………………………………………………38
3.2.1 Анализ вредных и опасных факторов, которые могут возникнуть на рабочем
месте исследователя ……………………………………………………………………………………………….38
3.2.2 Обоснование мероприятий по защите персонала предприятия от действия
опасных и вредных факторов ………………………………………………………………………………….45
3.3 Экологическая безопасность …………………………………………………………………………46
3.4 Безопасность в чрезвычайных ситуациях ………………………………………………………48
3.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований .48
3.4.2 Обоснование мероприятий по предотвращению ЧС и разработка порядка
действия в случае возникновения ЧС ……………………………………………………………………..49
3.5 Выводы и рекомендации ………………………………………………………………………………50
4. Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения ……………………51
4.1 Потенциальные потребители результатов исследования ………………………………..52
4.2 Анализ конкурентных технических решений ………………………………………………..52
4.3 SWOT-анализ ……………………………………………………………………………………………….55
4.4 Инициация проекта ………………………………………………………………………………………56
4.5 Определение трудоемкости работ …………………………………………………………………57
4.6 Бюджет научно-технического исследования………………………………………………….61
4.6.1 Расчёт материальных затрат НТИ ………………………………………………………………61
4.6.2 Основная заработная плата………………………………………………………………………..62
4.6.3 Дополнительная заработная плата ……………………………………………………………..64
4.6.4 Отчисления во внебюджетные фонды ………………………………………………………..65
4.6.5 Накладные расходы …………………………………………………………………………………..65
4.6.6 Формирование бюджета затрат НТИ ………………………………………………………….66
4.7 Реестр рисков проекта ………………………………………………………………………………….66
4.8 Оценка сравнительной эффективности исследования ……………………………………68
4.9 Оценка абсолютной эффективности исследования ………………………………………..70
4.10 Выводы по главе «Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение»……………………………………………………………………………………………….77
Заключение ……………………………………………………………………………………………………………79
Список использованных источников ………………………………………………………………………80
Список публикаций ………………………………………………………………………………………………..83
Приложение А. Листинг программы ……………………………………………………………………….84
Приложение Б. (Справочное) ………………………………………………………………………………….93

Актуальность. Не смотря на то, что большинство профессий, о
которых мы задумываемся, не связаны с компьютерными программами и
вычислениями, в современном обществе практически каждая такая
профессия завязана хоть даже на самом минимальном использовании какого-
либо программного обеспечения. Так, в области экономики, при
осуществлении расчётов используются реализации алгоритмов этих расчётов
с помощью программного кода. Соответственно, вся информация о
значениях переменных алгоритма должна быть представлена в цифровом
виде. Обычно эта информация содержится в финансовых отчётах, которые
сканируются и присылаются специалистам, осуществляющих расчёт. Но на
этом этапе возникает проблема, которая состоит в том, что отсканированный
финансовый отчёт представляет собой совокупность изображений без
возможности работы с текстом и, как следствие, без возможности быстро
перенести информацию для расчёта в программу, поэтому все данные
приходится вносить вручную. Для решения проблемы необходимо каким-то
образом распознать информацию, в данном случае таблицы с данными,
чтобы существенно упростить работу с ней.
Механизмы распознавания нового поколения действительно хорошо
справляются с этими проблемами, используя новейшие исследования в
области глубокого обучения. Используя комбинацию глубоких моделей и
общедоступных огромных наборов данных, модели достигают высочайшей
точности при выполнении поставленных задач.
Целью магистерской диссертации является реализация алгоритма
по распознаванию таблиц и текста, внесённого в них, на изображении.
Для достижения поставленной цели необходимо решить следующие
задачи:
1. Реализовать распознавание таблиц на изображении;
2. Обучить нейронную сеть для распознавания текста;
3. Провести тестирование полученной реализации.
Основные термины

В ходе выполнения были получены следующие результаты:
 сформулирована актуальность поставленной задачи;
 сформулированы концептуальная постановка задачи;
 сформулированы и обобщены общие этапы решения задачи;
 разработана модель алгоритма распознавания необходимой
информации на заданном изображении;
 составлены алгоритм изоляции линий на изображении и алгоритм
выделения таблиц;
 разработана программа на языке программирования Python,
реализующая составленные алгоритмы.
 проверена и подтверждена работоспособность программы на
тестовом примере;
 проведена оценка точности результата работы программы в
сравнении с предполагаемым результатом.
Программа показала результат распознавания информации с
точностью 99.7 % в среднем, что говорит о целесообразности использования
программы на практике.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Ольга Б. кандидат наук, доцент
    4.8 (373 отзыва)
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских... Читать все
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских диссертаций, дипломных и курсовых работ. Слежу за новинками в медицине.
    #Кандидатские #Магистерские
    566 Выполненных работ
    Глеб С. преподаватель, кандидат наук, доцент
    5 (158 отзывов)
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной с... Читать все
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной специальности 12.00.14 административное право, административный процесс.
    #Кандидатские #Магистерские
    216 Выполненных работ
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Дмитрий М. БГАТУ 2001, электрификации, выпускник
    4.8 (17 отзывов)
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал стать... Читать все
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал статьи, патенты, кандидатскую диссертацию, преподавал. Занимаюсь этим с 2003.
    #Кандидатские #Магистерские
    19 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет