Нейросетевое распознавание данных финансовой отчетности компаний России

Кулигин, Сергей Михайлович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В работе предложена программная реализация считывания данных из финансовых отчетов организаций и их перевода в более удобный для работы формат с помощью машинного обучения.

Введение………………………………………………………………………………………………………………….9
Основные термины ………………………………………………………………………………………………..10
1. Теоретическая часть ………………………………………………………………………………………..11
1.1 OpenCV………………………………………………………………………………………………………..11
1.2 Tesseract OCR……………………………………………………………………………………………….16
1.3 Нейронные сети ……………………………………………………………………………………………18
1.4 Алгоритм Рамера-Дугласа-Пекера ………………………………………………………………..21
2. Практическая часть ………………………………………………………………………………………….25
2.1 Выбор среды программирования…………………………………………………………………..25
2.2 Реализация распознавания ……………………………………………………………………………25
2.2.1 Загрузка и фильтрация изображения ………………………………………………………….26
2.2.2 Выделение таблиц …………………………………………………………………………………….31
2.2.3 Распознавание текста и запись в файл ……………………………………………………….32
2.3 Оценка точности…………………………………………………………………………………………..33
3. Социальная ответственность ……………………………………………………………………………35
3.1 Правовые и организационные вопросы обеспечения безопасности ………………..36
3.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые
нормы трудового законодательства ………………………………………………………………………..36
3.1.2 Организационные мероприятия при компоновке рабочей зоны ………………….37
3.2 Производственная безопасность ……………………………………………………………………38
3.2.1 Анализ вредных и опасных факторов, которые могут возникнуть на рабочем
месте исследователя ……………………………………………………………………………………………….38
3.2.2 Обоснование мероприятий по защите персонала предприятия от действия
опасных и вредных факторов ………………………………………………………………………………….45
3.3 Экологическая безопасность …………………………………………………………………………46
3.4 Безопасность в чрезвычайных ситуациях ………………………………………………………48
3.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований .48
3.4.2 Обоснование мероприятий по предотвращению ЧС и разработка порядка
действия в случае возникновения ЧС ……………………………………………………………………..49
3.5 Выводы и рекомендации ………………………………………………………………………………50
4. Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения ……………………51
4.1 Потенциальные потребители результатов исследования ………………………………..52
4.2 Анализ конкурентных технических решений ………………………………………………..52
4.3 SWOT-анализ ……………………………………………………………………………………………….55
4.4 Инициация проекта ………………………………………………………………………………………56
4.5 Определение трудоемкости работ …………………………………………………………………57
4.6 Бюджет научно-технического исследования………………………………………………….61
4.6.1 Расчёт материальных затрат НТИ ………………………………………………………………61
4.6.2 Основная заработная плата………………………………………………………………………..62
4.6.3 Дополнительная заработная плата ……………………………………………………………..64
4.6.4 Отчисления во внебюджетные фонды ………………………………………………………..65
4.6.5 Накладные расходы …………………………………………………………………………………..65
4.6.6 Формирование бюджета затрат НТИ ………………………………………………………….66
4.7 Реестр рисков проекта ………………………………………………………………………………….66
4.8 Оценка сравнительной эффективности исследования ……………………………………68
4.9 Оценка абсолютной эффективности исследования ………………………………………..70
4.10 Выводы по главе «Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение»……………………………………………………………………………………………….77
Заключение ……………………………………………………………………………………………………………79
Список использованных источников ………………………………………………………………………80
Список публикаций ………………………………………………………………………………………………..83
Приложение А. Листинг программы ……………………………………………………………………….84
Приложение Б. (Справочное) ………………………………………………………………………………….93

Актуальность. Не смотря на то, что большинство профессий, о
которых мы задумываемся, не связаны с компьютерными программами и
вычислениями, в современном обществе практически каждая такая
профессия завязана хоть даже на самом минимальном использовании какого-
либо программного обеспечения. Так, в области экономики, при
осуществлении расчётов используются реализации алгоритмов этих расчётов
с помощью программного кода. Соответственно, вся информация о
значениях переменных алгоритма должна быть представлена в цифровом
виде. Обычно эта информация содержится в финансовых отчётах, которые
сканируются и присылаются специалистам, осуществляющих расчёт. Но на
этом этапе возникает проблема, которая состоит в том, что отсканированный
финансовый отчёт представляет собой совокупность изображений без
возможности работы с текстом и, как следствие, без возможности быстро
перенести информацию для расчёта в программу, поэтому все данные
приходится вносить вручную. Для решения проблемы необходимо каким-то
образом распознать информацию, в данном случае таблицы с данными,
чтобы существенно упростить работу с ней.
Механизмы распознавания нового поколения действительно хорошо
справляются с этими проблемами, используя новейшие исследования в
области глубокого обучения. Используя комбинацию глубоких моделей и
общедоступных огромных наборов данных, модели достигают высочайшей
точности при выполнении поставленных задач.
Целью магистерской диссертации является реализация алгоритма
по распознаванию таблиц и текста, внесённого в них, на изображении.
Для достижения поставленной цели необходимо решить следующие
задачи:
1. Реализовать распознавание таблиц на изображении;
2. Обучить нейронную сеть для распознавания текста;
3. Провести тестирование полученной реализации.
Основные термины

В ходе выполнения были получены следующие результаты:
 сформулирована актуальность поставленной задачи;
 сформулированы концептуальная постановка задачи;
 сформулированы и обобщены общие этапы решения задачи;
 разработана модель алгоритма распознавания необходимой
информации на заданном изображении;
 составлены алгоритм изоляции линий на изображении и алгоритм
выделения таблиц;
 разработана программа на языке программирования Python,
реализующая составленные алгоритмы.
 проверена и подтверждена работоспособность программы на
тестовом примере;
 проведена оценка точности результата работы программы в
сравнении с предполагаемым результатом.
Программа показала результат распознавания информации с
точностью 99.7 % в среднем, что говорит о целесообразности использования
программы на практике.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Дмитрий М. БГАТУ 2001, электрификации, выпускник
    4.8 (17 отзывов)
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал стать... Читать все
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал статьи, патенты, кандидатскую диссертацию, преподавал. Занимаюсь этим с 2003.
    #Кандидатские #Магистерские
    19 Выполненных работ
    Анна С. СФ ПГУ им. М.В. Ломоносова 2004, филологический, преподав...
    4.8 (9 отзывов)
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания... Читать все
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания и проверки (в качестве преподавателя) контрольных и курсовых работ.
    #Кандидатские #Магистерские
    16 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Дмитрий К. преподаватель, кандидат наук
    5 (1241 отзыв)
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполня... Читать все
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполняю уже 30 лет.
    #Кандидатские #Магистерские
    2271 Выполненная работа
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет