Нейросетевое распознавание данных финансовой отчетности компаний России

Кулигин, Сергей Михайлович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В работе предложена программная реализация считывания данных из финансовых отчетов организаций и их перевода в более удобный для работы формат с помощью машинного обучения.

Введение………………………………………………………………………………………………………………….9
Основные термины ………………………………………………………………………………………………..10
1. Теоретическая часть ………………………………………………………………………………………..11
1.1 OpenCV………………………………………………………………………………………………………..11
1.2 Tesseract OCR……………………………………………………………………………………………….16
1.3 Нейронные сети ……………………………………………………………………………………………18
1.4 Алгоритм Рамера-Дугласа-Пекера ………………………………………………………………..21
2. Практическая часть ………………………………………………………………………………………….25
2.1 Выбор среды программирования…………………………………………………………………..25
2.2 Реализация распознавания ……………………………………………………………………………25
2.2.1 Загрузка и фильтрация изображения ………………………………………………………….26
2.2.2 Выделение таблиц …………………………………………………………………………………….31
2.2.3 Распознавание текста и запись в файл ……………………………………………………….32
2.3 Оценка точности…………………………………………………………………………………………..33
3. Социальная ответственность ……………………………………………………………………………35
3.1 Правовые и организационные вопросы обеспечения безопасности ………………..36
3.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые
нормы трудового законодательства ………………………………………………………………………..36
3.1.2 Организационные мероприятия при компоновке рабочей зоны ………………….37
3.2 Производственная безопасность ……………………………………………………………………38
3.2.1 Анализ вредных и опасных факторов, которые могут возникнуть на рабочем
месте исследователя ……………………………………………………………………………………………….38
3.2.2 Обоснование мероприятий по защите персонала предприятия от действия
опасных и вредных факторов ………………………………………………………………………………….45
3.3 Экологическая безопасность …………………………………………………………………………46
3.4 Безопасность в чрезвычайных ситуациях ………………………………………………………48
3.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований .48
3.4.2 Обоснование мероприятий по предотвращению ЧС и разработка порядка
действия в случае возникновения ЧС ……………………………………………………………………..49
3.5 Выводы и рекомендации ………………………………………………………………………………50
4. Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения ……………………51
4.1 Потенциальные потребители результатов исследования ………………………………..52
4.2 Анализ конкурентных технических решений ………………………………………………..52
4.3 SWOT-анализ ……………………………………………………………………………………………….55
4.4 Инициация проекта ………………………………………………………………………………………56
4.5 Определение трудоемкости работ …………………………………………………………………57
4.6 Бюджет научно-технического исследования………………………………………………….61
4.6.1 Расчёт материальных затрат НТИ ………………………………………………………………61
4.6.2 Основная заработная плата………………………………………………………………………..62
4.6.3 Дополнительная заработная плата ……………………………………………………………..64
4.6.4 Отчисления во внебюджетные фонды ………………………………………………………..65
4.6.5 Накладные расходы …………………………………………………………………………………..65
4.6.6 Формирование бюджета затрат НТИ ………………………………………………………….66
4.7 Реестр рисков проекта ………………………………………………………………………………….66
4.8 Оценка сравнительной эффективности исследования ……………………………………68
4.9 Оценка абсолютной эффективности исследования ………………………………………..70
4.10 Выводы по главе «Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение»……………………………………………………………………………………………….77
Заключение ……………………………………………………………………………………………………………79
Список использованных источников ………………………………………………………………………80
Список публикаций ………………………………………………………………………………………………..83
Приложение А. Листинг программы ……………………………………………………………………….84
Приложение Б. (Справочное) ………………………………………………………………………………….93

Актуальность. Не смотря на то, что большинство профессий, о
которых мы задумываемся, не связаны с компьютерными программами и
вычислениями, в современном обществе практически каждая такая
профессия завязана хоть даже на самом минимальном использовании какого-
либо программного обеспечения. Так, в области экономики, при
осуществлении расчётов используются реализации алгоритмов этих расчётов
с помощью программного кода. Соответственно, вся информация о
значениях переменных алгоритма должна быть представлена в цифровом
виде. Обычно эта информация содержится в финансовых отчётах, которые
сканируются и присылаются специалистам, осуществляющих расчёт. Но на
этом этапе возникает проблема, которая состоит в том, что отсканированный
финансовый отчёт представляет собой совокупность изображений без
возможности работы с текстом и, как следствие, без возможности быстро
перенести информацию для расчёта в программу, поэтому все данные
приходится вносить вручную. Для решения проблемы необходимо каким-то
образом распознать информацию, в данном случае таблицы с данными,
чтобы существенно упростить работу с ней.
Механизмы распознавания нового поколения действительно хорошо
справляются с этими проблемами, используя новейшие исследования в
области глубокого обучения. Используя комбинацию глубоких моделей и
общедоступных огромных наборов данных, модели достигают высочайшей
точности при выполнении поставленных задач.
Целью магистерской диссертации является реализация алгоритма
по распознаванию таблиц и текста, внесённого в них, на изображении.
Для достижения поставленной цели необходимо решить следующие
задачи:
1. Реализовать распознавание таблиц на изображении;
2. Обучить нейронную сеть для распознавания текста;
3. Провести тестирование полученной реализации.
Основные термины

В ходе выполнения были получены следующие результаты:
 сформулирована актуальность поставленной задачи;
 сформулированы концептуальная постановка задачи;
 сформулированы и обобщены общие этапы решения задачи;
 разработана модель алгоритма распознавания необходимой
информации на заданном изображении;
 составлены алгоритм изоляции линий на изображении и алгоритм
выделения таблиц;
 разработана программа на языке программирования Python,
реализующая составленные алгоритмы.
 проверена и подтверждена работоспособность программы на
тестовом примере;
 проведена оценка точности результата работы программы в
сравнении с предполагаемым результатом.
Программа показала результат распознавания информации с
точностью 99.7 % в среднем, что говорит о целесообразности использования
программы на практике.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ
    Оксана М. Восточноукраинский национальный университет, студент 4 - ...
    4.9 (37 отзывов)
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политоло... Читать все
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политологии.
    #Кандидатские #Магистерские
    68 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Дмитрий К. преподаватель, кандидат наук
    5 (1241 отзыв)
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполня... Читать все
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполняю уже 30 лет.
    #Кандидатские #Магистерские
    2271 Выполненная работа
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет