Top.Mail.Ru

Нейросетевое распознавание данных финансовой отчетности компаний России

Кулигин, Сергей Михайлович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В работе предложена программная реализация считывания данных из финансовых отчетов организаций и их перевода в более удобный для работы формат с помощью машинного обучения.

Введение………………………………………………………………………………………………………………….9
Основные термины ………………………………………………………………………………………………..10
1. Теоретическая часть ………………………………………………………………………………………..11
1.1 OpenCV………………………………………………………………………………………………………..11
1.2 Tesseract OCR……………………………………………………………………………………………….16
1.3 Нейронные сети ……………………………………………………………………………………………18
1.4 Алгоритм Рамера-Дугласа-Пекера ………………………………………………………………..21
2. Практическая часть ………………………………………………………………………………………….25
2.1 Выбор среды программирования…………………………………………………………………..25
2.2 Реализация распознавания ……………………………………………………………………………25
2.2.1 Загрузка и фильтрация изображения ………………………………………………………….26
2.2.2 Выделение таблиц …………………………………………………………………………………….31
2.2.3 Распознавание текста и запись в файл ……………………………………………………….32
2.3 Оценка точности…………………………………………………………………………………………..33
3. Социальная ответственность ……………………………………………………………………………35
3.1 Правовые и организационные вопросы обеспечения безопасности ………………..36
3.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые
нормы трудового законодательства ………………………………………………………………………..36
3.1.2 Организационные мероприятия при компоновке рабочей зоны ………………….37
3.2 Производственная безопасность ……………………………………………………………………38
3.2.1 Анализ вредных и опасных факторов, которые могут возникнуть на рабочем
месте исследователя ……………………………………………………………………………………………….38
3.2.2 Обоснование мероприятий по защите персонала предприятия от действия
опасных и вредных факторов ………………………………………………………………………………….45
3.3 Экологическая безопасность …………………………………………………………………………46
3.4 Безопасность в чрезвычайных ситуациях ………………………………………………………48
3.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований .48
3.4.2 Обоснование мероприятий по предотвращению ЧС и разработка порядка
действия в случае возникновения ЧС ……………………………………………………………………..49
3.5 Выводы и рекомендации ………………………………………………………………………………50
4. Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения ……………………51
4.1 Потенциальные потребители результатов исследования ………………………………..52
4.2 Анализ конкурентных технических решений ………………………………………………..52
4.3 SWOT-анализ ……………………………………………………………………………………………….55
4.4 Инициация проекта ………………………………………………………………………………………56
4.5 Определение трудоемкости работ …………………………………………………………………57
4.6 Бюджет научно-технического исследования………………………………………………….61
4.6.1 Расчёт материальных затрат НТИ ………………………………………………………………61
4.6.2 Основная заработная плата………………………………………………………………………..62
4.6.3 Дополнительная заработная плата ……………………………………………………………..64
4.6.4 Отчисления во внебюджетные фонды ………………………………………………………..65
4.6.5 Накладные расходы …………………………………………………………………………………..65
4.6.6 Формирование бюджета затрат НТИ ………………………………………………………….66
4.7 Реестр рисков проекта ………………………………………………………………………………….66
4.8 Оценка сравнительной эффективности исследования ……………………………………68
4.9 Оценка абсолютной эффективности исследования ………………………………………..70
4.10 Выводы по главе «Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение»……………………………………………………………………………………………….77
Заключение ……………………………………………………………………………………………………………79
Список использованных источников ………………………………………………………………………80
Список публикаций ………………………………………………………………………………………………..83
Приложение А. Листинг программы ……………………………………………………………………….84
Приложение Б. (Справочное) ………………………………………………………………………………….93

Актуальность. Не смотря на то, что большинство профессий, о
которых мы задумываемся, не связаны с компьютерными программами и
вычислениями, в современном обществе практически каждая такая
профессия завязана хоть даже на самом минимальном использовании какого-
либо программного обеспечения. Так, в области экономики, при
осуществлении расчётов используются реализации алгоритмов этих расчётов
с помощью программного кода. Соответственно, вся информация о
значениях переменных алгоритма должна быть представлена в цифровом
виде. Обычно эта информация содержится в финансовых отчётах, которые
сканируются и присылаются специалистам, осуществляющих расчёт. Но на
этом этапе возникает проблема, которая состоит в том, что отсканированный
финансовый отчёт представляет собой совокупность изображений без
возможности работы с текстом и, как следствие, без возможности быстро
перенести информацию для расчёта в программу, поэтому все данные
приходится вносить вручную. Для решения проблемы необходимо каким-то
образом распознать информацию, в данном случае таблицы с данными,
чтобы существенно упростить работу с ней.
Механизмы распознавания нового поколения действительно хорошо
справляются с этими проблемами, используя новейшие исследования в
области глубокого обучения. Используя комбинацию глубоких моделей и
общедоступных огромных наборов данных, модели достигают высочайшей
точности при выполнении поставленных задач.
Целью магистерской диссертации является реализация алгоритма
по распознаванию таблиц и текста, внесённого в них, на изображении.
Для достижения поставленной цели необходимо решить следующие
задачи:
1. Реализовать распознавание таблиц на изображении;
2. Обучить нейронную сеть для распознавания текста;
3. Провести тестирование полученной реализации.
Основные термины

В ходе выполнения были получены следующие результаты:
 сформулирована актуальность поставленной задачи;
 сформулированы концептуальная постановка задачи;
 сформулированы и обобщены общие этапы решения задачи;
 разработана модель алгоритма распознавания необходимой
информации на заданном изображении;
 составлены алгоритм изоляции линий на изображении и алгоритм
выделения таблиц;
 разработана программа на языке программирования Python,
реализующая составленные алгоритмы.
 проверена и подтверждена работоспособность программы на
тестовом примере;
 проведена оценка точности результата работы программы в
сравнении с предполагаемым результатом.
Программа показала результат распознавания информации с
точностью 99.7 % в среднем, что говорит о целесообразности использования
программы на практике.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    AleksandrAvdiev Южный федеральный университет, 2010, преподаватель, канд...
    4.1 (20 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    28 Выполненных работ
    Дарья П. кандидат наук, доцент
    4.9 (20 отзывов)
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных... Читать все
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных исследований, связанных с журналистикой, филологией и литературой
    #Кандидатские #Магистерские
    33 Выполненных работы
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы
    Глеб С. преподаватель, кандидат наук, доцент
    5 (158 отзывов)
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной с... Читать все
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной специальности 12.00.14 административное право, административный процесс.
    #Кандидатские #Магистерские
    216 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Оксана М. Восточноукраинский национальный университет, студент 4 - ...
    4.9 (37 отзывов)
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политоло... Читать все
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политологии.
    #Кандидатские #Магистерские
    68 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет