Нейросетевое распознавание данных финансовой отчетности компаний России

Кулигин, Сергей Михайлович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В работе предложена программная реализация считывания данных из финансовых отчетов организаций и их перевода в более удобный для работы формат с помощью машинного обучения.

Введение………………………………………………………………………………………………………………….9
Основные термины ………………………………………………………………………………………………..10
1. Теоретическая часть ………………………………………………………………………………………..11
1.1 OpenCV………………………………………………………………………………………………………..11
1.2 Tesseract OCR……………………………………………………………………………………………….16
1.3 Нейронные сети ……………………………………………………………………………………………18
1.4 Алгоритм Рамера-Дугласа-Пекера ………………………………………………………………..21
2. Практическая часть ………………………………………………………………………………………….25
2.1 Выбор среды программирования…………………………………………………………………..25
2.2 Реализация распознавания ……………………………………………………………………………25
2.2.1 Загрузка и фильтрация изображения ………………………………………………………….26
2.2.2 Выделение таблиц …………………………………………………………………………………….31
2.2.3 Распознавание текста и запись в файл ……………………………………………………….32
2.3 Оценка точности…………………………………………………………………………………………..33
3. Социальная ответственность ……………………………………………………………………………35
3.1 Правовые и организационные вопросы обеспечения безопасности ………………..36
3.1.1 Специальные (характерные для проектируемой рабочей зоны) правовые
нормы трудового законодательства ………………………………………………………………………..36
3.1.2 Организационные мероприятия при компоновке рабочей зоны ………………….37
3.2 Производственная безопасность ……………………………………………………………………38
3.2.1 Анализ вредных и опасных факторов, которые могут возникнуть на рабочем
месте исследователя ……………………………………………………………………………………………….38
3.2.2 Обоснование мероприятий по защите персонала предприятия от действия
опасных и вредных факторов ………………………………………………………………………………….45
3.3 Экологическая безопасность …………………………………………………………………………46
3.4 Безопасность в чрезвычайных ситуациях ………………………………………………………48
3.4.1 Анализ вероятных ЧС, которые может инициировать объект исследований .48
3.4.2 Обоснование мероприятий по предотвращению ЧС и разработка порядка
действия в случае возникновения ЧС ……………………………………………………………………..49
3.5 Выводы и рекомендации ………………………………………………………………………………50
4. Оценка коммерческого потенциала и перспективности проведения научных
исследований с позиции ресурсоэффективности и ресурсосбережения ……………………51
4.1 Потенциальные потребители результатов исследования ………………………………..52
4.2 Анализ конкурентных технических решений ………………………………………………..52
4.3 SWOT-анализ ……………………………………………………………………………………………….55
4.4 Инициация проекта ………………………………………………………………………………………56
4.5 Определение трудоемкости работ …………………………………………………………………57
4.6 Бюджет научно-технического исследования………………………………………………….61
4.6.1 Расчёт материальных затрат НТИ ………………………………………………………………61
4.6.2 Основная заработная плата………………………………………………………………………..62
4.6.3 Дополнительная заработная плата ……………………………………………………………..64
4.6.4 Отчисления во внебюджетные фонды ………………………………………………………..65
4.6.5 Накладные расходы …………………………………………………………………………………..65
4.6.6 Формирование бюджета затрат НТИ ………………………………………………………….66
4.7 Реестр рисков проекта ………………………………………………………………………………….66
4.8 Оценка сравнительной эффективности исследования ……………………………………68
4.9 Оценка абсолютной эффективности исследования ………………………………………..70
4.10 Выводы по главе «Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение»……………………………………………………………………………………………….77
Заключение ……………………………………………………………………………………………………………79
Список использованных источников ………………………………………………………………………80
Список публикаций ………………………………………………………………………………………………..83
Приложение А. Листинг программы ……………………………………………………………………….84
Приложение Б. (Справочное) ………………………………………………………………………………….93

Актуальность. Не смотря на то, что большинство профессий, о
которых мы задумываемся, не связаны с компьютерными программами и
вычислениями, в современном обществе практически каждая такая
профессия завязана хоть даже на самом минимальном использовании какого-
либо программного обеспечения. Так, в области экономики, при
осуществлении расчётов используются реализации алгоритмов этих расчётов
с помощью программного кода. Соответственно, вся информация о
значениях переменных алгоритма должна быть представлена в цифровом
виде. Обычно эта информация содержится в финансовых отчётах, которые
сканируются и присылаются специалистам, осуществляющих расчёт. Но на
этом этапе возникает проблема, которая состоит в том, что отсканированный
финансовый отчёт представляет собой совокупность изображений без
возможности работы с текстом и, как следствие, без возможности быстро
перенести информацию для расчёта в программу, поэтому все данные
приходится вносить вручную. Для решения проблемы необходимо каким-то
образом распознать информацию, в данном случае таблицы с данными,
чтобы существенно упростить работу с ней.
Механизмы распознавания нового поколения действительно хорошо
справляются с этими проблемами, используя новейшие исследования в
области глубокого обучения. Используя комбинацию глубоких моделей и
общедоступных огромных наборов данных, модели достигают высочайшей
точности при выполнении поставленных задач.
Целью магистерской диссертации является реализация алгоритма
по распознаванию таблиц и текста, внесённого в них, на изображении.
Для достижения поставленной цели необходимо решить следующие
задачи:
1. Реализовать распознавание таблиц на изображении;
2. Обучить нейронную сеть для распознавания текста;
3. Провести тестирование полученной реализации.
Основные термины

В ходе выполнения были получены следующие результаты:
 сформулирована актуальность поставленной задачи;
 сформулированы концептуальная постановка задачи;
 сформулированы и обобщены общие этапы решения задачи;
 разработана модель алгоритма распознавания необходимой
информации на заданном изображении;
 составлены алгоритм изоляции линий на изображении и алгоритм
выделения таблиц;
 разработана программа на языке программирования Python,
реализующая составленные алгоритмы.
 проверена и подтверждена работоспособность программы на
тестовом примере;
 проведена оценка точности результата работы программы в
сравнении с предполагаемым результатом.
Программа показала результат распознавания информации с
точностью 99.7 % в среднем, что говорит о целесообразности использования
программы на практике.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Ольга Р. доктор, профессор
    4.2 (13 отзывов)
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласован... Читать все
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласованные сроки и при необходимости дорабатываются по рекомендациям научного руководителя (преподавателя). Буду рада плодотворному и взаимовыгодному сотрудничеству!!! К каждой работе подхожу индивидуально! Всегда готова по любому вопросу договориться с заказчиком! Все работы проверяю на антиплагиат.ру по умолчанию, если в заказе не стоит иное и если это заранее не обговорено!!!
    #Кандидатские #Магистерские
    21 Выполненная работа
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы
    Евгения Р.
    5 (188 отзывов)
    Мой опыт в написании работ - 9 лет. Я специализируюсь на написании курсовых работ, ВКР и магистерских диссертаций, также пишу научные статьи, провожу исследования и со... Читать все
    Мой опыт в написании работ - 9 лет. Я специализируюсь на написании курсовых работ, ВКР и магистерских диссертаций, также пишу научные статьи, провожу исследования и создаю красивые презентации. Сопровождаю работы до сдачи, на связи 24/7 ?
    #Кандидатские #Магистерские
    359 Выполненных работ
    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет