BI-технологии в анализе данных Федеральной контрактной системы

Чебоксаров, Владимир Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В данной работе описывается процесс создания предиктивной модели для оценки вероятности успешного завершения проекта проекта на основе его начальных показателей, а также текстовых данных о нем в виде заключенного с заказчиком договора. Для обучения модели использовались данные Федеральной контрактной системы по федеральному закону №223-ФЗ.

РЕФЕРАТ ……………………………………………………………………………………………………… 8
ОПРЕДЕЛЕНИЯ И ОБОЗНАЧЕНИЯ …………………………………………………………….. 9
ВВЕДЕНИЕ …………………………………………………………………………………………………. 12
1.1 Интеллектуальный анализ данных в управлении проектами …………………. 13
1.2 Методика оценки успешности выполнения проекта ……………………………… 15
1.3 Описание федерального закона №223-ФЗ …………………………………………….. 15
1.4 Методы решения задачи классификации ………………………………………………. 17
1.4.1 Наивный байесовский алгоритм ……………………………………………………… 17
1.4.2 Искусственные нейронные сети………………………………………………………. 19
1.4.3 Кросс-валидация …………………………………………………………………………….. 22
1.5 Описание инструментов разработки …………………………………………………….. 23
1.5.1 RapidMiner ……………………………………………………………………………………… 23
1.5.2 Python …………………………………………………………………………………………….. 24
1.5.3 C# …………………………………………………………………………………………………… 25
1.6 Цели и задачи разработки …………………………………………………………………….. 25
2 ИЗВЛЕЧЕНИЕ И ПОДГОТОВКА ДАННЫХ …………………………………………….. 28
2.1 Структура данных контрактов по 223-ФЗ …………………………………………….. 28
2.2 Выгрузка и первичная обработка данных ……………………………………………… 30
3 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ НБА ……………………………………………… 34
3.2 Реализация наивного байесовского алгоритма ……………………………………… 36
4 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ ИНС……………………………………………… 38
4.1 ИНС с методом обратного распространения ошибки ……………………………. 39
4.2 ИНС с использованием эволюционного алгоритма……………………………….. 41
5 АПРОБИРОВАНИЕ РАЗРАБОТАННЫХ МЕТОДОВ ……………………………….. 44
5.1 Анализ результатов выгрузки данных ………………………………………………….. 44
5.2 Анализ результатов обучения модели …………………………………………………… 45
5.3 Перспективы использования результатов……………………………………………… 47
6 ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ И
РЕСУРСОСБЕРЕЖЕНИЕ …………………………………………………………………………….. 48
6.1 Оценка коммерческого потенциала и перспективности проведения
научных исследований с позиции ресурсоэффективности и
ресурсосбережения ……………………………………………………………………………………. 48
6.1.1 Потенциальные потребители результатов исследования …………………. 48
6.1.2 Диаграмма Исикавы ………………………………………………………………………. 50
6.1.3 SWOT-анализ ………………………………………………………………………………… 51
6.2 Определение возможных альтернатив проведения научных
исследований …………………………………………………………………………………………….. 52
6.3 Планирование научно-исследовательских работ ……………………………….. 53
6.3.1 Структура работ в рамках научного исследования ………………………….. 53
6.3.2 Определение трудоемкости работ ………………………………………………….. 54
6.3.3 Разработка графика проведения научного исследования ………………… 55
6.3.4 Бюджет научно-технического исследования (НТИ) ………………………… 57
6.4 Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности исследования …… 60
7 Социальная ответственность ……………………………………………………………………… 63
7.1 Производственная безопасность ……………………………………………………….. 63
7.1.1 Анализ выявленных вредных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 64
7.1.2 Анализ выявленных опасных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 66
7.2 Экологическая безопасность …………………………………………………………….. 68
7.3 Безопасность в чрезвычайных ситуациях ………………………………………….. 68
7.3.1 Наиболее типичная ЧС – пожар………………………………………………………. 69
7.3.2 Меры по предотвращению ЧС ……………………………………………………….. 69
7.4 Правовые и организационные вопросы обеспечения безопасности ……. 70
7.4.1 Требования к рабочему помещению для работы с ПЭВМ……………….. 70
7.4.2 Требования к рабочему месту с ПЭВМ …………………………………………… 71
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………… 73
ПРИЛОЖЕНИЕ А ……………………………………………………………………………………….. 77
ПРИЛОЖЕНИЕ Б ………………………………………………………………………………………… 80

Программное обеспечение (ПО) для интеллектуального анализа данных
(ИАД) позволяет пользователям применять полуавтоматический и
прогнозирующий методы для анализа необработанных данных и поиска новых
способов получения информации. Данное ПО обычно применяется к очень
большим наборам данных и связанным с ними функциям, или любой набор
данных, слишком большой или сложный для человеческого анализа.
Приложения для интеллектуального анализа данных помогают
пользователям обнаруживать корреляции и соединения в больших наборах
данных. Они часто включают многочисленные записи с несколькими
переменными и могут содержать даже смешанные структурированные и
неструктурированные данные. Из-за размера и сложности этих наборов данных
любые ценные корреляции внутри них оставались бы незамеченными, если бы
не неустанный алгоритмический анализ, выполненный с инструментами
интеллектуального анализа данных.
Целью данной работы является создание предиктивной модели для
оценки возможного результата выполнения проекта, где выходным параметром
модели должна стать вероятность успешного завершения оцениваемого
проекта.
В ходе выполнения работы выполнялись следующие задачи:
1. Анализ предметной области;
2. Выгрузка и подготовка данных по выполнению договоров согласно
федеральному закону №223-ФЗ;

По результатам выполнения выпускной квалификационной работы было
разработано программное приложение, позволяющее прогнозировать
результаты выполнения проекта на основе его основных показателей и
текстовой информации о нем в виде заключенного договора на исполнение.
В ходе выполнения работы были выполнены следующие задачи:
1. Было разработано программное приложение для выгрузки и
обработки более полумиллиона файлов в формате XML с FTP-сервера
Федеральной контрактной системы, а также нескольких тысяч договоров с ее
официального портала;
2. На основе полученных данных о договорах по проектам была обучена
модель с помощью наивного байесовского алгоритма с некоторыми
модификациями для улучшения показателей обучения;
3. На основе полученных из данных и отдельно выведенных показателей
проектов были обучены модели с помощью искусственных нейронных сетей
двух видов.
Полученные результаты показали высокую точность всех методов
обучения.
Стоит отметить, что НБА как один из наиболее простых методов
классификации показал довольно высокую точность и полноту обучения (79%
и 83% процента соответственно), что может свидетельствовать о его удачной
модификации в процессе разработки.
Однако неоспоримым лидером среди всех методов обучения выступила
ИНС, обученная методом обратного распространение ошибки, показавшая в
результате точность в 93% и полноту равную 96,5%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Анна С. СФ ПГУ им. М.В. Ломоносова 2004, филологический, преподав...
    4.8 (9 отзывов)
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания... Читать все
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания и проверки (в качестве преподавателя) контрольных и курсовых работ.
    #Кандидатские #Магистерские
    16 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Мария М. УГНТУ 2017, ТФ, преподаватель
    5 (14 отзывов)
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.
    #Кандидатские #Магистерские
    27 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Дарья П. кандидат наук, доцент
    4.9 (20 отзывов)
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных... Читать все
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных исследований, связанных с журналистикой, филологией и литературой
    #Кандидатские #Магистерские
    33 Выполненных работы

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)