BI-технологии в анализе данных Федеральной контрактной системы

Чебоксаров, Владимир Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В данной работе описывается процесс создания предиктивной модели для оценки вероятности успешного завершения проекта проекта на основе его начальных показателей, а также текстовых данных о нем в виде заключенного с заказчиком договора. Для обучения модели использовались данные Федеральной контрактной системы по федеральному закону №223-ФЗ.

РЕФЕРАТ ……………………………………………………………………………………………………… 8
ОПРЕДЕЛЕНИЯ И ОБОЗНАЧЕНИЯ …………………………………………………………….. 9
ВВЕДЕНИЕ …………………………………………………………………………………………………. 12
1.1 Интеллектуальный анализ данных в управлении проектами …………………. 13
1.2 Методика оценки успешности выполнения проекта ……………………………… 15
1.3 Описание федерального закона №223-ФЗ …………………………………………….. 15
1.4 Методы решения задачи классификации ………………………………………………. 17
1.4.1 Наивный байесовский алгоритм ……………………………………………………… 17
1.4.2 Искусственные нейронные сети………………………………………………………. 19
1.4.3 Кросс-валидация …………………………………………………………………………….. 22
1.5 Описание инструментов разработки …………………………………………………….. 23
1.5.1 RapidMiner ……………………………………………………………………………………… 23
1.5.2 Python …………………………………………………………………………………………….. 24
1.5.3 C# …………………………………………………………………………………………………… 25
1.6 Цели и задачи разработки …………………………………………………………………….. 25
2 ИЗВЛЕЧЕНИЕ И ПОДГОТОВКА ДАННЫХ …………………………………………….. 28
2.1 Структура данных контрактов по 223-ФЗ …………………………………………….. 28
2.2 Выгрузка и первичная обработка данных ……………………………………………… 30
3 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ НБА ……………………………………………… 34
3.2 Реализация наивного байесовского алгоритма ……………………………………… 36
4 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ ИНС……………………………………………… 38
4.1 ИНС с методом обратного распространения ошибки ……………………………. 39
4.2 ИНС с использованием эволюционного алгоритма……………………………….. 41
5 АПРОБИРОВАНИЕ РАЗРАБОТАННЫХ МЕТОДОВ ……………………………….. 44
5.1 Анализ результатов выгрузки данных ………………………………………………….. 44
5.2 Анализ результатов обучения модели …………………………………………………… 45
5.3 Перспективы использования результатов……………………………………………… 47
6 ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ И
РЕСУРСОСБЕРЕЖЕНИЕ …………………………………………………………………………….. 48
6.1 Оценка коммерческого потенциала и перспективности проведения
научных исследований с позиции ресурсоэффективности и
ресурсосбережения ……………………………………………………………………………………. 48
6.1.1 Потенциальные потребители результатов исследования …………………. 48
6.1.2 Диаграмма Исикавы ………………………………………………………………………. 50
6.1.3 SWOT-анализ ………………………………………………………………………………… 51
6.2 Определение возможных альтернатив проведения научных
исследований …………………………………………………………………………………………….. 52
6.3 Планирование научно-исследовательских работ ……………………………….. 53
6.3.1 Структура работ в рамках научного исследования ………………………….. 53
6.3.2 Определение трудоемкости работ ………………………………………………….. 54
6.3.3 Разработка графика проведения научного исследования ………………… 55
6.3.4 Бюджет научно-технического исследования (НТИ) ………………………… 57
6.4 Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности исследования …… 60
7 Социальная ответственность ……………………………………………………………………… 63
7.1 Производственная безопасность ……………………………………………………….. 63
7.1.1 Анализ выявленных вредных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 64
7.1.2 Анализ выявленных опасных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 66
7.2 Экологическая безопасность …………………………………………………………….. 68
7.3 Безопасность в чрезвычайных ситуациях ………………………………………….. 68
7.3.1 Наиболее типичная ЧС – пожар………………………………………………………. 69
7.3.2 Меры по предотвращению ЧС ……………………………………………………….. 69
7.4 Правовые и организационные вопросы обеспечения безопасности ……. 70
7.4.1 Требования к рабочему помещению для работы с ПЭВМ……………….. 70
7.4.2 Требования к рабочему месту с ПЭВМ …………………………………………… 71
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………… 73
ПРИЛОЖЕНИЕ А ……………………………………………………………………………………….. 77
ПРИЛОЖЕНИЕ Б ………………………………………………………………………………………… 80

Программное обеспечение (ПО) для интеллектуального анализа данных
(ИАД) позволяет пользователям применять полуавтоматический и
прогнозирующий методы для анализа необработанных данных и поиска новых
способов получения информации. Данное ПО обычно применяется к очень
большим наборам данных и связанным с ними функциям, или любой набор
данных, слишком большой или сложный для человеческого анализа.
Приложения для интеллектуального анализа данных помогают
пользователям обнаруживать корреляции и соединения в больших наборах
данных. Они часто включают многочисленные записи с несколькими
переменными и могут содержать даже смешанные структурированные и
неструктурированные данные. Из-за размера и сложности этих наборов данных
любые ценные корреляции внутри них оставались бы незамеченными, если бы
не неустанный алгоритмический анализ, выполненный с инструментами
интеллектуального анализа данных.
Целью данной работы является создание предиктивной модели для
оценки возможного результата выполнения проекта, где выходным параметром
модели должна стать вероятность успешного завершения оцениваемого
проекта.
В ходе выполнения работы выполнялись следующие задачи:
1. Анализ предметной области;
2. Выгрузка и подготовка данных по выполнению договоров согласно
федеральному закону №223-ФЗ;

По результатам выполнения выпускной квалификационной работы было
разработано программное приложение, позволяющее прогнозировать
результаты выполнения проекта на основе его основных показателей и
текстовой информации о нем в виде заключенного договора на исполнение.
В ходе выполнения работы были выполнены следующие задачи:
1. Было разработано программное приложение для выгрузки и
обработки более полумиллиона файлов в формате XML с FTP-сервера
Федеральной контрактной системы, а также нескольких тысяч договоров с ее
официального портала;
2. На основе полученных данных о договорах по проектам была обучена
модель с помощью наивного байесовского алгоритма с некоторыми
модификациями для улучшения показателей обучения;
3. На основе полученных из данных и отдельно выведенных показателей
проектов были обучены модели с помощью искусственных нейронных сетей
двух видов.
Полученные результаты показали высокую точность всех методов
обучения.
Стоит отметить, что НБА как один из наиболее простых методов
классификации показал довольно высокую точность и полноту обучения (79%
и 83% процента соответственно), что может свидетельствовать о его удачной
модификации в процессе разработки.
Однако неоспоримым лидером среди всех методов обучения выступила
ИНС, обученная методом обратного распространение ошибки, показавшая в
результате точность в 93% и полноту равную 96,5%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Александр О. Спб государственный университет 1972, мат - мех, преподав...
    4.9 (66 отзывов)
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ
    #Кандидатские #Магистерские
    117 Выполненных работ
    Мария М. УГНТУ 2017, ТФ, преподаватель
    5 (14 отзывов)
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.
    #Кандидатские #Магистерские
    27 Выполненных работ
    Дарья П. кандидат наук, доцент
    4.9 (20 отзывов)
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных... Читать все
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных исследований, связанных с журналистикой, филологией и литературой
    #Кандидатские #Магистерские
    33 Выполненных работы
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Татьяна Б.
    4.6 (92 отзыва)
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские ди... Читать все
    Добрый день, работаю в сфере написания студенческих работ более 7 лет. Всегда довожу своих студентов до защиты с хорошими и отличными баллами (дипломы, магистерские диссертации, курсовые работы средний балл - 4,5). Всегда на связи!
    #Кандидатские #Магистерские
    138 Выполненных работ
    Дмитрий М. БГАТУ 2001, электрификации, выпускник
    4.8 (17 отзывов)
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал стать... Читать все
    Помогаю с выполнением курсовых проектов и контрольных работ по электроснабжению, электроосвещению, электрическим машинам, электротехнике. Занимался наукой, писал статьи, патенты, кандидатскую диссертацию, преподавал. Занимаюсь этим с 2003.
    #Кандидатские #Магистерские
    19 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)