BI-технологии в анализе данных Федеральной контрактной системы

Чебоксаров, Владимир Александрович Отделение информационных технологий (ОИТ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В данной работе описывается процесс создания предиктивной модели для оценки вероятности успешного завершения проекта проекта на основе его начальных показателей, а также текстовых данных о нем в виде заключенного с заказчиком договора. Для обучения модели использовались данные Федеральной контрактной системы по федеральному закону №223-ФЗ.

РЕФЕРАТ ……………………………………………………………………………………………………… 8
ОПРЕДЕЛЕНИЯ И ОБОЗНАЧЕНИЯ …………………………………………………………….. 9
ВВЕДЕНИЕ …………………………………………………………………………………………………. 12
1.1 Интеллектуальный анализ данных в управлении проектами …………………. 13
1.2 Методика оценки успешности выполнения проекта ……………………………… 15
1.3 Описание федерального закона №223-ФЗ …………………………………………….. 15
1.4 Методы решения задачи классификации ………………………………………………. 17
1.4.1 Наивный байесовский алгоритм ……………………………………………………… 17
1.4.2 Искусственные нейронные сети………………………………………………………. 19
1.4.3 Кросс-валидация …………………………………………………………………………….. 22
1.5 Описание инструментов разработки …………………………………………………….. 23
1.5.1 RapidMiner ……………………………………………………………………………………… 23
1.5.2 Python …………………………………………………………………………………………….. 24
1.5.3 C# …………………………………………………………………………………………………… 25
1.6 Цели и задачи разработки …………………………………………………………………….. 25
2 ИЗВЛЕЧЕНИЕ И ПОДГОТОВКА ДАННЫХ …………………………………………….. 28
2.1 Структура данных контрактов по 223-ФЗ …………………………………………….. 28
2.2 Выгрузка и первичная обработка данных ……………………………………………… 30
3 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ НБА ……………………………………………… 34
3.2 Реализация наивного байесовского алгоритма ……………………………………… 36
4 ОБУЧЕНИЕ МОДЕЛИ С ПОМОЩЬЮ ИНС……………………………………………… 38
4.1 ИНС с методом обратного распространения ошибки ……………………………. 39
4.2 ИНС с использованием эволюционного алгоритма……………………………….. 41
5 АПРОБИРОВАНИЕ РАЗРАБОТАННЫХ МЕТОДОВ ……………………………….. 44
5.1 Анализ результатов выгрузки данных ………………………………………………….. 44
5.2 Анализ результатов обучения модели …………………………………………………… 45
5.3 Перспективы использования результатов……………………………………………… 47
6 ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ И
РЕСУРСОСБЕРЕЖЕНИЕ …………………………………………………………………………….. 48
6.1 Оценка коммерческого потенциала и перспективности проведения
научных исследований с позиции ресурсоэффективности и
ресурсосбережения ……………………………………………………………………………………. 48
6.1.1 Потенциальные потребители результатов исследования …………………. 48
6.1.2 Диаграмма Исикавы ………………………………………………………………………. 50
6.1.3 SWOT-анализ ………………………………………………………………………………… 51
6.2 Определение возможных альтернатив проведения научных
исследований …………………………………………………………………………………………….. 52
6.3 Планирование научно-исследовательских работ ……………………………….. 53
6.3.1 Структура работ в рамках научного исследования ………………………….. 53
6.3.2 Определение трудоемкости работ ………………………………………………….. 54
6.3.3 Разработка графика проведения научного исследования ………………… 55
6.3.4 Бюджет научно-технического исследования (НТИ) ………………………… 57
6.4 Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности исследования …… 60
7 Социальная ответственность ……………………………………………………………………… 63
7.1 Производственная безопасность ……………………………………………………….. 63
7.1.1 Анализ выявленных вредных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 64
7.1.2 Анализ выявленных опасных факторов при разработке и эксплуатации
проектируемого решения ………………………………………………………………………… 66
7.2 Экологическая безопасность …………………………………………………………….. 68
7.3 Безопасность в чрезвычайных ситуациях ………………………………………….. 68
7.3.1 Наиболее типичная ЧС – пожар………………………………………………………. 69
7.3.2 Меры по предотвращению ЧС ……………………………………………………….. 69
7.4 Правовые и организационные вопросы обеспечения безопасности ……. 70
7.4.1 Требования к рабочему помещению для работы с ПЭВМ……………….. 70
7.4.2 Требования к рабочему месту с ПЭВМ …………………………………………… 71
ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………… 73
ПРИЛОЖЕНИЕ А ……………………………………………………………………………………….. 77
ПРИЛОЖЕНИЕ Б ………………………………………………………………………………………… 80

Программное обеспечение (ПО) для интеллектуального анализа данных
(ИАД) позволяет пользователям применять полуавтоматический и
прогнозирующий методы для анализа необработанных данных и поиска новых
способов получения информации. Данное ПО обычно применяется к очень
большим наборам данных и связанным с ними функциям, или любой набор
данных, слишком большой или сложный для человеческого анализа.
Приложения для интеллектуального анализа данных помогают
пользователям обнаруживать корреляции и соединения в больших наборах
данных. Они часто включают многочисленные записи с несколькими
переменными и могут содержать даже смешанные структурированные и
неструктурированные данные. Из-за размера и сложности этих наборов данных
любые ценные корреляции внутри них оставались бы незамеченными, если бы
не неустанный алгоритмический анализ, выполненный с инструментами
интеллектуального анализа данных.
Целью данной работы является создание предиктивной модели для
оценки возможного результата выполнения проекта, где выходным параметром
модели должна стать вероятность успешного завершения оцениваемого
проекта.
В ходе выполнения работы выполнялись следующие задачи:
1. Анализ предметной области;
2. Выгрузка и подготовка данных по выполнению договоров согласно
федеральному закону №223-ФЗ;

По результатам выполнения выпускной квалификационной работы было
разработано программное приложение, позволяющее прогнозировать
результаты выполнения проекта на основе его основных показателей и
текстовой информации о нем в виде заключенного договора на исполнение.
В ходе выполнения работы были выполнены следующие задачи:
1. Было разработано программное приложение для выгрузки и
обработки более полумиллиона файлов в формате XML с FTP-сервера
Федеральной контрактной системы, а также нескольких тысяч договоров с ее
официального портала;
2. На основе полученных данных о договорах по проектам была обучена
модель с помощью наивного байесовского алгоритма с некоторыми
модификациями для улучшения показателей обучения;
3. На основе полученных из данных и отдельно выведенных показателей
проектов были обучены модели с помощью искусственных нейронных сетей
двух видов.
Полученные результаты показали высокую точность всех методов
обучения.
Стоит отметить, что НБА как один из наиболее простых методов
классификации показал довольно высокую точность и полноту обучения (79%
и 83% процента соответственно), что может свидетельствовать о его удачной
модификации в процессе разработки.
Однако неоспоримым лидером среди всех методов обучения выступила
ИНС, обученная методом обратного распространение ошибки, показавшая в
результате точность в 93% и полноту равную 96,5%.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Ольга Б. кандидат наук, доцент
    4.8 (373 отзыва)
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских... Читать все
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских диссертаций, дипломных и курсовых работ. Слежу за новинками в медицине.
    #Кандидатские #Магистерские
    566 Выполненных работ
    Мария М. УГНТУ 2017, ТФ, преподаватель
    5 (14 отзывов)
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.
    #Кандидатские #Магистерские
    27 Выполненных работ
    Олег Н. Томский политехнический университет 2000, Инженерно-эконо...
    4.7 (96 отзывов)
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Явл... Читать все
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Являюсь действующим преподавателем одного из ВУЗов.
    #Кандидатские #Магистерские
    177 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Виктор В. Смоленская государственная медицинская академия 1997, Леч...
    4.7 (46 отзывов)
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все
    Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.
    #Кандидатские #Магистерские
    100 Выполненных работ
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Модернизация системы автоматизации АСУ ТП АО «Farg’onaazot»
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Интеграционный сервис передачи данных между АСУ ТП и MES
    📅 2018год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)
    Методы сегментации новообразований головного мозга
    📅 2020год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)