Подготовка исходных данных для построения кредитного скоринга

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Инхиреева, Татьяна Александровна Отделение информационных технологий (ОИТ)
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Объектом исследования в качестве тестовой задачи рассматривается данные о кредитоспособности заемщиков.
Предметом исследования является методика обработки данных для кредитного скоринга.
Цель данной работы – разработка и исследование методики обработки данных для кредитного скоринга.

Объект и предмет исследования

Дата выдачи задания на выполнение выпускной
квалификационной работы по линейному графику

Задание выдал руководитель:
Должность ФИО Ученая степень, Подпись Дата
звание

доцент ОИТ ИШИТР Губин Е.И. к.ф.-м.н

Задание принял к исполнению студент:
Группа ФИО Подпись Дата

В данном разделе рассмотрены основные вопросы соблюдения прав
персонала на труд, выполнения правил к безопасности труда, промышленной
безопасности, экологии и ресурсосбережения. Установлено, что рабочее место
исполнителя удовлетворяет требованиям безопасности и гигиены труда во время
реализации проекта, а также вредное воздействие объекта исследования на
окружающую среду не превышает норму.
Заключение
В ходе выполнения выпускной квалификационной работы создана
методика подготовки данных для построения кредитного скоринга, которая
включает в себя обязательные этапы: разбиение данных, очистка данных,
трансформация данных и выбор переменных. Полученная методика реализована
в программных пакетах Python, SAS, SAS Enterprise Miner. Исследование
методики проводилось на примере анкетных данных заемщиков.
Проведено сравнение точности результатов, полученных в различных
пакетах, и результатов классификации без подготовки данных и с применением
предложенной методики подготовки данных.
Качественно во всех случаях применение методики повышает точность
полученных результатов на 10-18%. Наибольшую точность (75%)
демонстрирует решение, полученное с помощью SAS Enterprise Miner.
В будущем планируется исследование методики на большем количестве
данных и в дальнейшем внедрение.
Список публикаций студента
1. Inkhireeva T. A. , Zimin V. P. Quasianalytical solution of inhomogeneous
differential equation with cubic nonlinearity // Advances in Computer Science
Research. – 2017 – Vol. 72. – p. 103-107
2. Kazakyavichyus I.S., Inkhireeva T. A. Gender recognition by voice //
Электронные средства и системы управления: материалы докладов XIV
Международной научно-практической конференции: в 2 ч. – Ч. 2., Томск,
28-30 Ноября 2018. – Томск: В-Спектр, 2018 – C. 282-286
3. Инхиреева Т. А. , Козловских А. В. Квазианалитическое решение
неоднородного дифференциального уравнения с кубической
нелинейностью // Молодежь и современные информационные
технологии: сборник трудов XV Международной научно- практической
конференции студентов, аспирантов и молодых ученых , Томск, 4-7
Декабря 2017. – Томск: ТПУ, 2018 – C. 43-44
4. Inkhireeva T.A. Data mining classification techniques for credit scoring in
banks // Математическое и программное обеспечение информационных,
технических и экономических систем: материалы VI международной
молодежной научной конференции, Томск, 24-26 мая 2018 г. – Томск:
ТГУ, 2018 – С. 362-365

1.Сергеевич С.А. Построение скоринговых карт с использованием модели
логистической регрессии // Интернет-журнал Науковедение. 2014. Vol. 2.
2.Anshu B. Data Preprocessing Techniques for Data Mining // Data Mining
Techniques and Tools for Knowledge Discovery in Agricultural Datasets. New
Delhi, 2011. P. 6.
3.Abbott D. Applied Predictive Analytics: Principles and Techniques for the
Professional Data Analyst. Indianapolis: Wiley, 2014. 427 p.
4.Полищук, Ф.С., Романов А.Ю. КРЕДИТНЫЙ СКОРИНГ: РАЗРАБОТКА
РЕЙТИНГОВОЙСИСТЕМЫОЦЕНКИРИСКАКРЕДИТОВАНИЯ
ФИЗИЧЕСКИХЛИЦ//Новыеинформационныетехнологиив
автоматизированных системах. 2016. Vol. 19.
5.Федресурс. Единый федеральный реестр юридически значимых сведений о
фактахдеятельностиюридическихлиц,индивидуальных
предпринимателей и иных субъектов экономической деятельности
[Electronic resource] // В России за год число граждан-банкротов удвоилось.
2018.
6.Филатова Ю. Число несостоятельных граждан в России выросло в 1,5 раза,
потенциальных банкротов – на 6%. Москва, 2018. 4 p.
7.Piatetsky G. Knowledge Discovery Nuggets [Electronic resource] // CRISP-DM,
still the top methodology for analytics, data mining, or data science projects.
2014.P.1.URL:https://www.kdnuggets.com/2014/10/crisp-dm-top-
methodology-analytics-data-mining-data-science-projects.html(accessed:
25.05.2019).
8.IBM Corporation. IBM SPSS Modeler CRISP-DM Guide. Armonk, 2011. 45 p.
9.SAS Institute Inc. Introduction to SEMMA [Electronic resource]. 2018. URL:
https://documentation.sas.com/?docsetId=emref&docsetTarget=n061bzurmej4j
3n1jnj8bbjjm1a2.htm&docsetVersion=15.1&locale=en.
10.Ng A. Machine learning yearning. 5th ed. deeplearning.ai, 2018. 116 p.
11.Pedregosa F. et al. Scikit-learn: Machine Learning in {P}ython // J. Mach. Learn.
Res. 2011. Vol. 12. P. 2825–2830.
12.Kohavi R. A Study of Cross-Validation and Bootstrap for Accuracy Estimation
and Model Selection. 2001. Vol. 14.
13.Little R.J.A. A Test of Missing Completely at Random for Multivariate Data with
Missing Values // J. Am. Stat. Assoc. Taylor & Francis, 1988. Vol. 83, № 404.
P. 1198–1202.
14.RUBIN D.B. Inference and missing data // Biometrika. 1976. Vol. 63, № 3. P.
581–592.
15.Moritz S. et al. Comparison of different Methods for Univariate Time Series
Imputation in R.
16.SAS Institute Inc. Building Credit Scorecards Using Credit Scoring for SAS
Enterprise Miner. Cary, 2014. 21 p.
17.Zekic-Susac M., Sarlija N., Bensic M. Small business credit scoring: a
comparison of logistic regression, neural network, and decision tree models //
26th International Conference on Information Technology Interfaces, 2004.
2004. P. 265-270 Vol.1.
18.Svolba G. Data Preparation for Analytics Using SAS. SAS Institute Inc., 2015.
440 p.
19.Tischler R., Grosser T. Data Preparation – Refining Raw Data into Value. CXP
Group, 2017. 43 p.
20.Huang J. et al. An Empirical Analysis of Three-Stage Data-Preprocessing for
Analogy-Based Software Effort Estimation on the ISBSG Data // 2017 IEEE
International Conference on Software Quality, Reliability and Security (QRS).
2017. P. 442–449.
21.Nalić J., Švraka A. Importance of data pre-processing in credit scoring models
based on data mining approaches // 2018 41st International Convention on
Information and Communication Technology, Electronics and Microelectronics
(MIPRO). 2018. P. 1046–1051.
22.García V., Marqués A.I., Sánchez J.S. Improving Risk Predictions by
Preprocessing Imbalanced Credit Data // Neural Inf. Process. 2012. Vol. 7664.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Подготовка исходных данных для построения кредитного скоринга»

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    AleksandrAvdiev Южный федеральный университет, 2010, преподаватель, канд...
    4.1 (20 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    28 Выполненных работ
    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ
    Шиленок В. КГМУ 2017, Лечебный , выпускник
    5 (20 отзывов)
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертац... Читать все
    Здравствуйте) Имею сертификат специалиста (врач-лечебник). На данный момент являюсь ординатором(терапия, кардио), одновременно работаю диагностом. Занимаюсь диссертационной работ. Помогу в медицинских науках и прикладных (хим,био,эколог)
    #Кандидатские #Магистерские
    13 Выполненных работ
    Екатерина С. кандидат наук, доцент
    4.6 (522 отзыва)
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    #Кандидатские #Магистерские
    1077 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Ольга Б. кандидат наук, доцент
    4.8 (373 отзыва)
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских... Читать все
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских диссертаций, дипломных и курсовых работ. Слежу за новинками в медицине.
    #Кандидатские #Магистерские
    566 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019 год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)