Кластеризация данных для сайта-агрегатора
СОДЕРЖАНИЕ………………………………………………………………………………………………. 3
ВВЕДЕНИЕ……………………………………………………………………………………………………..4
1 Анализ технического задания……………………………………………………………………. 6
1.1 Анализ технологий…………………………………………………………………………….. 7
1.1.1 Python…………………………………………………………………………………………… 7
1.1.2 LibreOffice……………………………………………………………………………………. 9
1.1.3 Microsoft Office Excel…………………………………………………………………..11
1.2 Выводы по первому разделу…………………………………………………………….. 13
2 Системный анализ функционирования сайта-агрегатора…………………………..14
2.1 Основные понятия системного анализа…………………………………………….. 14
2.2 Понятие лояльности потребителя………………………………………………………19
2.3 Задача увеличения лояльности…………………………………………………………. 21
2.4 Программа увеличения лояльности клиентов…………………………………….22
2.5 Выводы по второму разделу………………………………………………………………27
3 Кластеризация и обработка данных…………………………………………………………. 28
3.1 Кластеризация данных……………………………………………………………………… 28
3.2 Возможности Data-mining в розничной торговле……………………………….32
3.3 RFM-анализ……………………………………………………………………………………… 34
3.4 Адаптация алгоритма……………………………………………………………………….. 39
3.5 Кластеризация FM-сегментов…………………………………………………………… 42
3.6 Выводы по третьему разделу……………………………………………………………. 46
4 Программная реализация………………………………………………………………………….47
4.1 Модуль обработки и подготовки данных………………………………………….. 48
4.2 Модуль RFM-анализа………………………………………………………………………..51
4.3 Иерархическая кластеризация……………………………………………………………54
4.4 Выводы по четвертому разделу………………………………………………………… 56
ЗАКЛЮЧЕНИЕ…………………………………………………………………………………………….. 57
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….58
Наука о данных, в частности наука о больших данных давно
заинтересовала аналитиков из разных сфер. Значительный интерес к работе с
внушительным объемом данных проявляют в сфере торговли, что
неудивительно. Обычным явлением в наши дни является сохранение данных
покупателей и их покупок для дальнейшей работы с ними. Согласно анализу
интернет-рынка, проведенному в ходе выполнения исследования, предложение
провести кластеризацию данных является достаточно актуальным и пользуется
спросом, однако все эти предложения платные и принцип их работы показан
лишь в общих чертах; программный код, используемый для обработки данных,
скрыт.
Актуальностью выбранной темы является необходимость внедрения
современных технологий и алгоритмов для повышения эффективности продаж
товаров и услуг. Маркетологам необходим инструментарий как для анализа
имеющейся базы покупателей, так и для оценки результатов своей
деятельности.
В ходе исследований в рамках магистерской диссертации был разработан
модульный набор инструментов сегментации клиентской базы данных,
основанный на стандартных методах кластеризации и объединяющий два
подхода в сегментации клиентских баз данных – по покупательскому
поведению и по товарным предпочтениям, а так же реализован набор
вспомогательных инструментов для его реализации. Данный набор
инструментов позволяет производить обработку данных, характерных для
сайтов-агрегаторов. Программа позволяет использовать различные
программные модули в зависимости от предпочтений маркетолога.
Разработанная программа является гибкой, и может быть подстроена под
реалии практически любого предприятия, поскольку позволяет заменять
алгоритмы на любые другие, которые со значительной долей вероятности будут
работать без каких-либо тонких настоек программистом.
Программа повышения лояльности оказывает огромное влияние на
развитие сетей розничной торговли. Правильно построенная программа может
в корне изменить ситуацию в конкурентной борьбе. Чем лучше будет
проведена сегментация базы данных, тем более высокий отклик будут
проявлять клиенты при получении предложения о покупке товара.
Стоит отметить особую роль программы увеличения лояльности в
отслеживании динамики сегментов в базе данных. Дальнейшее развитие
программы напрямую связано с наблюдением за развитием этих сегментов.
Программа повышения лояльности не является чем-то постоянным, она должна
постоянно совершенствоваться, ориентируясь на отклик покупателей, мировые
тенденции сегментации баз данных, развитие технологий.
1. Прикладная статистика: классификация и снижение размерности / С. А.
Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. – Москва: Финансы
и статистика, 1989. – 232 с.
2. Гиг Дж., Ван. Прикладная общая теория систем. / Дж. ван Гиг. –
Москва: Мир, 1981. – 733 с.
3. Журавлев,Ю.И.Распознавание.Математическиеметоды.
Программная система. Практические применения. / Ю. И. Журавлев, В. В.
Рязанов, О. В. Сенько. – Москва: Фазис, 2006. – 159 с.
4. Загоруйко, Н. Г. Прикладные методы анализа данных и знаний. / Н. Г.
Загоруйко. – Новосибирск: ИМ СО РАН, 1999. – 270 с.
5. Киселев, М. Средства добычи знаний в бизнесе и финансах. / М.
Киселев, Е. Соломатин // Открытые системы. – 1997. – № 4. – С. 41–44.
6. Кречетов, Н. Продукты для интеллектуального анализа данных. / Н.
Кречетов // Рынок программных средств. – 1997. – № 14–15. – С. 32–39.
7. Мандель, И. Д. Кластерный анализ. / И. Д. Мандель. – Москва:
Финансы и статистика, 1988. – 176 с.
8. Олдендерфер,М.С.Кластерныйанализ/Факторный,
дискриминантный и кластерный анализ: пер. с англ. / М. С. Олдендерфер, Р. К.
Блэшфилд; под. ред. И. С. Енюкова. – Москва: Финансы и статистика, 1989. –
215 с.
9. Паклин, Н. Б. Бизнес-аналитика: от данных к знаниям. / Н. Б. Паклин, В.
И. Орешков. – Санкт-Петербург: Питер, 2009. – 706 с.
10.Хайдуков,Д.С.Применениекластерногоанализав
государственном управлении. Философия математики: актуальные проблемы. /
Д. С. Хайдуков. – Москва: МАКС Пресс, 2009. – 287 с.
11.Шуметов, В. Г. Кластерный анализ: подход с применением ЭВМ. В.
Г. Шуметов, Л. В. Шуметова. – Орел: ОрелГТУ, 2000. – 118 с.
12.LibreOffice Draw Википедия [Электронный ресурс] : – Режим
доступа: https://ru-wiki.ru/wiki/LibreOffice_Draw
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!