Прогнозная модель для оценки успеваемости студентов университета по итогам текущего обучения
Целью магистерской диссертации является создание прогнозной модели успеваемости студентов ТПУ. Наличие такой модели позволит уделять более пристальное внимание студентам, которые попадают в группу риска большого количества долгов по учебным дисциплинам, а как следствие, будут претендентами на отчисления. Определение таких студентов на ранних этапах позволит более детально и персонально работать с ними для того, чтобы они более успешно справлялись с учебной нагрузкой. Научная новизна заключается в комплексном подходе к решению данной задачи и применению модели на практике. В результате работы была создана прогнозная модель, а также графический интерфейс для ее использования.
Планируемые результаты обучения …………………………………………………………………………………. 8
Реферат …………………………………………………………………………………………………………………………… 9
Введение ……………………………………………………………………………………………………………………….. 12
1. Анализ предметной области ……………………………………………………………………………………….. 13
1.1 Алгоритм K-ближайших соседей ………………………………………………………………………………. 16
1.2 Метод опорных векторов ………………………………………………………………………………………….. 18
1.3 Нейронные сети ……………………………………………………………………………………………………….. 21
1.4 Вывод по разделу……………………………………………………………………………………………………… 23
2. Предварительная обработка данных …………………………………………………………………………… 24
3. Модель машинного обучения……………………………………………………………………………………… 38
4. Графический интерфейс пользователя прогнозной модели………………………………………….. 44
5. Финансовый менеджмент, ресурсоэффективность и ресурсосбережение …………………….. 49
5.1 Предпроектный анализ …………………………………………………………………………………………….. 49
5.1.1 Потенциальные потребители разработки ………………………………………………………………… 49
5.1.2 Технология QuaD …………………………………………………………………………………………………… 49
5.1.3 SWOT-анализ ………………………………………………………………………………………………………… 50
5.1.4 Оценка готовности разработки к коммерциализации ………………………………………………. 52
5.2 Инициация разработки ……………………………………………………………………………………………… 53
5.3 Планирование управления разработкой ………………………………………………………………… 55
5.3.1 Иерархическая структура работ ……………………………………………………………………………… 55
5.3.2 План разработки ……………………………………………………………………………………………………. 56
5.3.2.1 Определение трудоемкости выполнения работ …………………………………………………….. 57
5.3.2.2 Разработка графика проведения разработки …………………………………………………………. 59
5.3.3 Бюджет разработки………………………………………………………………………………………………… 59
5.3.3.1 Расчет материальных затрат разработки ………………………………………………………………. 60
5.3.3.2. Расчет амортизационных отчислений …………………………………………………………………. 60
5.3.3.3. Основная заработная плата исполнителей темы ………………………………………………….. 61
5.3.3.4. Дополнительная заработная плата исполнителей темы ……………………………………….. 63
5.3.3.5. Отчисления во внебюджетные фонды (страховые отчисления) ……………………………. 63
5.3.3.6. Накладные расходы ……………………………………………………………………………………………. 63
5.3.3.7. Формирование бюджета затрат научно-исследовательского разработки………………. 63
5.3.4 Риски разработки …………………………………………………………………………………………………… 64
5.2 Определение потенциального эффекта разработки ……………………………………………………. 66
Выводы по разделу ………………………………………………………………………………………………………… 67
Глава 6. Социальная ответственность …………………………………………………………………………….. 68
6.1 Правовые и организационные вопросы обеспечения безопасности ……………………………. 69
6.2 Производственная безопасность ……………………………………………………………………………….. 71
6.2.1 Повышенный уровень электромагнитных излучений ……………………………………………… 71
6.2.2 Несоответствие параметрам микроклимата …………………………………………………………….. 73
6.2.3 Недостаточная освещенность рабочего места …………………………………………………………. 74
6.2.4 Повышенный уровень шума …………………………………………………………………………………… 78
6.2.5 Умственное перенапряжение …………………………………………………………………………………. 79
6.2.6. Нарушение правил электробезопасности……………………………………………………………….. 79
6.3 Экологическая безопасность …………………………………………………………………………………….. 81
6.4 Безопасность в чрезвычайных ситуация ……………………………………………………………………. 83
Вывод по разделу…………………………………………………………………………………………………………… 84
Заключение……………………………………………………………………………………………………………………. 85
Список публикаций и научных достижений …………………………………………………………………… 86
Список литературы………………………………………………………………………………………………………… 88
Приложение А……………………………………………………………………………………………………………….. 90
Приложение Б. Листинг кода по предварительной подготовке данных. …………………………. 102
Уровень успеваемости студента в ВУЗе является своеобразной формой
диагностики и прогнозирования степени отдачи будущего специалиста. В свою
очередь успехи студентов – это показатель деятельности ВУЗа в решении
учебно-воспитательных задач. Для того, чтобы решать данные задачи
максимально эффективно требуется постоянная объективная оценка,
корректировка и управление. Однако, без прогнозирования управление
невозможно. Поэтому возникает необходимость прогнозирования
успеваемости студентов на всех этапах обучения.
Имея сведения о тех студентах, которые вероятнее всего к концу семестра
будут иметь академические задолженности, если не изменят текущую
тенденцию, мы можем повлиять на студентов, тем самым повысить уровень их
успеваемости.
Целью данной работы является создание прогнозной модели
успеваемости студентов ТПУ. Наличие такой модели позволит уделять более
пристальное внимание студентам, которые попадают в группу риска большого
количества долгов по учебным дисциплинам, а как следствие, будут
претендентами на отчисления. Определение таких студентов на ранних этапах
позволит более детально и персонально работать с ними для того, чтобы они
более успешно справлялись с учебной нагрузкой.
Исходя из цели, данная работа включает следующие задачи: обзор
литературы посвященной данному вопросу, изучение используемых методов и
алгоритмов, очистка и подготовка исходных данных, разработка прогнозной
модели, апробирование результатов, создание графического интерфейса
пользователя для модуля прогнозирования успеваемости студентов.
1. Анализ предметной области
Образование играет одну из важнейших ролей в любом государстве. От
качества образования, существующего в конкретном обществе, во многом
зависят темпы его экономического и политического развития, его нравственное
состояние. Стремительное развитие информационных технологий позволяет
автоматизировать многие сферы деятельности людей повышая их
эффективность, и образование не является исключением. В данной работе речь
пойдет о создании прогнозной модели успеваемости студентов по текущим
оценкам с помощью технологий анализа данных.
Мерой измерения качества получаемого образования для конкретного
студента служат его оценки по пройденным предметам. Если говорить об
учебном заведении, то одной из мер качества предоставляемого им образования
служит совокупность оценок его учащихся. Своевременные меры по оказанию
помощи студентам, которые не справляются с учебной нагрузкой, являются
одной из основных частей по учебно-воспитательной работе в ВУЗе, которые
влияют на показатели качества образования в учебном заведении.
В последнее время, было сделано много различных изменений для
улучшения качества образования в ВУЗах. Например, переход от традиционной
системы оценок к бальным исключает возможность того, что студент, который
не ходил на занятия весь семестр просто придет и сдаст экзамен. Для допуска к
экзамену ему нужно набрать определенное количество балов, а для этого в свою
очередь необходимо посещать занятия и выполнять текущие задания. Такой
подход эффективно влияет на понимание учебного материала. Согласно
многим исследованиям, информация, которая была изучена в течение
длительного промежутка времени, сохранится на долгое время, в то время как,
«зубрежка» в ночь перед экзаменом может дать лишь хороший результат на
экзамене, который в итоге будет сдан, но остаточных знаний от предмета у
студента вовсе не останется. Помимо этого, существует рубежный контроль,
назначенная дата в середине семестра, когда определенная часть материала
должна быть сдана. Однако, зная специфику студенческой жизни, многие
студенты все равно оставляют все на последний момент. Некоторым студентам
удается сдать предмет, другие же остаются с долгом на другой семестр.
Проблема заключается в том, что управляющее воздействие со стороны
единого деканата Томского Политехнического Университета начинается
только после того факта, что у студента уже появилась задолженность. Таким
образом, данные меры нельзя назвать превентивными. Главной задачей
прогнозной модели является выделение таких студентов и проведение с ними
определенных бесед до того, когда появится проблема в виде академической
задолженности. В настоящее время данная мера реализована отчасти тем, что у
каждой группы первокурсников есть куратор, и этот куратор сопровождает
каждую группу вплоть до 2го курса, в расписании отводятся такое мероприятие
как «час куратора», где он анализирует успеваемость студентов. Это является
отличной практикой, и отказываться от нее нельзя, однако, тут играет роль
человеческий фактор. Не всегда куратор может донести до студентов важность
посещения занятий. Внедрение новой системы прогнозирования количества
задолженностей в конце семестра по текущей успеваемости является важным
этапом автоматизации процесса учебно-воспитательной работы. Таким
образом, единый деканат сможет оказывать управляющее воздействие на
студентов, попавших в группу риска, гораздо раньше возникновения реальной
проблемы. Тем самым, появится возможность помочь студентам заканчивать
семестр успешно и формировать профессиональные компетенции, а тех, кто не
заинтересован в обучении, отчислять раньше и освобождать места для тех, кто
действительно хочет и готов получать знания.
Основное внимание уделено именно системе прогнозирования, так как
речь идет не просто о контроле посещаемости занятий студентом. Анализ
данных показывает, что на конечный результат семестра влияет не только один
фактор посещаемости, а целый комплекс различных данных. Например,
существует целая категория студентов, которые уже работают по
специальности, в основном это магистранты и студенты последних курсов. У
таких студентов не всегда есть возможность посещения занятий, и тем не менее
они показывают отличные результаты на конец сессии, в силу того, что
понимают многие аспекты профессии на более высоком уровне чем их
одногруппники.
В действительности на успеваемость студента влияет огромное
количество факторов, и одними из самых важных являются мотивация на учебу,
моральное состояние, отношение с одногруппниками и так далее, но благодаря
тому, что система будет выдавать проблемных студентов и с каждым будет
возможность работать детально, выявлять какие проблемы существуют именно
у этого студента, который рискует окончить семестр с большим количеством
долгов. Выявление таких параметров как мотивация, целеустремленность,
психологические данные возможно, но это требует большого числа тестов,
которые должны проводится на регулярной основе. Данные методы не имеют
высокой эффективности за счет сложности их проведения, а также проверки и
интерпретации результатов.
После выяснения того, что данная проблема действительно является
актуальной, стоит рассмотреть существующие методы ее решений.
На данный момент в открытом доступе нет материалов, посвященных
внедрению и использованию системы прогнозирования успеваемости студента
в ВУЗе. Хотя данная идея не является инновационной, примерно с 2010 года
выходят статьи о прогнозировании успеваемости абитуриентов,
прогнозировании успеваемости учащихся по определенному курсу, где за
исходные данные как правило берутся следующие параметры: уровень текущих
знаний по предмету, количество пропусков, промежуточный контроль, оценки
по обеспечивающим курсам к дисциплине.
Далее рассмотрим алгоритмы машинного обучения, которые
применяются для решения похожих задач в сфере прогнозирования
успеваемости студентов. Будут приведены наиболее часто встречающиеся
методы и алгоритмы, а также описание существующих работ с конкретными
задачами, для которых эти методы применяются.
Некоторые источники применяют метод кластеризации, на наш взгляд это
не совсем верно, так как у нас уже есть метки классов, а именно количество
задолженностей, так что в данном случае следует применять методы
классификации. Кластеризация относится к методам машинного обучения без
учителя, а классификация и регрессия в свою очередь к обучению с учителем,
так как имеют в качестве исходных данных маркеры для каждого класса.
Методы кластерного анализа для оценки итоговой оценки по предмету были
применены в данной статье. [1]
В результате выполнения магистерской диссертации были выполнены
следующие задачи:
1. Проанализированы методы, которые используются для решения
аналогичных задач в сфере образования.
2. Проведена предварительная обработка данных
3. Построена модель машинного обучения, способная
прогнозировать успеваемость студентов на конец семестра.
4. Выявлены наиболее значимые признаки в определении
успеваемости студентов.
5. Создан графический интерфейс пользователя прогнозной модели
успеваемости студентов
Так как при предварительной обработке данных были использованы
метки для обозначения «успешности студента», то тип машинного обучения
был с учителем. Были апробированы 3 модели машинного обучения с учителем,
а именно: логистическая регрессия, метод опорных векторов и случайный лес.
Наилучший результат на тестовой выборке показал классификатор «случайный
лес». Данный алгоритм является оптимальным так, как обладает следующими
достоинствами:
Помимо этого, был создан графический интерфейс для модуля по
прогнозированию успеваемости студентов на конец семестра по текущим
оценкам.
Список публикаций и научных достижений
Участие в конференциях:
1. ХVl Международная научно-практическая конференция студентов,
аспирантов и молодых ученых «Молодёжь и современные и информационные
технологии» с докладами:
• Анализ социальных данных с помощью технологий Big Data
• Использование OLAP технологии для выявления группы риска острого
инфаркта миокарда
• Интеллектуальный анализ данных для определения группы риска
сердечно сосудистых заболеваний
Премии, звания, стипендии:
1. Повышенная государственная стипендия по научно-исследовательской
деятельности, весна 2018/2019 учебного года, весна 2019/2020 учебного года.
2. Стипендия Правительства РФ студентам ТПУ, обучающимся по
специальностям или направлениям подготовки, соответствующим
приоритетным направлениям модернизации и технологического развития
российской экономики, весна 2018/2019 учебного года, весна 2019/2020
учебного года.
3. Стипендия Эразмус+ – некоммерческая программа Европейского союза
по обмену студентами и преподавателями между университетами стран-
партнёров. (Erasmus+ programme (KA107))
Научные стажировки:
1. Академический обмен в рамках программы Erasmus+ (Испания, г. Мадрид,
Мадридский Политехнический Университет)
Публикации:
1. Зяблецев П. А. Использование OLAP технологии для выявления группы
риска острого инфаркта миокарда // Молодежь и современные
информационные технологии: сборник трудов XVI Международной научно-
практической конференции студентов, аспирантов и молодых ученых, Томск,
3-7 Декабря 2018. – Томск: ТПУ, 2019 – C. 154-155
2. Зяблецев П. А. Интеллектуальный анализ данных для определения
группы риска сердечно сосудистых заболеваний // Молодежь и современные
информационные технологии: сборник трудов XVI Международной научно-
практической конференции студентов, аспирантов и молодых ученых, Томск,
3-7 Декабря 2018. – Томск: ТПУ, 2019 – C. 152-153
3. Журбич Н. И., Зяблецев П. А. Анализ данных с помощью технологий Big
Data // Информационные технологии в науке, управлении, социальной сфере и
медицине: сборник научных трудов V Международной конференции: в 2 т.,
Томск, 17-21 Декабря 2018. – Томск: ТПУ, 2018 – Т. 1 – C. 255-257.
4. Зяблецев П. А. Анализ многомерных данных для определения группы
риска сердечно-сосудистых заболеваний // Информационные технологии в
науке, управлении, социальной сфере и медицине: сборник научных трудов V
Международной конференции: в 2 т., Томск, 17-21 Декабря 2018. – Томск: ТПУ,
2018 – Т. 1 – C. 263-266
5. Журбич Н. И., Зяблецев П. А. Анализ социальных данных с помощью
технологий Big Data // Молодежь и современные информационные технологии:
сборник трудов XVI Международной научно- практической конференции
студентов, аспирантов и молодых ученых, Томск, 3-7 Декабря 2018. – Томск:
ТПУ, 2019 – C. 148-149.
6. Журбич Н. И., Зяблецев П. А. Разработка виртуального полигона в Unity
3D // Информационные технологии в науке, управлении, социальной сфере и
медицине: сборник научных трудов V Международной конференции: в 2 т.,
Томск, 17-21 Декабря 2018. – Томск: ТПУ, 2018 – Т. 1 – C. 252-255
7. Зяблецев П. А., Журбич Н. И. Выявление факторов риска острого
инфаркта миокарда с помощью OLAP технологии // Информационные
технологии в науке, управлении, социальной сфере и медицине: сборник
научных трудов V Международной конференции: в 2 т., Томск, 17-21 Декабря
2018. – Томск: ТПУ, 2018 – Т. 1 – C. 267-270.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!