Top.Mail.Ru

Оценка релевантности текстовых отзывов сервиса анкетирования

Высотенко, Егор Игоревич Базовая кафедра интеллектуальных систем управления
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

ВВЕДЕНИЕ………………………………………………………………………………………………… 4
1 Теоретические основы расчета критериев оценки релевантности текстовых
отзывов………………………………………………………………………………………………………..6
1.1Сервис анкетирования студентов СФУ……………………………………………….. 6
1.2Критерии оценки релевантности текстовых отзывов…………………………… 7
1.3Методы нормализации текста………………………………………………………………8
1.3.1 Стемминг…………………………………………………………………………………….. 8
1.3.2 Лемматизация……………………………………………………………………………….9
1.4 Подходы к решению задачи автоматической классификации текстовых
отзывов………………………………………………………………………………………………………11
1.4.1 Методы, основанные на машинном обучении…………………………….. 11
1.4.2 Метод, основанный на словаре тональностей…………………………….. 17
2 Исследование и выбор методов классификации текстов…………………………..20
2.1Анализ и сравнение методов машинного обучения при расчете критерия
принадлежности…………………………………………………………………………………………24
2.1.1 Предобработка данных………………………………………………………………. 24
2.1.2 Машинное обучение……………………………………………………………………25
2.2Анализ и сравнение методов нормализации при расчете критерия
тональной принадлежности словарным подходом………………………………………28
3 Программный модуль расчета критериев оценки релевантности текстовых
отзывов………………………………………………………………………………………………………31
3.1Описание программного модуля……………………………………………………….. 31
3.2Апробация программного модуля………………………………………………………35
ЗАКЛЮЧЕНИЕ………………………………………………………………………………………….49
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………50

Сервисы анкетирования на сегодняшний день находят широкое
применение во многих областях деятельности, как с практической, так и с
научной точки зрения. Рассматривая механизм анкетирования студентов на
базе личного кабинета «Института космических и информационных
технологий», можно сказать о том, что анкетирование является одним из
непростых процессов механизма мониторинга образовательной среды.
Данный факт связан с тем, что в опросе определяющую роль играет
человеческий фактор. Именно в данном случае стоит более ответственно
подходить к анализу полученных результатов.
В случае, когда система анкетирования предусматривает возможность
дополнять числовую оценку текстовым комментарием, возникает задача
анализа текстовой части отзыва. Регулярная обработка результатов
практически всегда требует большое количество ресурсов, тем более если
данные представлены в свободной форме. Так же, не все отзывы можно
использовать как достоверную информацию. Проблема релевантности таких
результатов связанно с субъективным отношением человека и эмоциональным
фактором. Анализ текстовой части отзыва позволяет наиболее продуктивно
реализовывать обратную связь путем выделения числовых показателей
релевантности текста, используя современные методы машинного обучения.
Объектом исследования является сервис анкетирования студентов на

Не смотря на развитие современных IT-технологий, на текущий момент
нет совершенного алгоритма автоматического анализа текстов. Как правило,
любая задача из области классифицирования текстов отталкивается от
конечного результата, и успешность решения таких задач состоит из
правильного подбора технологий, например, технологий нормализации
данных перед машинным обучением и т.п.
В ходе работы по теме диссертации были проведены исследования по
выбору оптимальных технологий для автоматического анализа текстовых
отзывов сервиса анкетирования Сибирского федерального университета.
Прежде всего, были изучены аспекты нормализации данных. На практике,
рассмотрены стемминг и лемматизация текстов. Далее, были
проанализированы два метода автоматической классификации текстовых
отзывов: метод, основанный на машинном обучении и метод, основанный на
применении тональных словарей. В результате изучения метода с
применением машинного обучения, были рассмотрены пять математических
моделей.
По итогу работы, основываясь на результатах исследований, был
разработан модуль расчета критериев оценки релевантности текстовых
отзывов. По результатам апробации разработанного алгоритма был сделан
вывод о том, что выбранные технологии анализа являются оптимальными в
контексте решаемой задачи.

1. Даничев А.А., Якунин Ю.Ю. Аспектный анализ тональности
отзывов в образовательной среде // Информатизация образования и методика
электронного обучения Материалы III Международной научной конференции.
В двух частях. Сибирский федеральный университет, Институт космических и
информационных технологий. 2019. С. 61-65.
2. Обзорметодовклассификациивмашинномобучении
[Электронныйресурс].IT-портал«TProger.ru»–Режимдоступа:
https://tproger.ru/translations/scikit-learn-in-python/ (дата обращения 13.04.2020).
3. Документация модуля «Tree Tagger» [Электронный ресурс].
Режим доступа: https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/
4. Документациябиблиотеки«nltk»,описаниестеммера
«SnowballStemmer» [Электронный ресурс]. IT-ресурс «kite» – Режим доступа:
https://kite.com/python/docs/nltk.SnowballStemmer
5. Онлайн-тезаурус русского языка «Карта слов» [Электронный
ресурс].–URL:https://github.com/dkulagin/kartaslov(датаобращения:
12.04.2020).
6. Описаниенаивногобайесовскогоалгоритмадля«Python»
[Электронныйресурс]:IT-ресурс«StackAbuse»–Режимдоступа:
https://stackabuse.com/the-naive-bayes-algorithm-in-python-with-scikit-learn/
7. Описание метода опорных векторов для «Python» [Электронный
ресурс]:IT-ресурс«StackAbuse»–Режимдоступа:
https://stackabuse.com/implementing-svm-and-kernel-svm-with-pythons-scikit-
learn/
8. Описание метода k-средних [Электронный ресурс]: IT-портал
«data science» – Режим доступа: https://stackabuse.com/implementing-svm-and-
kernel-svm-with-pythons-scikit-learn/
9. Описаниеклассификаторадереварешенийдля«Python»
[Электронныйресурс]:IT-ресурс«StackAbuse»–Режимдоступа:
https://stackabuse.com/decision-trees-in-python-with-scikit-learn/
10. Описание метода логистической регрессии [Электронный ресурс]:
«Википедия»–Режимдоступа:https://ru.wikipedia.org/wiki/
Логистическая_регрессия
11. Глубоко аннотированный корпус русского языка [Электронный
ресурс]:«Википедия»–Режимдоступа:https://ru.wikipedia.org/wiki/
Глубоко_аннотированный_корпус_русского_языка
12. Документация модуля TreeTager для «Python» [Электронный
ресурс]: TreeTagger Python Wrapper’s documentation – Режим доступа:
https://stackabuse.com/decision-trees-in-python-with-scikit-learn/

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Алёна В. ВГПУ 2013, исторический, преподаватель
    4.2 (5 отзывов)
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическо... Читать все
    Пишу дипломы, курсовые, диссертации по праву, а также истории и педагогике. Закончила исторический факультет ВГПУ. Имею высшее историческое и дополнительное юридическое образование. В данный момент работаю преподавателем.
    #Кандидатские #Магистерские
    25 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Ольга Б. кандидат наук, доцент
    4.8 (373 отзыва)
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских... Читать все
    Работаю на сайте четвертый год. Действующий преподаватель вуза. Основные направления: микробиология, биология и медицина. Написано несколько кандидатских, магистерских диссертаций, дипломных и курсовых работ. Слежу за новинками в медицине.
    #Кандидатские #Магистерские
    566 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Интеллектуальный анализ текстовых данных с rnприменением методов машинного обучения
    📅 2019год
    🏢 Национальный исследовательский Томский политехнический университет (ТПУ)