Автоматическое выявление агрессии в текстах сетевых сообществ

Бархатова Валерия Андреевна
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В настоящей работе рассматривается речевая агрессия как лингвистический феномен, описывается наиболее полная ее классификация, а также поднимается проблема киберагресии в интернет-сообществах. В работе также определены основные способы выражения речевой агрессии и лингвистические маркеры. В практической части показано поэтапное описание создания классификатора для выявления речевой агрессии в текстах речевых сообществ и формирование датасета для его обучения.

Введение…………………………………………………………………………………………………………… 3

Глава I. Агрессия в интернете и ее лингвистические особенности ………………… 6
1. Речевая агрессия в лингвистике ………………………………………………………………. 6
1.1. Понятие речевой агрессии в лингвистике………………………………………………….. 6
1.2. Виды речевой агрессии …………………………………………………………………………… 10
2. Лингвистические средства выражения агрессии в русском языке ……….. 16
2.1. Эксплицитный способ выражения агрессии…………………………………………….. 17
2.2. Имплицитный способ выражения агрессии …………………………………………….. 19
3. Статус оскорблений и проблема киберагрессии …………………………………….. 23
4. Выводы к главе I …………………………………………………………………………………….. 30

Глава II. Использование сверточной нейронной сети для выявления агрессии
……………………………………………………………………………………………………………………….. 32
1. Сверточные нейронные сети…………………………………………………………………… 32
2. Источники текстовых данных ………………………………………………………………… 37
3. Сбор текстовых данных ………………………………………………………………………….. 40
4. Предварительная обработка и преобразование текстовых данных ………. 42
5. Обучение классификатора ……………………………………………………………………… 44
6. Тестирование классификатора и оценка результатов ……………………………. 46
7. Выводы к главе II …………………………………………………………………………………… 51

Заключение ……………………………………………………………………………………………………. 53

Список используемой литературы ………………………………………………………………… 55

В современном обществе во многих сферах социальной жизни наблюдаются
сложности в коммуникативном поведении людей, в результате которых речевое
общение носит грубый и недоброжелательный характер. Можно заметить, что
«высокая степень категоричности авторов публикаций в современной прессе
создает впечатление о недопустимом уровне агрессивности речевой коммуникации
в современном русском обществе…»1, поэтому изучение речевой агрессии
вызывает в последнее время немалый теоретический и практический интерес:
появляется все больше научных работ, освещающих данную проблему. Решение
вопросов, связанных с речевой агрессией, в частности, ее устранением во многом
связывают с пропагандой толерантности в речевой коммуникации.
В последнее время речевая агрессия перешла из реального общения в
виртуальное. Столкнуться с агрессией в интернете сегодня можно намного чаще,
чем в офлайн-жизни. Это связано с тем, что интернет умеет хранить, все то, что,
когда-то там было оставлено, а многочисленные научные работы, освещающие
проблему киберагрессии, утверждают, что проявлять агрессию в интернет-
сообществах намного проще, чем в реальной жизни из-за наличия анонимности в
интернете. Кроме того, киберагрессия несмотря на то, что появилась она совсем
недавно, способна наносить огромный вред психологическому здоровью той части
общества, которая является активными пользователями сети интернет, в частности,
социальными сетями.
Мы считаем, что существует способ для предотвращения распространения
речевой агрессии в социальных сетях путем создания автоматического
классификатора, обученного на данных, состоящих из агрессивных и
неагрессивных комментариев.
Карпенко Л. А. Психология. Словарь. М., 1990. 494 с.
Таким образом, основной целью нашего исследования является создание
автоматического классификатора для выявления агрессии в текстах сетевых
сообществ.
Поставленная цель потребовала решения следующих задач:
– изучение подходов к определению речевой агрессии;
– анализ существующих описаний речевой агрессии в работах других
исследователей̆;
– анализ полученных результатов с точки зрения цели и гипотез
исследования;
– представление классификации речевой агрессии;
– определение лингвистических средств выражения речевой агрессии;
– изучение проблемы киберагарессии, ее видов, причин и поводов;
– анализ исследований, посвященных сверточным нейронным сетям и
определение их эффективности для классификации текстовых данных;
– сбор текстовых данных для оформления датасета;
– предварительная обработка собранных текстовых данных;
– обучение классификатора с использованием сверточной нейронной
сети;
– тестирование классификатора и оценка полученных результатов
обучения.
В качестве объекта данного исследования выступает речевая агрессия в
русском языке в Интернете. Предметом исследования являются признаки
агрессии.
Основным материалом исследования послужил созданный датасет,

В данной работе представлена попытка автоматизировать выявление
агрессии в текстах сетевых сообществ.
В теоретической части работы были проанализированы лингвистические
особенности речевой агрессии и определена значимость проблемы киберагрессии.
Мы выяснили, что для полного изучения речевой агрессии, ее необходимо
рассматривать с точки зрения разных наук и их отраслей, так как это достаточно
сложное явление, затрагивающее различные сферы. Данная теоретическая
информация необходима для понимания объекта нашего изучения, его
особенностей и структуры. Без этой информации невозможно было бы достичь
цели нашего исследования.
В практической части мы подробно описали создание классификатора,
который определяет наличие речевой агрессии в текстах сетевых сообществ,
определили причины использования именно сверточных нейронных сетей и
конвейера spaCy. В результате нами был собран датасет, состоящий из
комментариев, и классификатор, которые успешно справляются со поставленной
задачей.
Цель данного исследования была достигнута, и мы видим несколько векторов
дальнейшего его развития. Прежде всего можно увеличить размер датасета, для
того чтобы улучшить эффективность классификатора. Чем больше примеров знает
классификатор, тем с большим количеством комментариев он может справляться.
На наш взгляд, нет предельного количества комментариев, которые должны быть
в датасете. Язык имеет тенденцию к изменениям, появлениям новых слов, особенно
это характерно для лексики интернет-пространства, поэтому необходимость в
пополнении нашего датасета будет всегда.
В дальнейшем разработанный классификатор также можно использовать и
для других исследований, связанных с классификацией текстовых данных, так как
мы выяснили, что сверточные нейронные сети лучше всего справляются именно с
этой задачей. Его структура позволяет использовать свою систему меток для
разметки собранного датасета и, например, может быть применена для
определения тональности текста (в частности, отзывов). Если для обучения модели
предоставить качественные текстовые данные, то результаты могут быть более
высокими. Кроме того, он подходит практически для всех языков, так как его
архитектура основана на конвейере библиотеки spaCy, в арсенале которой
представлены также конвейеры для других языков, в том числе мультиязычный.
Таким образом, в нашей работе мы подняли проблему киберагрессии,
отметили, что в реальных условиях есть необходимость искать способы борьбы с
ней и предложили свой вариант, в основе которого лежит классификатор,
обученный на реальных данных и способный определять содержание речевой
агрессии в тексте. Надеемся, что наше исследование может вызвать интерес к
затронутой теме, а разработанная нами программа позволит своевременно
выявлять агрессивные комментарии и, таким образом, будет способствовать
благоприятному общению в социальных сетях.

1.Апресян, В. Ю. Имплицитная агрессия в языке / В. Ю. Апресян //
Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф.
«Диалог 2003». – М. : Наука, 2003. – С. 32-35.
2.Бахтин, М. М. Франсуа Рабле и народная культура средневековья и
Ренессанса / М. М. Бахтин. – М. : Художественная литература, 1990. – 544 с.
3.Воробьев, Н. В., Пучков Е. В. Классификация текстов с помощью
сверточных нейронных сетей [Электронный ресурс] / Н.В. Воробьев, Е.В. Пучков
// Молодой исследователь Дона. – Ростов-на-Дону., 2017. – №6. Режим доступа :
https://mid-journal.ru/upload/iblock/8ed/1.-vorobev_-puchkov.pdf (дата обращения :
1.04.2021).
4.Воронцова, Т. А. Речевая агрессия : автореф. дис. … д-ра филол. наук /
Т. А. Воронцова. – Челябинск, 2006. – 43 с.
5.Гловинская, М.Я. Гипербола как проявление речевой агрессии //
Сокровенные смыслы: сб. статей в честь Н. Д. Арутюновой. – М., 2004. – С. 69-76.
6.Горелов, И. Н. Основы психолингвистики / И. Н. Горелов, К. Ф. Седов.
– М., 2001. – 149 с.
7.Енина, Л. В. Катартический характер речевой агрессии в сверхтексте
лозунгов и источники ее смягчения / Л. В. Енина // Вопросы стилистики:
Антропоцентрические исследования. – Саратов, 1999. – Вып.28. – С. 103-107.
8.Енина, Л. В. Речевая агрессия и речевая толерантность в средствах
массовой информации / Л. В. Енина // Российская пресса в поликультурном
обществе: толерантность и мультикультурализм как ориентиры профессионального
поведения. – М., 2002. – С. 104-110.
9.Жельвис, В. И. Поле брани. Сквернословие как социальная проблема в
языках и культурах мира / В. И. Желвис. – М. : Ладомир, 1997. – 330 с.
10.Закоян, Л. М. Речевая агрессия как предмет лингвистических
научныхисследований / Л. М. Закоян // Полилингвиальность и транскультурные
практики. – 2008. – №2. – C. 46-52.
11.Карпенко, Л. А. Психология. Словарь / Под общ. ред. А. В.
Петровского, М. Г. Ярошевского. – М.: Политиздат, 1990. – 494 с.
12.Киберугрозы, киберагрессия, кибербуллинг: различия в восприятии,
оценке и поведении у разных групп населения Российской Федерации
[Электронный ресурс] – Режим доступа : https://raec.ru/activity/analytics/9880/ (дата
обращения : 4. 05. 2020 г.).
13.Коданева,С.И.Кибрбуллинг:причиныявленияиметоды
предупреждения / С. И. Коданева // Социальные новации и социальные науки. – М.:
ИНИОН РАН, 2020. – №1. – С. 149-159.
14.Курьянова, И. В. Маркеры речевой агрессии в интернет-коммуникации
при исследовании текстов экстремистской направленности / И. В. Курьянова //
Вестник МГЛУ. Гуманитарные науки. – М., 2018. – С. 29-38.
15.Кусов, Г. В. Оскорбление как иллокутивный лингвокультурный
концепт: Автореф. дис… канд. филол. Наук / Г. В. Кусов. – Волгоград, 2004. – 27 с.
16.Ле Мань Ха. Свёрточная нейронная сеть для решения задачи
классификации / Ле Мань Ха // Труды МФТИ. – М., 2016. – Том 8. – № 3. – С. 91-
97.
17.Михальская, А. К. Русский Сократ: Лекции по сравнительно-
исторической риторике. − М.: Изд. центр. «Academia», 1996. – 192 с.
18.Николаева, Т. М. О принципе «некооперации» и/или о категории
социолингвистического воздействия / Т. М. Николаева // Логический анализ языка:
Противоречивость и аномальность текста. – М., 1990. – 167 с.
19.Седов, К. Ф. Агрессия как вид речевого воздействия / К. В. Седов //
Прямая и непрямая коммуникация. – Саратов: «Колледж», 2003. – С. 110-113.
20.Солдатова, Г. У. Кибербуллинг : особенности, ролевая структура,
детско-родительские отношения и стратегии совладания / Г. У. Солдатова, А. Н.
Ярмина // Национальный психологический журнал. – М., 2019. – № 3. – С. 17–31.
21.Стернин, И. А. Введение в речевое воздействие / И. А. Стернин. –
Воронеж, 2001. – 227 с.
22.Стилистический энциклопедический словарь русского языка / под ред.
М. Н. Кожиной. – М., 2006. – 696 с.
23.Тиллабаева, А. А. Речевое поведение интернет-пользователей в
ситуации конфронтационного общения / А. А. Тиллабаева, В. А. Шульгинов //
Слово.ру: балтийский акцент. – Калининград. – 2020. – Т. 11. – №4. – С. 45-57.
24.Черенков, Д. А. Девиантное поведение в социальных сетях: причины,
формы, следствие [Электронный ресурс] / Д. А. Черенков // Nauka-rastudent. Ru. –
2015. – № 07. Режим доступа : https://readera.org/14330143 (дата обращения :
3.05.2021).
25.Шаров, А. А. Специфика девиантной активности молодежи в интернет-
среде / А. А. Шаров // Учен. записки. Электронный научный журнал Курского
государственного университета. – 2019. – № 3. – С. 255–261.
26.Щербинина, Ю. В. Русский язык: Речевая агрессия и пути ее
преодоления. – М., 2012. – 224 с.
27.Ярец, А. Д. Разновидности конфликтов и агрессии в интернет-
коммуникации [Электронный ресурс] / А. Д. Ярец // Идеи. Поиски. Решения:
сборник статей и тезисов XIII Международной научно-практической конференции
преподавателей, аспирантов, магистрантов, студентов. – Минск: БГУ, 2020. –
С.201-214.Режимдоступа:http://elib.bsu.by/handle/123456789/241180(дата
обращения: 20.05.2021).
28.Bai, S., Kolter, J. Z., & Koltun, V. An Empirical Evaluation of Generic
Convolutional and Recurrent Networks for Sequence Modeling. Режим доступа :
https://arxiv.org/abs/1803.01271 (дата обращения : 23.03.2021).
29.Bengio, Y. Learning deep architectures for AI // Foundations and Trends in
MachineLearning.Режимдоступа:
https://www.researchgate.net/publication/215991023_Learning_Deep_Architectures_fo
r_AI (дата обращения: 7.05.2021).
30.Calpbinici, Arslan. Virtual behaviors affecting adolescent mental health: The
usage of Internet and mobile phone and cyberbullying // Journal of Child and Adolescent
Psychiatric Nursing. – 2019. – Vol. 32. – N 3. – P. 139-148.
31.Christopher, D. Manning. Computational linguistics and deep learning.
Computational Linguistics. – 2016. – Vol. 41. – Issue 4. Режим доступа :
http://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00239#.WQH8MBhh2qA
(дата обращения : 4.04.2021).
32.Schoffstall, C., Cohen, R. Cyber-Aggression: The Relation between Online
Offenders and Offline Social Competence // Social Development. – 2011. – Vol. 20. –
Issue 3. – P. 586–604.
33.Willard, N. E. Cyberbullying and Cyberthreats : Responding to the
Challenge of Online Social Aggression, Threats, and Distress. Champaign, Illinois :
Research Press, 2007. – 320 р.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ
    Мария М. УГНТУ 2017, ТФ, преподаватель
    5 (14 отзывов)
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ... Читать все
    Имею 3 высших образования в сфере Экологии и техносферной безопасности (бакалавриат, магистратура, аспирантура), работаю на кафедре экологии одного из опорных ВУЗов РФ. Большой опыт в написании курсовых, дипломов, диссертаций.
    #Кандидатские #Магистерские
    27 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Екатерина П. студент
    5 (18 отзывов)
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно... Читать все
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно занимаюсь английским языком, уровень владения - Upper-Intermediate.
    #Кандидатские #Магистерские
    39 Выполненных работ
    Татьяна С. кандидат наук
    4.9 (298 отзывов)
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (пос... Читать все
    Большой опыт работы. Кандидаты химических, биологических, технических, экономических, юридических, философских наук. Участие в НИОКР, Только актуальная литература (поставки напрямую с издательств), доступ к библиотеке диссертаций РГБ
    #Кандидатские #Магистерские
    551 Выполненная работа
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021год
    🏢 Санкт-Петербургский государственный университет