Автоматическое выявление агрессии в текстах сетевых сообществ

Бархатова Валерия Андреевна
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В настоящей работе рассматривается речевая агрессия как лингвистический феномен, описывается наиболее полная ее классификация, а также поднимается проблема киберагресии в интернет-сообществах. В работе также определены основные способы выражения речевой агрессии и лингвистические маркеры. В практической части показано поэтапное описание создания классификатора для выявления речевой агрессии в текстах речевых сообществ и формирование датасета для его обучения.

Введение…………………………………………………………………………………………………………… 3

Глава I. Агрессия в интернете и ее лингвистические особенности ………………… 6
1. Речевая агрессия в лингвистике ………………………………………………………………. 6
1.1. Понятие речевой агрессии в лингвистике………………………………………………….. 6
1.2. Виды речевой агрессии …………………………………………………………………………… 10
2. Лингвистические средства выражения агрессии в русском языке ……….. 16
2.1. Эксплицитный способ выражения агрессии…………………………………………….. 17
2.2. Имплицитный способ выражения агрессии …………………………………………….. 19
3. Статус оскорблений и проблема киберагрессии …………………………………….. 23
4. Выводы к главе I …………………………………………………………………………………….. 30

Глава II. Использование сверточной нейронной сети для выявления агрессии
……………………………………………………………………………………………………………………….. 32
1. Сверточные нейронные сети…………………………………………………………………… 32
2. Источники текстовых данных ………………………………………………………………… 37
3. Сбор текстовых данных ………………………………………………………………………….. 40
4. Предварительная обработка и преобразование текстовых данных ………. 42
5. Обучение классификатора ……………………………………………………………………… 44
6. Тестирование классификатора и оценка результатов ……………………………. 46
7. Выводы к главе II …………………………………………………………………………………… 51

Заключение ……………………………………………………………………………………………………. 53

Список используемой литературы ………………………………………………………………… 55

В современном обществе во многих сферах социальной жизни наблюдаются
сложности в коммуникативном поведении людей, в результате которых речевое
общение носит грубый и недоброжелательный характер. Можно заметить, что
«высокая степень категоричности авторов публикаций в современной прессе
создает впечатление о недопустимом уровне агрессивности речевой коммуникации
в современном русском обществе…»1, поэтому изучение речевой агрессии
вызывает в последнее время немалый теоретический и практический интерес:
появляется все больше научных работ, освещающих данную проблему. Решение
вопросов, связанных с речевой агрессией, в частности, ее устранением во многом
связывают с пропагандой толерантности в речевой коммуникации.
В последнее время речевая агрессия перешла из реального общения в
виртуальное. Столкнуться с агрессией в интернете сегодня можно намного чаще,
чем в офлайн-жизни. Это связано с тем, что интернет умеет хранить, все то, что,
когда-то там было оставлено, а многочисленные научные работы, освещающие
проблему киберагрессии, утверждают, что проявлять агрессию в интернет-
сообществах намного проще, чем в реальной жизни из-за наличия анонимности в
интернете. Кроме того, киберагрессия несмотря на то, что появилась она совсем
недавно, способна наносить огромный вред психологическому здоровью той части
общества, которая является активными пользователями сети интернет, в частности,
социальными сетями.
Мы считаем, что существует способ для предотвращения распространения
речевой агрессии в социальных сетях путем создания автоматического
классификатора, обученного на данных, состоящих из агрессивных и
неагрессивных комментариев.
Карпенко Л. А. Психология. Словарь. М., 1990. 494 с.
Таким образом, основной целью нашего исследования является создание
автоматического классификатора для выявления агрессии в текстах сетевых
сообществ.
Поставленная цель потребовала решения следующих задач:
– изучение подходов к определению речевой агрессии;
– анализ существующих описаний речевой агрессии в работах других
исследователей̆;
– анализ полученных результатов с точки зрения цели и гипотез
исследования;
– представление классификации речевой агрессии;
– определение лингвистических средств выражения речевой агрессии;
– изучение проблемы киберагарессии, ее видов, причин и поводов;
– анализ исследований, посвященных сверточным нейронным сетям и
определение их эффективности для классификации текстовых данных;
– сбор текстовых данных для оформления датасета;
– предварительная обработка собранных текстовых данных;
– обучение классификатора с использованием сверточной нейронной
сети;
– тестирование классификатора и оценка полученных результатов
обучения.
В качестве объекта данного исследования выступает речевая агрессия в
русском языке в Интернете. Предметом исследования являются признаки
агрессии.
Основным материалом исследования послужил созданный датасет,

В данной работе представлена попытка автоматизировать выявление
агрессии в текстах сетевых сообществ.
В теоретической части работы были проанализированы лингвистические
особенности речевой агрессии и определена значимость проблемы киберагрессии.
Мы выяснили, что для полного изучения речевой агрессии, ее необходимо
рассматривать с точки зрения разных наук и их отраслей, так как это достаточно
сложное явление, затрагивающее различные сферы. Данная теоретическая
информация необходима для понимания объекта нашего изучения, его
особенностей и структуры. Без этой информации невозможно было бы достичь
цели нашего исследования.
В практической части мы подробно описали создание классификатора,
который определяет наличие речевой агрессии в текстах сетевых сообществ,
определили причины использования именно сверточных нейронных сетей и
конвейера spaCy. В результате нами был собран датасет, состоящий из
комментариев, и классификатор, которые успешно справляются со поставленной
задачей.
Цель данного исследования была достигнута, и мы видим несколько векторов
дальнейшего его развития. Прежде всего можно увеличить размер датасета, для
того чтобы улучшить эффективность классификатора. Чем больше примеров знает
классификатор, тем с большим количеством комментариев он может справляться.
На наш взгляд, нет предельного количества комментариев, которые должны быть
в датасете. Язык имеет тенденцию к изменениям, появлениям новых слов, особенно
это характерно для лексики интернет-пространства, поэтому необходимость в
пополнении нашего датасета будет всегда.
В дальнейшем разработанный классификатор также можно использовать и
для других исследований, связанных с классификацией текстовых данных, так как
мы выяснили, что сверточные нейронные сети лучше всего справляются именно с
этой задачей. Его структура позволяет использовать свою систему меток для
разметки собранного датасета и, например, может быть применена для
определения тональности текста (в частности, отзывов). Если для обучения модели
предоставить качественные текстовые данные, то результаты могут быть более
высокими. Кроме того, он подходит практически для всех языков, так как его
архитектура основана на конвейере библиотеки spaCy, в арсенале которой
представлены также конвейеры для других языков, в том числе мультиязычный.
Таким образом, в нашей работе мы подняли проблему киберагрессии,
отметили, что в реальных условиях есть необходимость искать способы борьбы с
ней и предложили свой вариант, в основе которого лежит классификатор,
обученный на реальных данных и способный определять содержание речевой
агрессии в тексте. Надеемся, что наше исследование может вызвать интерес к
затронутой теме, а разработанная нами программа позволит своевременно
выявлять агрессивные комментарии и, таким образом, будет способствовать
благоприятному общению в социальных сетях.

1.Апресян, В. Ю. Имплицитная агрессия в языке / В. Ю. Апресян //
Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф.
«Диалог 2003». – М. : Наука, 2003. – С. 32-35.
2.Бахтин, М. М. Франсуа Рабле и народная культура средневековья и
Ренессанса / М. М. Бахтин. – М. : Художественная литература, 1990. – 544 с.
3.Воробьев, Н. В., Пучков Е. В. Классификация текстов с помощью
сверточных нейронных сетей [Электронный ресурс] / Н.В. Воробьев, Е.В. Пучков
// Молодой исследователь Дона. – Ростов-на-Дону., 2017. – №6. Режим доступа :
https://mid-journal.ru/upload/iblock/8ed/1.-vorobev_-puchkov.pdf (дата обращения :
1.04.2021).
4.Воронцова, Т. А. Речевая агрессия : автореф. дис. … д-ра филол. наук /
Т. А. Воронцова. – Челябинск, 2006. – 43 с.
5.Гловинская, М.Я. Гипербола как проявление речевой агрессии //
Сокровенные смыслы: сб. статей в честь Н. Д. Арутюновой. – М., 2004. – С. 69-76.
6.Горелов, И. Н. Основы психолингвистики / И. Н. Горелов, К. Ф. Седов.
– М., 2001. – 149 с.
7.Енина, Л. В. Катартический характер речевой агрессии в сверхтексте
лозунгов и источники ее смягчения / Л. В. Енина // Вопросы стилистики:
Антропоцентрические исследования. – Саратов, 1999. – Вып.28. – С. 103-107.
8.Енина, Л. В. Речевая агрессия и речевая толерантность в средствах
массовой информации / Л. В. Енина // Российская пресса в поликультурном
обществе: толерантность и мультикультурализм как ориентиры профессионального
поведения. – М., 2002. – С. 104-110.
9.Жельвис, В. И. Поле брани. Сквернословие как социальная проблема в
языках и культурах мира / В. И. Желвис. – М. : Ладомир, 1997. – 330 с.
10.Закоян, Л. М. Речевая агрессия как предмет лингвистических
научныхисследований / Л. М. Закоян // Полилингвиальность и транскультурные
практики. – 2008. – №2. – C. 46-52.
11.Карпенко, Л. А. Психология. Словарь / Под общ. ред. А. В.
Петровского, М. Г. Ярошевского. – М.: Политиздат, 1990. – 494 с.
12.Киберугрозы, киберагрессия, кибербуллинг: различия в восприятии,
оценке и поведении у разных групп населения Российской Федерации
[Электронный ресурс] – Режим доступа : https://raec.ru/activity/analytics/9880/ (дата
обращения : 4. 05. 2020 г.).
13.Коданева,С.И.Кибрбуллинг:причиныявленияиметоды
предупреждения / С. И. Коданева // Социальные новации и социальные науки. – М.:
ИНИОН РАН, 2020. – №1. – С. 149-159.
14.Курьянова, И. В. Маркеры речевой агрессии в интернет-коммуникации
при исследовании текстов экстремистской направленности / И. В. Курьянова //
Вестник МГЛУ. Гуманитарные науки. – М., 2018. – С. 29-38.
15.Кусов, Г. В. Оскорбление как иллокутивный лингвокультурный
концепт: Автореф. дис… канд. филол. Наук / Г. В. Кусов. – Волгоград, 2004. – 27 с.
16.Ле Мань Ха. Свёрточная нейронная сеть для решения задачи
классификации / Ле Мань Ха // Труды МФТИ. – М., 2016. – Том 8. – № 3. – С. 91-
97.
17.Михальская, А. К. Русский Сократ: Лекции по сравнительно-
исторической риторике. − М.: Изд. центр. «Academia», 1996. – 192 с.
18.Николаева, Т. М. О принципе «некооперации» и/или о категории
социолингвистического воздействия / Т. М. Николаева // Логический анализ языка:
Противоречивость и аномальность текста. – М., 1990. – 167 с.
19.Седов, К. Ф. Агрессия как вид речевого воздействия / К. В. Седов //
Прямая и непрямая коммуникация. – Саратов: «Колледж», 2003. – С. 110-113.
20.Солдатова, Г. У. Кибербуллинг : особенности, ролевая структура,
детско-родительские отношения и стратегии совладания / Г. У. Солдатова, А. Н.
Ярмина // Национальный психологический журнал. – М., 2019. – № 3. – С. 17–31.
21.Стернин, И. А. Введение в речевое воздействие / И. А. Стернин. –
Воронеж, 2001. – 227 с.
22.Стилистический энциклопедический словарь русского языка / под ред.
М. Н. Кожиной. – М., 2006. – 696 с.
23.Тиллабаева, А. А. Речевое поведение интернет-пользователей в
ситуации конфронтационного общения / А. А. Тиллабаева, В. А. Шульгинов //
Слово.ру: балтийский акцент. – Калининград. – 2020. – Т. 11. – №4. – С. 45-57.
24.Черенков, Д. А. Девиантное поведение в социальных сетях: причины,
формы, следствие [Электронный ресурс] / Д. А. Черенков // Nauka-rastudent. Ru. –
2015. – № 07. Режим доступа : https://readera.org/14330143 (дата обращения :
3.05.2021).
25.Шаров, А. А. Специфика девиантной активности молодежи в интернет-
среде / А. А. Шаров // Учен. записки. Электронный научный журнал Курского
государственного университета. – 2019. – № 3. – С. 255–261.
26.Щербинина, Ю. В. Русский язык: Речевая агрессия и пути ее
преодоления. – М., 2012. – 224 с.
27.Ярец, А. Д. Разновидности конфликтов и агрессии в интернет-
коммуникации [Электронный ресурс] / А. Д. Ярец // Идеи. Поиски. Решения:
сборник статей и тезисов XIII Международной научно-практической конференции
преподавателей, аспирантов, магистрантов, студентов. – Минск: БГУ, 2020. –
С.201-214.Режимдоступа:http://elib.bsu.by/handle/123456789/241180(дата
обращения: 20.05.2021).
28.Bai, S., Kolter, J. Z., & Koltun, V. An Empirical Evaluation of Generic
Convolutional and Recurrent Networks for Sequence Modeling. Режим доступа :
https://arxiv.org/abs/1803.01271 (дата обращения : 23.03.2021).
29.Bengio, Y. Learning deep architectures for AI // Foundations and Trends in
MachineLearning.Режимдоступа:
https://www.researchgate.net/publication/215991023_Learning_Deep_Architectures_fo
r_AI (дата обращения: 7.05.2021).
30.Calpbinici, Arslan. Virtual behaviors affecting adolescent mental health: The
usage of Internet and mobile phone and cyberbullying // Journal of Child and Adolescent
Psychiatric Nursing. – 2019. – Vol. 32. – N 3. – P. 139-148.
31.Christopher, D. Manning. Computational linguistics and deep learning.
Computational Linguistics. – 2016. – Vol. 41. – Issue 4. Режим доступа :
http://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00239#.WQH8MBhh2qA
(дата обращения : 4.04.2021).
32.Schoffstall, C., Cohen, R. Cyber-Aggression: The Relation between Online
Offenders and Offline Social Competence // Social Development. – 2011. – Vol. 20. –
Issue 3. – P. 586–604.
33.Willard, N. E. Cyberbullying and Cyberthreats : Responding to the
Challenge of Online Social Aggression, Threats, and Distress. Champaign, Illinois :
Research Press, 2007. – 320 р.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Катерина М. кандидат наук, доцент
    4.9 (522 отзыва)
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    Кандидат технических наук. Специализируюсь на выполнении работ по метрологии и стандартизации
    #Кандидатские #Магистерские
    836 Выполненных работ
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы
    Елена С. Таганрогский институт управления и экономики Таганрогский...
    4.4 (93 отзыва)
    Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на напис... Читать все
    Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на написании курсовых и дипломных работ, а также диссертационных исследований.
    #Кандидатские #Магистерские
    158 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Сергей Н.
    4.8 (40 отзывов)
    Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных с... Читать все
    Практический стаж работы в финансово - банковской сфере составил более 30 лет. За последние 13 лет, мной написано 7 диссертаций и более 450 дипломных работ и научных статей в области экономики.
    #Кандидатские #Магистерские
    56 Выполненных работ
    user1250010 Омский государственный университет, 2010, преподаватель,...
    4 (15 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    21 Выполненная работа
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Анна С. СФ ПГУ им. М.В. Ломоносова 2004, филологический, преподав...
    4.8 (9 отзывов)
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания... Читать все
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания и проверки (в качестве преподавателя) контрольных и курсовых работ.
    #Кандидатские #Магистерские
    16 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021год
    🏢 Санкт-Петербургский государственный университет