Автоматическое выявление агрессии в текстах сетевых сообществ

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Бархатова Валерия Андреевна
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В настоящей работе рассматривается речевая агрессия как лингвистический феномен, описывается наиболее полная ее классификация, а также поднимается проблема киберагресии в интернет-сообществах. В работе также определены основные способы выражения речевой агрессии и лингвистические маркеры. В практической части показано поэтапное описание создания классификатора для выявления речевой агрессии в текстах речевых сообществ и формирование датасета для его обучения.

Введение…………………………………………………………………………………………………………… 3

Глава I. Агрессия в интернете и ее лингвистические особенности ………………… 6
1. Речевая агрессия в лингвистике ………………………………………………………………. 6
1.1. Понятие речевой агрессии в лингвистике………………………………………………….. 6
1.2. Виды речевой агрессии …………………………………………………………………………… 10
2. Лингвистические средства выражения агрессии в русском языке ……….. 16
2.1. Эксплицитный способ выражения агрессии…………………………………………….. 17
2.2. Имплицитный способ выражения агрессии …………………………………………….. 19
3. Статус оскорблений и проблема киберагрессии …………………………………….. 23
4. Выводы к главе I …………………………………………………………………………………….. 30

Глава II. Использование сверточной нейронной сети для выявления агрессии
……………………………………………………………………………………………………………………….. 32
1. Сверточные нейронные сети…………………………………………………………………… 32
2. Источники текстовых данных ………………………………………………………………… 37
3. Сбор текстовых данных ………………………………………………………………………….. 40
4. Предварительная обработка и преобразование текстовых данных ………. 42
5. Обучение классификатора ……………………………………………………………………… 44
6. Тестирование классификатора и оценка результатов ……………………………. 46
7. Выводы к главе II …………………………………………………………………………………… 51

Заключение ……………………………………………………………………………………………………. 53

Список используемой литературы ………………………………………………………………… 55

В современном обществе во многих сферах социальной жизни наблюдаются
сложности в коммуникативном поведении людей, в результате которых речевое
общение носит грубый и недоброжелательный характер. Можно заметить, что
«высокая степень категоричности авторов публикаций в современной прессе
создает впечатление о недопустимом уровне агрессивности речевой коммуникации
в современном русском обществе…»1, поэтому изучение речевой агрессии
вызывает в последнее время немалый теоретический и практический интерес:
появляется все больше научных работ, освещающих данную проблему. Решение
вопросов, связанных с речевой агрессией, в частности, ее устранением во многом
связывают с пропагандой толерантности в речевой коммуникации.
В последнее время речевая агрессия перешла из реального общения в
виртуальное. Столкнуться с агрессией в интернете сегодня можно намного чаще,
чем в офлайн-жизни. Это связано с тем, что интернет умеет хранить, все то, что,
когда-то там было оставлено, а многочисленные научные работы, освещающие
проблему киберагрессии, утверждают, что проявлять агрессию в интернет-
сообществах намного проще, чем в реальной жизни из-за наличия анонимности в
интернете. Кроме того, киберагрессия несмотря на то, что появилась она совсем
недавно, способна наносить огромный вред психологическому здоровью той части
общества, которая является активными пользователями сети интернет, в частности,
социальными сетями.
Мы считаем, что существует способ для предотвращения распространения
речевой агрессии в социальных сетях путем создания автоматического
классификатора, обученного на данных, состоящих из агрессивных и
неагрессивных комментариев.
Карпенко Л. А. Психология. Словарь. М., 1990. 494 с.
Таким образом, основной целью нашего исследования является создание
автоматического классификатора для выявления агрессии в текстах сетевых
сообществ.
Поставленная цель потребовала решения следующих задач:
– изучение подходов к определению речевой агрессии;
– анализ существующих описаний речевой агрессии в работах других
исследователей̆;
– анализ полученных результатов с точки зрения цели и гипотез
исследования;
– представление классификации речевой агрессии;
– определение лингвистических средств выражения речевой агрессии;
– изучение проблемы киберагарессии, ее видов, причин и поводов;
– анализ исследований, посвященных сверточным нейронным сетям и
определение их эффективности для классификации текстовых данных;
– сбор текстовых данных для оформления датасета;
– предварительная обработка собранных текстовых данных;
– обучение классификатора с использованием сверточной нейронной
сети;
– тестирование классификатора и оценка полученных результатов
обучения.
В качестве объекта данного исследования выступает речевая агрессия в
русском языке в Интернете. Предметом исследования являются признаки
агрессии.
Основным материалом исследования послужил созданный датасет,

В данной работе представлена попытка автоматизировать выявление
агрессии в текстах сетевых сообществ.
В теоретической части работы были проанализированы лингвистические
особенности речевой агрессии и определена значимость проблемы киберагрессии.
Мы выяснили, что для полного изучения речевой агрессии, ее необходимо
рассматривать с точки зрения разных наук и их отраслей, так как это достаточно
сложное явление, затрагивающее различные сферы. Данная теоретическая
информация необходима для понимания объекта нашего изучения, его
особенностей и структуры. Без этой информации невозможно было бы достичь
цели нашего исследования.
В практической части мы подробно описали создание классификатора,
который определяет наличие речевой агрессии в текстах сетевых сообществ,
определили причины использования именно сверточных нейронных сетей и
конвейера spaCy. В результате нами был собран датасет, состоящий из
комментариев, и классификатор, которые успешно справляются со поставленной
задачей.
Цель данного исследования была достигнута, и мы видим несколько векторов
дальнейшего его развития. Прежде всего можно увеличить размер датасета, для
того чтобы улучшить эффективность классификатора. Чем больше примеров знает
классификатор, тем с большим количеством комментариев он может справляться.
На наш взгляд, нет предельного количества комментариев, которые должны быть
в датасете. Язык имеет тенденцию к изменениям, появлениям новых слов, особенно
это характерно для лексики интернет-пространства, поэтому необходимость в
пополнении нашего датасета будет всегда.
В дальнейшем разработанный классификатор также можно использовать и
для других исследований, связанных с классификацией текстовых данных, так как
мы выяснили, что сверточные нейронные сети лучше всего справляются именно с
этой задачей. Его структура позволяет использовать свою систему меток для
разметки собранного датасета и, например, может быть применена для
определения тональности текста (в частности, отзывов). Если для обучения модели
предоставить качественные текстовые данные, то результаты могут быть более
высокими. Кроме того, он подходит практически для всех языков, так как его
архитектура основана на конвейере библиотеки spaCy, в арсенале которой
представлены также конвейеры для других языков, в том числе мультиязычный.
Таким образом, в нашей работе мы подняли проблему киберагрессии,
отметили, что в реальных условиях есть необходимость искать способы борьбы с
ней и предложили свой вариант, в основе которого лежит классификатор,
обученный на реальных данных и способный определять содержание речевой
агрессии в тексте. Надеемся, что наше исследование может вызвать интерес к
затронутой теме, а разработанная нами программа позволит своевременно
выявлять агрессивные комментарии и, таким образом, будет способствовать
благоприятному общению в социальных сетях.

1.Апресян, В. Ю. Имплицитная агрессия в языке / В. Ю. Апресян //
Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф.
«Диалог 2003». – М. : Наука, 2003. – С. 32-35.
2.Бахтин, М. М. Франсуа Рабле и народная культура средневековья и
Ренессанса / М. М. Бахтин. – М. : Художественная литература, 1990. – 544 с.
3.Воробьев, Н. В., Пучков Е. В. Классификация текстов с помощью
сверточных нейронных сетей [Электронный ресурс] / Н.В. Воробьев, Е.В. Пучков
// Молодой исследователь Дона. – Ростов-на-Дону., 2017. – №6. Режим доступа :
https://mid-journal.ru/upload/iblock/8ed/1.-vorobev_-puchkov.pdf (дата обращения :
1.04.2021).
4.Воронцова, Т. А. Речевая агрессия : автореф. дис. … д-ра филол. наук /
Т. А. Воронцова. – Челябинск, 2006. – 43 с.
5.Гловинская, М.Я. Гипербола как проявление речевой агрессии //
Сокровенные смыслы: сб. статей в честь Н. Д. Арутюновой. – М., 2004. – С. 69-76.
6.Горелов, И. Н. Основы психолингвистики / И. Н. Горелов, К. Ф. Седов.
– М., 2001. – 149 с.
7.Енина, Л. В. Катартический характер речевой агрессии в сверхтексте
лозунгов и источники ее смягчения / Л. В. Енина // Вопросы стилистики:
Антропоцентрические исследования. – Саратов, 1999. – Вып.28. – С. 103-107.
8.Енина, Л. В. Речевая агрессия и речевая толерантность в средствах
массовой информации / Л. В. Енина // Российская пресса в поликультурном
обществе: толерантность и мультикультурализм как ориентиры профессионального
поведения. – М., 2002. – С. 104-110.
9.Жельвис, В. И. Поле брани. Сквернословие как социальная проблема в
языках и культурах мира / В. И. Желвис. – М. : Ладомир, 1997. – 330 с.
10.Закоян, Л. М. Речевая агрессия как предмет лингвистических
научныхисследований / Л. М. Закоян // Полилингвиальность и транскультурные
практики. – 2008. – №2. – C. 46-52.
11.Карпенко, Л. А. Психология. Словарь / Под общ. ред. А. В.
Петровского, М. Г. Ярошевского. – М.: Политиздат, 1990. – 494 с.
12.Киберугрозы, киберагрессия, кибербуллинг: различия в восприятии,
оценке и поведении у разных групп населения Российской Федерации
[Электронный ресурс] – Режим доступа : https://raec.ru/activity/analytics/9880/ (дата
обращения : 4. 05. 2020 г.).
13.Коданева,С.И.Кибрбуллинг:причиныявленияиметоды
предупреждения / С. И. Коданева // Социальные новации и социальные науки. – М.:
ИНИОН РАН, 2020. – №1. – С. 149-159.
14.Курьянова, И. В. Маркеры речевой агрессии в интернет-коммуникации
при исследовании текстов экстремистской направленности / И. В. Курьянова //
Вестник МГЛУ. Гуманитарные науки. – М., 2018. – С. 29-38.
15.Кусов, Г. В. Оскорбление как иллокутивный лингвокультурный
концепт: Автореф. дис… канд. филол. Наук / Г. В. Кусов. – Волгоград, 2004. – 27 с.
16.Ле Мань Ха. Свёрточная нейронная сеть для решения задачи
классификации / Ле Мань Ха // Труды МФТИ. – М., 2016. – Том 8. – № 3. – С. 91-
97.
17.Михальская, А. К. Русский Сократ: Лекции по сравнительно-
исторической риторике. − М.: Изд. центр. «Academia», 1996. – 192 с.
18.Николаева, Т. М. О принципе «некооперации» и/или о категории
социолингвистического воздействия / Т. М. Николаева // Логический анализ языка:
Противоречивость и аномальность текста. – М., 1990. – 167 с.
19.Седов, К. Ф. Агрессия как вид речевого воздействия / К. В. Седов //
Прямая и непрямая коммуникация. – Саратов: «Колледж», 2003. – С. 110-113.
20.Солдатова, Г. У. Кибербуллинг : особенности, ролевая структура,
детско-родительские отношения и стратегии совладания / Г. У. Солдатова, А. Н.
Ярмина // Национальный психологический журнал. – М., 2019. – № 3. – С. 17–31.
21.Стернин, И. А. Введение в речевое воздействие / И. А. Стернин. –
Воронеж, 2001. – 227 с.
22.Стилистический энциклопедический словарь русского языка / под ред.
М. Н. Кожиной. – М., 2006. – 696 с.
23.Тиллабаева, А. А. Речевое поведение интернет-пользователей в
ситуации конфронтационного общения / А. А. Тиллабаева, В. А. Шульгинов //
Слово.ру: балтийский акцент. – Калининград. – 2020. – Т. 11. – №4. – С. 45-57.
24.Черенков, Д. А. Девиантное поведение в социальных сетях: причины,
формы, следствие [Электронный ресурс] / Д. А. Черенков // Nauka-rastudent. Ru. –
2015. – № 07. Режим доступа : https://readera.org/14330143 (дата обращения :
3.05.2021).
25.Шаров, А. А. Специфика девиантной активности молодежи в интернет-
среде / А. А. Шаров // Учен. записки. Электронный научный журнал Курского
государственного университета. – 2019. – № 3. – С. 255–261.
26.Щербинина, Ю. В. Русский язык: Речевая агрессия и пути ее
преодоления. – М., 2012. – 224 с.
27.Ярец, А. Д. Разновидности конфликтов и агрессии в интернет-
коммуникации [Электронный ресурс] / А. Д. Ярец // Идеи. Поиски. Решения:
сборник статей и тезисов XIII Международной научно-практической конференции
преподавателей, аспирантов, магистрантов, студентов. – Минск: БГУ, 2020. –
С.201-214.Режимдоступа:http://elib.bsu.by/handle/123456789/241180(дата
обращения: 20.05.2021).
28.Bai, S., Kolter, J. Z., & Koltun, V. An Empirical Evaluation of Generic
Convolutional and Recurrent Networks for Sequence Modeling. Режим доступа :
https://arxiv.org/abs/1803.01271 (дата обращения : 23.03.2021).
29.Bengio, Y. Learning deep architectures for AI // Foundations and Trends in
MachineLearning.Режимдоступа:
https://www.researchgate.net/publication/215991023_Learning_Deep_Architectures_fo
r_AI (дата обращения: 7.05.2021).
30.Calpbinici, Arslan. Virtual behaviors affecting adolescent mental health: The
usage of Internet and mobile phone and cyberbullying // Journal of Child and Adolescent
Psychiatric Nursing. – 2019. – Vol. 32. – N 3. – P. 139-148.
31.Christopher, D. Manning. Computational linguistics and deep learning.
Computational Linguistics. – 2016. – Vol. 41. – Issue 4. Режим доступа :
http://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00239#.WQH8MBhh2qA
(дата обращения : 4.04.2021).
32.Schoffstall, C., Cohen, R. Cyber-Aggression: The Relation between Online
Offenders and Offline Social Competence // Social Development. – 2011. – Vol. 20. –
Issue 3. – P. 586–604.
33.Willard, N. E. Cyberbullying and Cyberthreats : Responding to the
Challenge of Online Social Aggression, Threats, and Distress. Champaign, Illinois :
Research Press, 2007. – 320 р.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Автоматическое выявление агрессии в текстах сетевых сообществ»

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Глеб С. преподаватель, кандидат наук, доцент
    5 (158 отзывов)
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной с... Читать все
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной специальности 12.00.14 административное право, административный процесс.
    #Кандидатские #Магистерские
    216 Выполненных работ
    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Татьяна П.
    4.2 (6 отзывов)
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки ... Читать все
    Помогаю студентам с решением задач по ТОЭ и физике на протяжении 9 лет. Пишу диссертацию на соискание степени кандидата технических наук, имею опыт годовой стажировки в одном из крупнейших университетов Германии.
    #Кандидатские #Магистерские
    9 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Способы достижения эквивалентности при переводе конвенций ООН
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет