Автоматическое выявление агрессии в текстах сетевых сообществ

Бархатова Валерия Андреевна
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В настоящей работе рассматривается речевая агрессия как лингвистический феномен, описывается наиболее полная ее классификация, а также поднимается проблема киберагресии в интернет-сообществах. В работе также определены основные способы выражения речевой агрессии и лингвистические маркеры. В практической части показано поэтапное описание создания классификатора для выявления речевой агрессии в текстах речевых сообществ и формирование датасета для его обучения.

Введение…………………………………………………………………………………………………………… 3

Глава I. Агрессия в интернете и ее лингвистические особенности ………………… 6
1. Речевая агрессия в лингвистике ………………………………………………………………. 6
1.1. Понятие речевой агрессии в лингвистике………………………………………………….. 6
1.2. Виды речевой агрессии …………………………………………………………………………… 10
2. Лингвистические средства выражения агрессии в русском языке ……….. 16
2.1. Эксплицитный способ выражения агрессии…………………………………………….. 17
2.2. Имплицитный способ выражения агрессии …………………………………………….. 19
3. Статус оскорблений и проблема киберагрессии …………………………………….. 23
4. Выводы к главе I …………………………………………………………………………………….. 30

Глава II. Использование сверточной нейронной сети для выявления агрессии
……………………………………………………………………………………………………………………….. 32
1. Сверточные нейронные сети…………………………………………………………………… 32
2. Источники текстовых данных ………………………………………………………………… 37
3. Сбор текстовых данных ………………………………………………………………………….. 40
4. Предварительная обработка и преобразование текстовых данных ………. 42
5. Обучение классификатора ……………………………………………………………………… 44
6. Тестирование классификатора и оценка результатов ……………………………. 46
7. Выводы к главе II …………………………………………………………………………………… 51

Заключение ……………………………………………………………………………………………………. 53

Список используемой литературы ………………………………………………………………… 55

В современном обществе во многих сферах социальной жизни наблюдаются
сложности в коммуникативном поведении людей, в результате которых речевое
общение носит грубый и недоброжелательный характер. Можно заметить, что
«высокая степень категоричности авторов публикаций в современной прессе
создает впечатление о недопустимом уровне агрессивности речевой коммуникации
в современном русском обществе…»1, поэтому изучение речевой агрессии
вызывает в последнее время немалый теоретический и практический интерес:
появляется все больше научных работ, освещающих данную проблему. Решение
вопросов, связанных с речевой агрессией, в частности, ее устранением во многом
связывают с пропагандой толерантности в речевой коммуникации.
В последнее время речевая агрессия перешла из реального общения в
виртуальное. Столкнуться с агрессией в интернете сегодня можно намного чаще,
чем в офлайн-жизни. Это связано с тем, что интернет умеет хранить, все то, что,
когда-то там было оставлено, а многочисленные научные работы, освещающие
проблему киберагрессии, утверждают, что проявлять агрессию в интернет-
сообществах намного проще, чем в реальной жизни из-за наличия анонимности в
интернете. Кроме того, киберагрессия несмотря на то, что появилась она совсем
недавно, способна наносить огромный вред психологическому здоровью той части
общества, которая является активными пользователями сети интернет, в частности,
социальными сетями.
Мы считаем, что существует способ для предотвращения распространения
речевой агрессии в социальных сетях путем создания автоматического
классификатора, обученного на данных, состоящих из агрессивных и
неагрессивных комментариев.
Карпенко Л. А. Психология. Словарь. М., 1990. 494 с.
Таким образом, основной целью нашего исследования является создание
автоматического классификатора для выявления агрессии в текстах сетевых
сообществ.
Поставленная цель потребовала решения следующих задач:
– изучение подходов к определению речевой агрессии;
– анализ существующих описаний речевой агрессии в работах других
исследователей̆;
– анализ полученных результатов с точки зрения цели и гипотез
исследования;
– представление классификации речевой агрессии;
– определение лингвистических средств выражения речевой агрессии;
– изучение проблемы киберагарессии, ее видов, причин и поводов;
– анализ исследований, посвященных сверточным нейронным сетям и
определение их эффективности для классификации текстовых данных;
– сбор текстовых данных для оформления датасета;
– предварительная обработка собранных текстовых данных;
– обучение классификатора с использованием сверточной нейронной
сети;
– тестирование классификатора и оценка полученных результатов
обучения.
В качестве объекта данного исследования выступает речевая агрессия в
русском языке в Интернете. Предметом исследования являются признаки
агрессии.
Основным материалом исследования послужил созданный датасет,

В данной работе представлена попытка автоматизировать выявление
агрессии в текстах сетевых сообществ.
В теоретической части работы были проанализированы лингвистические
особенности речевой агрессии и определена значимость проблемы киберагрессии.
Мы выяснили, что для полного изучения речевой агрессии, ее необходимо
рассматривать с точки зрения разных наук и их отраслей, так как это достаточно
сложное явление, затрагивающее различные сферы. Данная теоретическая
информация необходима для понимания объекта нашего изучения, его
особенностей и структуры. Без этой информации невозможно было бы достичь
цели нашего исследования.
В практической части мы подробно описали создание классификатора,
который определяет наличие речевой агрессии в текстах сетевых сообществ,
определили причины использования именно сверточных нейронных сетей и
конвейера spaCy. В результате нами был собран датасет, состоящий из
комментариев, и классификатор, которые успешно справляются со поставленной
задачей.
Цель данного исследования была достигнута, и мы видим несколько векторов
дальнейшего его развития. Прежде всего можно увеличить размер датасета, для
того чтобы улучшить эффективность классификатора. Чем больше примеров знает
классификатор, тем с большим количеством комментариев он может справляться.
На наш взгляд, нет предельного количества комментариев, которые должны быть
в датасете. Язык имеет тенденцию к изменениям, появлениям новых слов, особенно
это характерно для лексики интернет-пространства, поэтому необходимость в
пополнении нашего датасета будет всегда.
В дальнейшем разработанный классификатор также можно использовать и
для других исследований, связанных с классификацией текстовых данных, так как
мы выяснили, что сверточные нейронные сети лучше всего справляются именно с
этой задачей. Его структура позволяет использовать свою систему меток для
разметки собранного датасета и, например, может быть применена для
определения тональности текста (в частности, отзывов). Если для обучения модели
предоставить качественные текстовые данные, то результаты могут быть более
высокими. Кроме того, он подходит практически для всех языков, так как его
архитектура основана на конвейере библиотеки spaCy, в арсенале которой
представлены также конвейеры для других языков, в том числе мультиязычный.
Таким образом, в нашей работе мы подняли проблему киберагрессии,
отметили, что в реальных условиях есть необходимость искать способы борьбы с
ней и предложили свой вариант, в основе которого лежит классификатор,
обученный на реальных данных и способный определять содержание речевой
агрессии в тексте. Надеемся, что наше исследование может вызвать интерес к
затронутой теме, а разработанная нами программа позволит своевременно
выявлять агрессивные комментарии и, таким образом, будет способствовать
благоприятному общению в социальных сетях.

1.Апресян, В. Ю. Имплицитная агрессия в языке / В. Ю. Апресян //
Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф.
«Диалог 2003». – М. : Наука, 2003. – С. 32-35.
2.Бахтин, М. М. Франсуа Рабле и народная культура средневековья и
Ренессанса / М. М. Бахтин. – М. : Художественная литература, 1990. – 544 с.
3.Воробьев, Н. В., Пучков Е. В. Классификация текстов с помощью
сверточных нейронных сетей [Электронный ресурс] / Н.В. Воробьев, Е.В. Пучков
// Молодой исследователь Дона. – Ростов-на-Дону., 2017. – №6. Режим доступа :
https://mid-journal.ru/upload/iblock/8ed/1.-vorobev_-puchkov.pdf (дата обращения :
1.04.2021).
4.Воронцова, Т. А. Речевая агрессия : автореф. дис. … д-ра филол. наук /
Т. А. Воронцова. – Челябинск, 2006. – 43 с.
5.Гловинская, М.Я. Гипербола как проявление речевой агрессии //
Сокровенные смыслы: сб. статей в честь Н. Д. Арутюновой. – М., 2004. – С. 69-76.
6.Горелов, И. Н. Основы психолингвистики / И. Н. Горелов, К. Ф. Седов.
– М., 2001. – 149 с.
7.Енина, Л. В. Катартический характер речевой агрессии в сверхтексте
лозунгов и источники ее смягчения / Л. В. Енина // Вопросы стилистики:
Антропоцентрические исследования. – Саратов, 1999. – Вып.28. – С. 103-107.
8.Енина, Л. В. Речевая агрессия и речевая толерантность в средствах
массовой информации / Л. В. Енина // Российская пресса в поликультурном
обществе: толерантность и мультикультурализм как ориентиры профессионального
поведения. – М., 2002. – С. 104-110.
9.Жельвис, В. И. Поле брани. Сквернословие как социальная проблема в
языках и культурах мира / В. И. Желвис. – М. : Ладомир, 1997. – 330 с.
10.Закоян, Л. М. Речевая агрессия как предмет лингвистических
научныхисследований / Л. М. Закоян // Полилингвиальность и транскультурные
практики. – 2008. – №2. – C. 46-52.
11.Карпенко, Л. А. Психология. Словарь / Под общ. ред. А. В.
Петровского, М. Г. Ярошевского. – М.: Политиздат, 1990. – 494 с.
12.Киберугрозы, киберагрессия, кибербуллинг: различия в восприятии,
оценке и поведении у разных групп населения Российской Федерации
[Электронный ресурс] – Режим доступа : https://raec.ru/activity/analytics/9880/ (дата
обращения : 4. 05. 2020 г.).
13.Коданева,С.И.Кибрбуллинг:причиныявленияиметоды
предупреждения / С. И. Коданева // Социальные новации и социальные науки. – М.:
ИНИОН РАН, 2020. – №1. – С. 149-159.
14.Курьянова, И. В. Маркеры речевой агрессии в интернет-коммуникации
при исследовании текстов экстремистской направленности / И. В. Курьянова //
Вестник МГЛУ. Гуманитарные науки. – М., 2018. – С. 29-38.
15.Кусов, Г. В. Оскорбление как иллокутивный лингвокультурный
концепт: Автореф. дис… канд. филол. Наук / Г. В. Кусов. – Волгоград, 2004. – 27 с.
16.Ле Мань Ха. Свёрточная нейронная сеть для решения задачи
классификации / Ле Мань Ха // Труды МФТИ. – М., 2016. – Том 8. – № 3. – С. 91-
97.
17.Михальская, А. К. Русский Сократ: Лекции по сравнительно-
исторической риторике. − М.: Изд. центр. «Academia», 1996. – 192 с.
18.Николаева, Т. М. О принципе «некооперации» и/или о категории
социолингвистического воздействия / Т. М. Николаева // Логический анализ языка:
Противоречивость и аномальность текста. – М., 1990. – 167 с.
19.Седов, К. Ф. Агрессия как вид речевого воздействия / К. В. Седов //
Прямая и непрямая коммуникация. – Саратов: «Колледж», 2003. – С. 110-113.
20.Солдатова, Г. У. Кибербуллинг : особенности, ролевая структура,
детско-родительские отношения и стратегии совладания / Г. У. Солдатова, А. Н.
Ярмина // Национальный психологический журнал. – М., 2019. – № 3. – С. 17–31.
21.Стернин, И. А. Введение в речевое воздействие / И. А. Стернин. –
Воронеж, 2001. – 227 с.
22.Стилистический энциклопедический словарь русского языка / под ред.
М. Н. Кожиной. – М., 2006. – 696 с.
23.Тиллабаева, А. А. Речевое поведение интернет-пользователей в
ситуации конфронтационного общения / А. А. Тиллабаева, В. А. Шульгинов //
Слово.ру: балтийский акцент. – Калининград. – 2020. – Т. 11. – №4. – С. 45-57.
24.Черенков, Д. А. Девиантное поведение в социальных сетях: причины,
формы, следствие [Электронный ресурс] / Д. А. Черенков // Nauka-rastudent. Ru. –
2015. – № 07. Режим доступа : https://readera.org/14330143 (дата обращения :
3.05.2021).
25.Шаров, А. А. Специфика девиантной активности молодежи в интернет-
среде / А. А. Шаров // Учен. записки. Электронный научный журнал Курского
государственного университета. – 2019. – № 3. – С. 255–261.
26.Щербинина, Ю. В. Русский язык: Речевая агрессия и пути ее
преодоления. – М., 2012. – 224 с.
27.Ярец, А. Д. Разновидности конфликтов и агрессии в интернет-
коммуникации [Электронный ресурс] / А. Д. Ярец // Идеи. Поиски. Решения:
сборник статей и тезисов XIII Международной научно-практической конференции
преподавателей, аспирантов, магистрантов, студентов. – Минск: БГУ, 2020. –
С.201-214.Режимдоступа:http://elib.bsu.by/handle/123456789/241180(дата
обращения: 20.05.2021).
28.Bai, S., Kolter, J. Z., & Koltun, V. An Empirical Evaluation of Generic
Convolutional and Recurrent Networks for Sequence Modeling. Режим доступа :
https://arxiv.org/abs/1803.01271 (дата обращения : 23.03.2021).
29.Bengio, Y. Learning deep architectures for AI // Foundations and Trends in
MachineLearning.Режимдоступа:
https://www.researchgate.net/publication/215991023_Learning_Deep_Architectures_fo
r_AI (дата обращения: 7.05.2021).
30.Calpbinici, Arslan. Virtual behaviors affecting adolescent mental health: The
usage of Internet and mobile phone and cyberbullying // Journal of Child and Adolescent
Psychiatric Nursing. – 2019. – Vol. 32. – N 3. – P. 139-148.
31.Christopher, D. Manning. Computational linguistics and deep learning.
Computational Linguistics. – 2016. – Vol. 41. – Issue 4. Режим доступа :
http://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00239#.WQH8MBhh2qA
(дата обращения : 4.04.2021).
32.Schoffstall, C., Cohen, R. Cyber-Aggression: The Relation between Online
Offenders and Offline Social Competence // Social Development. – 2011. – Vol. 20. –
Issue 3. – P. 586–604.
33.Willard, N. E. Cyberbullying and Cyberthreats : Responding to the
Challenge of Online Social Aggression, Threats, and Distress. Champaign, Illinois :
Research Press, 2007. – 320 р.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы
    Дарья С. Томский государственный университет 2010, Юридический, в...
    4.8 (13 отзывов)
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссерт... Читать все
    Практикую гражданское, семейное право. Преподаю указанные дисциплины в ВУЗе. Выполняла работы на заказ в течение двух лет. Обучалась в аспирантуре, подготовила диссертационное исследование, которое сейчас находится на рассмотрении в совете.
    #Кандидатские #Магистерские
    18 Выполненных работ
    Егор В. кандидат наук, доцент
    5 (428 отзывов)
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Ск... Читать все
    Здравствуйте. Занимаюсь выполнением работ более 14 лет. Очень большой опыт. Более 400 успешно защищенных дипломов и диссертаций. Берусь только со 100% уверенностью. Скорее всего Ваш заказ будет выполнен раньше срока.
    #Кандидатские #Магистерские
    694 Выполненных работы
    Андрей С. Тверской государственный университет 2011, математический...
    4.7 (82 отзыва)
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на... Читать все
    Учился на мат.факе ТвГУ. Любовь к математике там привили на столько, что я, похоже, никогда не перестану этим заниматься! Сейчас работаю в IT и пытаюсь найти время на продолжение диссертационной работы... Всегда готов помочь! ;)
    #Кандидатские #Магистерские
    164 Выполненных работы
    AleksandrAvdiev Южный федеральный университет, 2010, преподаватель, канд...
    4.1 (20 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    28 Выполненных работ
    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021год
    🏢 Санкт-Петербургский государственный университет