Автоматическое выявление агрессии в текстах сетевых сообществ

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Бархатова Валерия Андреевна
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В настоящей работе рассматривается речевая агрессия как лингвистический феномен, описывается наиболее полная ее классификация, а также поднимается проблема киберагресии в интернет-сообществах. В работе также определены основные способы выражения речевой агрессии и лингвистические маркеры. В практической части показано поэтапное описание создания классификатора для выявления речевой агрессии в текстах речевых сообществ и формирование датасета для его обучения.

Введение…………………………………………………………………………………………………………… 3

Глава I. Агрессия в интернете и ее лингвистические особенности ………………… 6
1. Речевая агрессия в лингвистике ………………………………………………………………. 6
1.1. Понятие речевой агрессии в лингвистике………………………………………………….. 6
1.2. Виды речевой агрессии …………………………………………………………………………… 10
2. Лингвистические средства выражения агрессии в русском языке ……….. 16
2.1. Эксплицитный способ выражения агрессии…………………………………………….. 17
2.2. Имплицитный способ выражения агрессии …………………………………………….. 19
3. Статус оскорблений и проблема киберагрессии …………………………………….. 23
4. Выводы к главе I …………………………………………………………………………………….. 30

Глава II. Использование сверточной нейронной сети для выявления агрессии
……………………………………………………………………………………………………………………….. 32
1. Сверточные нейронные сети…………………………………………………………………… 32
2. Источники текстовых данных ………………………………………………………………… 37
3. Сбор текстовых данных ………………………………………………………………………….. 40
4. Предварительная обработка и преобразование текстовых данных ………. 42
5. Обучение классификатора ……………………………………………………………………… 44
6. Тестирование классификатора и оценка результатов ……………………………. 46
7. Выводы к главе II …………………………………………………………………………………… 51

Заключение ……………………………………………………………………………………………………. 53

Список используемой литературы ………………………………………………………………… 55

В современном обществе во многих сферах социальной жизни наблюдаются
сложности в коммуникативном поведении людей, в результате которых речевое
общение носит грубый и недоброжелательный характер. Можно заметить, что
«высокая степень категоричности авторов публикаций в современной прессе
создает впечатление о недопустимом уровне агрессивности речевой коммуникации
в современном русском обществе…»1, поэтому изучение речевой агрессии
вызывает в последнее время немалый теоретический и практический интерес:
появляется все больше научных работ, освещающих данную проблему. Решение
вопросов, связанных с речевой агрессией, в частности, ее устранением во многом
связывают с пропагандой толерантности в речевой коммуникации.
В последнее время речевая агрессия перешла из реального общения в
виртуальное. Столкнуться с агрессией в интернете сегодня можно намного чаще,
чем в офлайн-жизни. Это связано с тем, что интернет умеет хранить, все то, что,
когда-то там было оставлено, а многочисленные научные работы, освещающие
проблему киберагрессии, утверждают, что проявлять агрессию в интернет-
сообществах намного проще, чем в реальной жизни из-за наличия анонимности в
интернете. Кроме того, киберагрессия несмотря на то, что появилась она совсем
недавно, способна наносить огромный вред психологическому здоровью той части
общества, которая является активными пользователями сети интернет, в частности,
социальными сетями.
Мы считаем, что существует способ для предотвращения распространения
речевой агрессии в социальных сетях путем создания автоматического
классификатора, обученного на данных, состоящих из агрессивных и
неагрессивных комментариев.
Карпенко Л. А. Психология. Словарь. М., 1990. 494 с.
Таким образом, основной целью нашего исследования является создание
автоматического классификатора для выявления агрессии в текстах сетевых
сообществ.
Поставленная цель потребовала решения следующих задач:
– изучение подходов к определению речевой агрессии;
– анализ существующих описаний речевой агрессии в работах других
исследователей̆;
– анализ полученных результатов с точки зрения цели и гипотез
исследования;
– представление классификации речевой агрессии;
– определение лингвистических средств выражения речевой агрессии;
– изучение проблемы киберагарессии, ее видов, причин и поводов;
– анализ исследований, посвященных сверточным нейронным сетям и
определение их эффективности для классификации текстовых данных;
– сбор текстовых данных для оформления датасета;
– предварительная обработка собранных текстовых данных;
– обучение классификатора с использованием сверточной нейронной
сети;
– тестирование классификатора и оценка полученных результатов
обучения.
В качестве объекта данного исследования выступает речевая агрессия в
русском языке в Интернете. Предметом исследования являются признаки
агрессии.
Основным материалом исследования послужил созданный датасет,

В данной работе представлена попытка автоматизировать выявление
агрессии в текстах сетевых сообществ.
В теоретической части работы были проанализированы лингвистические
особенности речевой агрессии и определена значимость проблемы киберагрессии.
Мы выяснили, что для полного изучения речевой агрессии, ее необходимо
рассматривать с точки зрения разных наук и их отраслей, так как это достаточно
сложное явление, затрагивающее различные сферы. Данная теоретическая
информация необходима для понимания объекта нашего изучения, его
особенностей и структуры. Без этой информации невозможно было бы достичь
цели нашего исследования.
В практической части мы подробно описали создание классификатора,
который определяет наличие речевой агрессии в текстах сетевых сообществ,
определили причины использования именно сверточных нейронных сетей и
конвейера spaCy. В результате нами был собран датасет, состоящий из
комментариев, и классификатор, которые успешно справляются со поставленной
задачей.
Цель данного исследования была достигнута, и мы видим несколько векторов
дальнейшего его развития. Прежде всего можно увеличить размер датасета, для
того чтобы улучшить эффективность классификатора. Чем больше примеров знает
классификатор, тем с большим количеством комментариев он может справляться.
На наш взгляд, нет предельного количества комментариев, которые должны быть
в датасете. Язык имеет тенденцию к изменениям, появлениям новых слов, особенно
это характерно для лексики интернет-пространства, поэтому необходимость в
пополнении нашего датасета будет всегда.
В дальнейшем разработанный классификатор также можно использовать и
для других исследований, связанных с классификацией текстовых данных, так как
мы выяснили, что сверточные нейронные сети лучше всего справляются именно с
этой задачей. Его структура позволяет использовать свою систему меток для
разметки собранного датасета и, например, может быть применена для
определения тональности текста (в частности, отзывов). Если для обучения модели
предоставить качественные текстовые данные, то результаты могут быть более
высокими. Кроме того, он подходит практически для всех языков, так как его
архитектура основана на конвейере библиотеки spaCy, в арсенале которой
представлены также конвейеры для других языков, в том числе мультиязычный.
Таким образом, в нашей работе мы подняли проблему киберагрессии,
отметили, что в реальных условиях есть необходимость искать способы борьбы с
ней и предложили свой вариант, в основе которого лежит классификатор,
обученный на реальных данных и способный определять содержание речевой
агрессии в тексте. Надеемся, что наше исследование может вызвать интерес к
затронутой теме, а разработанная нами программа позволит своевременно
выявлять агрессивные комментарии и, таким образом, будет способствовать
благоприятному общению в социальных сетях.

1.Апресян, В. Ю. Имплицитная агрессия в языке / В. Ю. Апресян //
Компьютерная лингвистика и интеллектуальные технологии: тр. Междунар. конф.
«Диалог 2003». – М. : Наука, 2003. – С. 32-35.
2.Бахтин, М. М. Франсуа Рабле и народная культура средневековья и
Ренессанса / М. М. Бахтин. – М. : Художественная литература, 1990. – 544 с.
3.Воробьев, Н. В., Пучков Е. В. Классификация текстов с помощью
сверточных нейронных сетей [Электронный ресурс] / Н.В. Воробьев, Е.В. Пучков
// Молодой исследователь Дона. – Ростов-на-Дону., 2017. – №6. Режим доступа :
https://mid-journal.ru/upload/iblock/8ed/1.-vorobev_-puchkov.pdf (дата обращения :
1.04.2021).
4.Воронцова, Т. А. Речевая агрессия : автореф. дис. … д-ра филол. наук /
Т. А. Воронцова. – Челябинск, 2006. – 43 с.
5.Гловинская, М.Я. Гипербола как проявление речевой агрессии //
Сокровенные смыслы: сб. статей в честь Н. Д. Арутюновой. – М., 2004. – С. 69-76.
6.Горелов, И. Н. Основы психолингвистики / И. Н. Горелов, К. Ф. Седов.
– М., 2001. – 149 с.
7.Енина, Л. В. Катартический характер речевой агрессии в сверхтексте
лозунгов и источники ее смягчения / Л. В. Енина // Вопросы стилистики:
Антропоцентрические исследования. – Саратов, 1999. – Вып.28. – С. 103-107.
8.Енина, Л. В. Речевая агрессия и речевая толерантность в средствах
массовой информации / Л. В. Енина // Российская пресса в поликультурном
обществе: толерантность и мультикультурализм как ориентиры профессионального
поведения. – М., 2002. – С. 104-110.
9.Жельвис, В. И. Поле брани. Сквернословие как социальная проблема в
языках и культурах мира / В. И. Желвис. – М. : Ладомир, 1997. – 330 с.
10.Закоян, Л. М. Речевая агрессия как предмет лингвистических
научныхисследований / Л. М. Закоян // Полилингвиальность и транскультурные
практики. – 2008. – №2. – C. 46-52.
11.Карпенко, Л. А. Психология. Словарь / Под общ. ред. А. В.
Петровского, М. Г. Ярошевского. – М.: Политиздат, 1990. – 494 с.
12.Киберугрозы, киберагрессия, кибербуллинг: различия в восприятии,
оценке и поведении у разных групп населения Российской Федерации
[Электронный ресурс] – Режим доступа : https://raec.ru/activity/analytics/9880/ (дата
обращения : 4. 05. 2020 г.).
13.Коданева,С.И.Кибрбуллинг:причиныявленияиметоды
предупреждения / С. И. Коданева // Социальные новации и социальные науки. – М.:
ИНИОН РАН, 2020. – №1. – С. 149-159.
14.Курьянова, И. В. Маркеры речевой агрессии в интернет-коммуникации
при исследовании текстов экстремистской направленности / И. В. Курьянова //
Вестник МГЛУ. Гуманитарные науки. – М., 2018. – С. 29-38.
15.Кусов, Г. В. Оскорбление как иллокутивный лингвокультурный
концепт: Автореф. дис… канд. филол. Наук / Г. В. Кусов. – Волгоград, 2004. – 27 с.
16.Ле Мань Ха. Свёрточная нейронная сеть для решения задачи
классификации / Ле Мань Ха // Труды МФТИ. – М., 2016. – Том 8. – № 3. – С. 91-
97.
17.Михальская, А. К. Русский Сократ: Лекции по сравнительно-
исторической риторике. − М.: Изд. центр. «Academia», 1996. – 192 с.
18.Николаева, Т. М. О принципе «некооперации» и/или о категории
социолингвистического воздействия / Т. М. Николаева // Логический анализ языка:
Противоречивость и аномальность текста. – М., 1990. – 167 с.
19.Седов, К. Ф. Агрессия как вид речевого воздействия / К. В. Седов //
Прямая и непрямая коммуникация. – Саратов: «Колледж», 2003. – С. 110-113.
20.Солдатова, Г. У. Кибербуллинг : особенности, ролевая структура,
детско-родительские отношения и стратегии совладания / Г. У. Солдатова, А. Н.
Ярмина // Национальный психологический журнал. – М., 2019. – № 3. – С. 17–31.
21.Стернин, И. А. Введение в речевое воздействие / И. А. Стернин. –
Воронеж, 2001. – 227 с.
22.Стилистический энциклопедический словарь русского языка / под ред.
М. Н. Кожиной. – М., 2006. – 696 с.
23.Тиллабаева, А. А. Речевое поведение интернет-пользователей в
ситуации конфронтационного общения / А. А. Тиллабаева, В. А. Шульгинов //
Слово.ру: балтийский акцент. – Калининград. – 2020. – Т. 11. – №4. – С. 45-57.
24.Черенков, Д. А. Девиантное поведение в социальных сетях: причины,
формы, следствие [Электронный ресурс] / Д. А. Черенков // Nauka-rastudent. Ru. –
2015. – № 07. Режим доступа : https://readera.org/14330143 (дата обращения :
3.05.2021).
25.Шаров, А. А. Специфика девиантной активности молодежи в интернет-
среде / А. А. Шаров // Учен. записки. Электронный научный журнал Курского
государственного университета. – 2019. – № 3. – С. 255–261.
26.Щербинина, Ю. В. Русский язык: Речевая агрессия и пути ее
преодоления. – М., 2012. – 224 с.
27.Ярец, А. Д. Разновидности конфликтов и агрессии в интернет-
коммуникации [Электронный ресурс] / А. Д. Ярец // Идеи. Поиски. Решения:
сборник статей и тезисов XIII Международной научно-практической конференции
преподавателей, аспирантов, магистрантов, студентов. – Минск: БГУ, 2020. –
С.201-214.Режимдоступа:http://elib.bsu.by/handle/123456789/241180(дата
обращения: 20.05.2021).
28.Bai, S., Kolter, J. Z., & Koltun, V. An Empirical Evaluation of Generic
Convolutional and Recurrent Networks for Sequence Modeling. Режим доступа :
https://arxiv.org/abs/1803.01271 (дата обращения : 23.03.2021).
29.Bengio, Y. Learning deep architectures for AI // Foundations and Trends in
MachineLearning.Режимдоступа:
https://www.researchgate.net/publication/215991023_Learning_Deep_Architectures_fo
r_AI (дата обращения: 7.05.2021).
30.Calpbinici, Arslan. Virtual behaviors affecting adolescent mental health: The
usage of Internet and mobile phone and cyberbullying // Journal of Child and Adolescent
Psychiatric Nursing. – 2019. – Vol. 32. – N 3. – P. 139-148.
31.Christopher, D. Manning. Computational linguistics and deep learning.
Computational Linguistics. – 2016. – Vol. 41. – Issue 4. Режим доступа :
http://www.mitpressjournals.org/doi/full/10.1162/COLI_a_00239#.WQH8MBhh2qA
(дата обращения : 4.04.2021).
32.Schoffstall, C., Cohen, R. Cyber-Aggression: The Relation between Online
Offenders and Offline Social Competence // Social Development. – 2011. – Vol. 20. –
Issue 3. – P. 586–604.
33.Willard, N. E. Cyberbullying and Cyberthreats : Responding to the
Challenge of Online Social Aggression, Threats, and Distress. Champaign, Illinois :
Research Press, 2007. – 320 р.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Автоматическое выявление агрессии в текстах сетевых сообществ»

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Анастасия Б.
    5 (145 отзывов)
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическо... Читать все
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическому и гуманитарному направлениях свыше 8 лет на различных площадках.
    #Кандидатские #Магистерские
    224 Выполненных работы
    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы
    Анна С. СФ ПГУ им. М.В. Ломоносова 2004, филологический, преподав...
    4.8 (9 отзывов)
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания... Читать все
    Преподаю англ язык более 10 лет, есть опыт работы в университете, школе и студии англ языка. Защитила кандидатскую диссертацию в 2009 году. Имею большой опыт написания и проверки (в качестве преподавателя) контрольных и курсовых работ.
    #Кандидатские #Магистерские
    16 Выполненных работ
    Дарья П. кандидат наук, доцент
    4.9 (20 отзывов)
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных... Читать все
    Профессиональный журналист, филолог со стажем более 10 лет. Имею профильную диссертацию по специализации "Радиовещание". Подробно и серьезно разрабатываю темы научных исследований, связанных с журналистикой, филологией и литературой
    #Кандидатские #Магистерские
    33 Выполненных работы
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Анна Н. Государственный университет управления 2021, Экономика и ...
    0 (13 отзывов)
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уни... Читать все
    Закончила ГУУ с отличием "Бухгалтерский учет, анализ и аудит". Выполнить разные работы: от рефератов до диссертаций. Также пишу доклады, делаю презентации, повышаю уникальности с нуля. Все работы оформляю в соответствии с ГОСТ.
    #Кандидатские #Магистерские
    0 Выполненных работ
    Глеб С. преподаватель, кандидат наук, доцент
    5 (158 отзывов)
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной с... Читать все
    Стаж педагогической деятельности в вузах Москвы 15 лет, автор свыше 140 публикаций (РИНЦ, ВАК). Большой опыт в подготовке дипломных проектов и диссертаций по научной специальности 12.00.14 административное право, административный процесс.
    #Кандидатские #Магистерские
    216 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Способы достижения эквивалентности при переводе конвенций ООН
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет