Автоматическое выявление скрытых сообществ в текстах русскоязычного корпуса социальных сетей

Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0
Мамаев Иван Дмитриевич
Бесплатно
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Актуальность работы обусловлена необходимостью сочетания методов лингвистического и количественного анализа данных для построения семантической сети пользователей на основе тематической близости их постов.
Объект исследования – скрытые сообщества, выявленные с помощью алгоритмов тематического моделирования среди пользователей русскоязычного сегмента социальной сети ВКонтакте. Предмет исследования – количественные и качественные параметры скрытых сообществ, которые позволяют судить об актуальном состоянии групп.

Цель исследования состоит в том, чтобы выявить скрытые связи между пользовательскими постами социальных сетей, основанные на общности лингвистических параметров текстов и их тематики. В перечень решаемых задач были включены такие задачи, как составление корпуса и его предобработка, построение автор-тематических моделей, разработка процедуры назначения меток тем и построение итогового графа скрытых сообществ.

Теоретической базой исследования послужили работы отечественных и зарубежных лингвистов, а именно работы В.И. Карасика, А.А. Матусевич, О.Н. Морозовой по исследованию лингвистических особенностей текстов в Интернете, работы В.Ф. Хорошевского, П.А. Мейлахса, К. Хе, С. Фортунато по выявлению скрытых сообществ, работа О.А. Митрофановой, А.В. Крюковой, А.С. Смоляровой, К. Мей по тематическому моделированию. Материалом исследования послужил корпус из 25768 русскоязычных постов 714 пользователей социальной сети ВКонтакте объёмом 8679402 токенов.

Работа состоит из четырёх глав, введения, заключения, списка использованной литературы, списка электронных ресурсов и одного приложения.

Основные положения, выносимые на защиту.
1. Алгоритмы кластерного анализа и графовые методы выделяют рассредоточенные скрытые сообщества, что объясняется неполноценным учётом семантики исследуемых текстовых коллекций.
2. Отличительной особенностью текстов постов является использование ненормативных правил написания, что приводит к трудностям при автоматической обработке текстов, поэтому алгоритмы токенизации и нормализации приходится постоянно дорабатывать.
3. Учёт тематической составляющей при выявлении скрытых сообществ позволяет включить пользователя в несколько скрытых сообществ.

Полученные результаты свидетельствуют о пригодности алгоритма для выявления скрытых сообществ, в заключении приводятся основные положения для последующих экспериментов.

Работа была апробирована на конференциях AINL 2020 и TEL 2020, основные результаты представлены в следующих статьях (Scopus).
1. Mamaev I. Automatic Detection of Hidden Communities in the Texts of Russian Social Network Corpus / I. Mamaev, O. Mitrofanova // Artificial Intelligence and Natural Language. AINL 2020. Communications in Computer and Information Science. — Vol. 1292. — Springer, Cham, 2020. — P. 17–33.
2. Mamaev I. Hidden Communities in the Russian Social Network Corpus: a Comparative Study of Detection Methods / I. Mamaev, O. Mitrofanova // Proceedings of the Computational Models in Language and Speech Workshop (CMLS 2020) co-located with 16th International Conference on Computational and Cognitive Linguistics (TEL 2020). — 2020. — P. 69–78.

В связи со стремительным ростом информационных технологий внимание исследователей социальных сетей приковано к текстам пользователей и выявлению связей между ними. Социальные сети – это зеркало общества, они позволяют оценить тенденции развития социума по формальным признакам. На основании общности этих тенденций выделяют пользовательские сегменты – скрытые сообщества. Для анализа используют графовые методы или кластерный анализ, однако эти методы чаще всего упускают из вида лингвистические признаки. Современные алгоритмы компьютерной лингвистики позволяют упростить задачу анализа дискурса, обработать и представить репрезентативные данные для больших текстовых коллекций, в том числе и для постов социальных сетей. Основываясь на тематической структуре текстов, можно выявить более устойчивые связи между пользователями.
Актуальность работы обусловлена необходимостью сочетания методов лингвистического и количественного анализа данных для построения семантической сети пользователей на основе тематической близости их постов.
Новизна исследования заключается в том, что в данной работе обсуждаются эксперименты по выявлению скрытых сообществ методами тематического моделирования и автоматического назначения меток тем, которые впервые выполнены на корпусе постов русскоязычных пользователей ВКонтакте.
Объект исследования – скрытые сообщества, выявленные с помощью алгоритмов тематического моделирования среди пользователей русскоязычного сегмента социальной сети ВКонтакте.
Предмет исследования – количественные и качественные параметры скрытых сообществ, которые позволяют судить об актуальном состоянии групп и их тематике.
Цель исследования состоит в том, чтобы выявить скрытые связи между пользовательскими постами социальных сетей, основанные на общности лингвистических параметров текстов и их тематики.
Для достижения данной цели требуется решить следующие задачи:
1) исследовать специфику интернет-дискурса и выявить специфические лингвистические параметры текстов социальных сетей;
2) подготовить лингвистические данные для проведения экспериментов: произвести сборку и предобработку исследовательского корпуса;
3) разработать процедуру выявления скрытых связей между текстами социальных сетей;
4) произвести планирование и проведение экспериментов:
построение автор-тематической модели ATM для определения тематической специализации авторов;
автоматическое назначение меток тем из внешних и внутренних источников;
соотнесение данных о тематике текстов авторов с формулировками их интересов и с принадлежностью их к тем или иным сообществам;
выявление скрытых групп авторов с точки зрения общности их интересов;
сравнение трёх методов выделения скрытых сообществ: графового, кластерного и смешанного.
5) оценить результаты экспериментов.
Материалом исследования послужил корпус объёмом 25768 русскоязычных постов 714 пользователей социальной сети ВКонтакте объёмом 8679402 токенов.
Гипотеза исследования формулируется следующим образом: алгоритмы тематического моделирования позволяют выявить семантическое сходство анализируемых текстов, поэтому они могут применяться для построения моделей скрытых сообществ.
В данной работе применяются методы корпусной лингвистики, дистрибутивной семантики, вероятностного тематического моделирования и лингвистические приёмы анализа интернет-дискурса. Также были использованы следующие инструменты:
библиотека gensim для построения дистрибутивной и тематической моделей корпуса;
библиотека pymorphy2 для морфологического анализа русскоязычных постов;
приложение Gephi для визуализации модели скрытых сообществ (на основе тематического моделирования и на основе графовых методов);
библиотеки scikit-learn и matplotlib для построения кластеров скрытых сообществ.
Теоретическая значимость исследования состоит в создании методики выявления скрытых сообществ на основе тематического сходства текстов корпуса.
Практическая значимость исследования заключается в том, что результаты исследования могут быть использованы для решения дальнейших задач не только в компьютерной лингвистике, но и в социологии: выявление онлайн-трендов, выявление потенциально опасных группировок и т.д.
Объём и структура диссертации. Работа состоит из четырёх глав, введения, заключения, списка использованной литературы, списка электронных ресурсов и двух приложений. В главах 1–3 отражены теоретические аспекты исследования. Глава 4 посвящена экспериментам с корпусом постов: сбор и обработка текстовых данных, построение тематической модели, автоматическое назначение меток тем, а также графическая реализация модели скрытых сообществ. В работе обсуждаются сложности, с которыми пришлось столкнуться при реализации экспериментов, а также делаются выводы по каждому этапу. В приложениях объёмом 10 стр. приведены примеры визуализированных тематических моделей и результаты экспертных оценок для автоматически извлечённых меток тем. Общий объём работы – 92 стр., основное содержание изложено на 82 стр. В тексте ВКР содержится 4 таблицы, 5 диаграмм и 16 рисунков. Список литературы включает 70 источников, из них – 30 на русском языке, 40 – на иностранных. Список электронных ресурсов состоит из 28 позиций.
Для ознакомления с корпусом пользовательских постов, скриптами программ по тематическому моделированию и автоматическому назначению меток тем, а также визуализированными результатами необходимо перейти в репозиторий GitHub.
Основные положения данной ВКР были представлены в следующих публикациях.
Mamaev I. Automatic Detection of Hidden Communities in the Texts of Russian Social Network Corpus / I. Mamaev, O. Mitrofanova // Artificial Intelligence and Natural Language. AINL 2020. Communications in Computer and Information Science. — Vol. 1292. — Springer, Cham, 2020. — P. 17–33.
Mamaev I. Hidden Communities in the Russian Social Network Corpus: a Comparative Study of Detection Methods / I. Mamaev, O. Mitrofanova // Proceedings of the Computational Models in Language and Speech Workshop (CMLS 2020) co-located with 16th International Conference on Computational and Cognitive Linguistics (TEL 2020). — 2020. — P. 69–78.

На сегодняшний день люди активно пользуются социальными сетями: они обсуждают бытовые или рабочие дела, играют или ищут различный контент. Наше знание о способах интернет-общения растёт быстро, мы начинаем замечать, что между всеми вещами в интернет-пространстве существует гораздо большая взаимосвязь, чем мы предполагали ранее. Такая же взаимосвязь существует и между пользователями. Обнаружение скрытых сообществ и присущих им особенностей помогает нам всесторонне понять окружающее нас общество и объяснить сложные социальные явления.
Многие исследователи при построении алгоритмов поиска скрытых сообществ часто используют графовые методы. Объединение тематического моделирования и автоматического назначения меток тем позволяет восполнить пробелы в теории выявления скрытых сообществ.
В данной выпускной квалификационной работе был предложен гибридный алгоритм обнаружения сообществ русскоязычной социальной сети, были описаны преимущества и недостатки, а также проведён сравнительный анализ с уже существующими методами. Результаты позволяют получить новую информацию о возможных социальных группировках в интернет-пространстве. Качественная оценка процедур показала, что, несмотря на трудности при работе с постами социальных сетей, они сопоставимы с методами, основанными на математических моделях. Гипотеза, выдвинутая в работе, подтвердилась.
Использование данных из социальных сетей позволяет решить ряд смежных задач: например, отслеживание тенденций среди пользователей и, как следствие, создание соответствующего контента. Дальнейшие исследования будут связаны:
с увеличением корпуса, включая посты других российских онлайн-платформ, что позволит обнаружить скрытые сообщества пользователей в различных социальных сетях;
с привлечением других алгоритмов тематического моделирования: например, динамическое тематическое моделирование позволит сформировать динамические структуры скрытых сообществ и оценить изменение интересов пользователей в разные временные периоды;
с улучшением алгоритма автоматического назначения меток тем и созданием «золотого стандарта» для оценки извлечённых кандидатов.

Бодулева А.Р. Лингвистические особенности СМС-сообщений английского языка / А.Р. Бодулева, А.З. Зарипова // Инновационная наука. — 2016. — №2 (5). — С. 76–78.
Вебер К.С. Сравнительный анализ социальных сетей / К.С. Вебер, А.А. Пименова // Вестник Тамбовского университета. Серия «Естественные и технические науки». — 2014. — Т. 19. Вып. 2. — С. 634–636.
Воронцов К.В. Вероятностное тематическое моделирование. [Электронный ресурс] URL: (дата обращения: 21.01.2021).
Глушков Н.А. Анализ методов тематического моделирования текстов на естественном языке / Н.А. Глушков // Молодой учёный. — 2018. — №19. — С. 101–103.
Ерофеева А.Р. Автоматическое назначение меток тем в тематических моделях русскоязычных корпусов текстов / А.Р. Ерофеева, О.А. Митрофанова // Структурная и прикладная лингвистика: межвузовский сборник. Выпуск 12. К 60-летию отделения прикладной, компьютерной и математической лингвистики СПбГУ. — 2019. — №12. — С. 122–147.
Иноземцева Н.В. Парцелляция как основная синтаксическая модель заголовков англоязычных статей по методической проблематике / Н.В. Иноземцева // Вестник Оренбургского государственного университета. — 2011. — №11 (130). — С. 114–118.
Ипатов Ю.А. Анализ динамических характеристик сложных графовых структур / Ю.А. Ипатов, И.В. Калагин, А.В. Кревецкий [и др.] // Известия высших учебных заведений. Приборостроение. — 2018. — №6 (2). — С. 511–516.
Калинина Л.В. Вербальная конкуренция в пространстве Интернета: реклама, рерайт, репост / Л.В. Калинина // Вестник Вятского государственного гуманитарного университета. — Киров, 2014. — №3. — С. 80–88.
Карасик В.И. О типах дискурса / В.И. Карасик // Языковая личность: институциональный и персональный дискурс: сб. науч. тр. — Волгоград, 2000. — С. 5–20.
Коломейченко А.А. Алгоритм выделения сообществ в социальных сетях / М.И. Коломейченко, А.А. Чеповский, А.М. Чеповский, // Фундаментальная и прикладная математика. — 2014. — №19:1. — С. 21–32.
Мамаев И.Д. Адаптация заимствованных слов к русской морфологии / И.Д. Мамаев, А.А. Зайцева // International Journal of Advanced Studies in Language and Communication. — 2019. — №2. — С. 106–113.
Матусевич А.А. Общение в социальных сетях: прагматический, коммуникативный, лингвостилистический аспекты характеристики: дис. … канд. филол. наук / А.А. Матусевич. — Киров, 2016. — 190 с.
Мейлахс П.А. Онлайновое сообщество СПИД-диссидентов в социальной сети «ВКонтакте»: структура и риторические стратегии / П.А. Мейлахс, Ю.Г. Рыков // XV апрельская международная научная конференция по проблемам развития экономики и общества: в 4-х книгах. Отв. ред.: Е. Г. Ясин. — Кн. 3. — М.: Издательский дом НИУ ВШЭ. — 2015. — С. 137-146.
Митрофанова О.А. Исследование структурной организации художественного произведения с помощью тематического моделирования: опыт работы с текстом романа «Мастер и Маргарита» М.А. Булгакова / О.А. Митрофанова // Труды международной конференции «Корпусная лингвистика–2019». — 2019. — С. 387–394.
Митрофанова О.А. Моделирование семантических связей в текстах социальных сетей с помощью алгоритма LDA (на материале русскоязычного сегмента Живого Журнала) / О.А. Митрофанова, А.С. Шиморина // Структурная и прикладная лингвистика: межвузовский сборник. — 2014. — №10. — С. 151–168.
Митрофанова О.А. Тематическое моделирование корпуса «Народных русских сказок А.Н. Афанасьева» / О.А. Митрофанова // Структурная и прикладная лингвистика. — 2015. — №11. — С. 146–154.
Митягин С.А. Исследование социальных сетей Интернет на предмет выявления сопутствующих интересов лиц, склонных к наркомании / С.А. Митягин, А.В. Якушев, А.В. Бухановский // Международный научно-исследовательский журнал. Технические науки. — 2012. — Вып. 6(6). — С. 59–64.
Морозова О.Н. Особенности Интернет-коммуникации: определение и свойства // О.Н. Морозова / Вестник ЛГУ им. А. С. Пушкина. Серия «Филология». — 2010. — №5. T.1. — С. 150–158.
Нашхоева М.Р. Взаимодействие пунктуационных знаков и эмотиконов в текстах форумов / М.Р. Нашхоева // Вестник Челябинского государственного педагогического университета. — 2011. — № 12. — С. 321–327.
Нокель М.А., Лукашевич Н.В. Тематические модели: добавление биграмм и учет сходства между униграммами и биграммами / М.А. Нокель, Н.В. Лукашевич // Вычислительные методы и программирование. — 2015. — №6 (2). — С. 215–234.
Орлова Н.В. Голосовые сообщения как источник сведений о коммуникативных нормах и ценностях / Н.В. Орлова // Экология языка и коммуникативная практика. — 2018. — №3 (14). — С. 57–66.
Рябцева Н.К. Интернет-коммуникация в лингвистическом и когнитивном аспекте / Н.К. Рябцева // Russian Linguistic Bulletin. — 2016. — №4 (8). — C. 70–73.
Смирнова Е.В. Гендерные различия в молодежном Интернет-дискурсе (на материале англоязычных Интернет-блогов и чатов) / Е.В. Смирнова // Лексикографическая копилка: сб. науч. ст. Вып. 8. — СПб.: Изд-во СПбГЭУ, 2019. — С. 73–79.
Смирнова О.С. Определение группы риска аккаунтов социальной сети «Вконтакте», попадающих под влияние квестовой игры суицидального характера / О.С. Смирнова // Современные информационные технологии и ИТ-образование. — 2017. — №13 (3). — С. 53–60.
Смородина А.А. Интернет-мемы как способ коммуникации человека в современном мире / А.А. Смородина // Международный журнал гуманитарных и естественных наук. — 2019. — №5 (3). — С. 78–82.
Хлопотов М.В. Исследование кластеров кинолюбителей и их тем в социальных сетях / М.В. Хлопотов, Н.В. Старцева, А.А. Макаренко // Вестник евразийской науки. — 2019. — №11 (2). — С. 1–11.
Холодковская Е.В. Особенности синтаксиса англоязычного интернет-комментария социальной сети Facebook / Е.В. Холодковская // Вестник Волгоградского государственного университета. Серия 2, Языкознание. — 2014. — №1 (20). — С. 79–83.
Хорошевский В.Ф. Семантические технологии в наукометрии: задачи, проблемы, решения и перспективы / В.Ф. Хорошевский, И.Е. Ефименко // Когнитивно-семиотические аспекты моделирования в гуманитарной сфере. Под редакцией В.Л. Стефанюка, Э.А. Тайсиной. — Академия наук РТ, Институт прикладной семиотики АН РТ. — Казань: Изд-во Академии наук РТ, 2017. — C. 222–266.
Щурина Ю.В. Интернет-мемы как феномен интернет-коммуникации / Ю.В. Щурина // Научный диалог. — 2011. — №3. — С. 160–172.
Ярцева В.Н. Лингвистический энциклопедический словарь / Гл. ред. В.Н. Ярцева. — М., 1990; DVD-версия. — М., 2008.
Acharya D. B. Community Detection Clustering via Gumbel Softmax / D.B. Acharya, H. Zhang // SN Computer Science. — 2020. — Vol. 1. — P. 1–11.
Aletras N. Representing topics using images / N. Aletras, M. Stevenson // Proceedings of the 2013 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language. — 2013. — P. 158–167.
Arefyev N.V. Word2Vec not dead: predicting hypernyms of co-hyponyms is better than reading definitions / N.V. Arefyev, M.V. Fedoseev, A.V. Kabanov [et al.] // Computational Linguistics and Intellectual Technologies. Papers from the Annual International Conference “Dialogue” (2020). — 2020. — Iss. 19. — P. 13–32.
Baumes J. Discovering Hidden Groups in Communication Networks / J. Baumes, M. Goldberg, M. Magdon-Ismail [et al.] // Intelligence and Security Informatics, Proceedings of the Second Symposium on Intelligence and Security Informatics, ISI 2004. — 2004. — P. 378-389.
Bhatia S. Automatic labelling of topics with neural embeddings / S. Bhatia, J.H. Lau, T. Baldwin // Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. — 2016. — P. 953–963.
Blei D. Latent Dirichlet Allocation / D. Blei, A. Ng, M. Jordan // Journal of Machine Learning Research. — 2003. — Vol. 3. — P. 993–1022.
Bodrunova S. S. Topic Modeling for Twitter Discussions: Model Selection and Quality Assessment / S.S. Bodrunova, I.S. Blekanov, M. Kukarkin // Proceedings of the 6TH SWS International Scientific Conferences on Social Sciences 2019. — 2019. — P. 207–214.
Buchanan, M. Nexus: small worlds and the groundbreaking science of networks. — W.W. Norton & Company, 2002. — 235 р.
Chobe S. Advancing community detection using Keyword Attribute Search. / S. Chobe, J. Zhan // Journal of Big Data. — 2019. — Vol. 6. — P. 1–33.
Crystal D. Language and the Internet. Cambridge: Cambridge University Press. — 2001. — 272 p.
Fortunato S. Community detection in networks: A user guide / S. Fortunato, D. Hric // Physics Reports. — 2016. — Vol. 659. — P. 1–44.
Gmati H. A new algorithm for communities detection in social networks with node attributes / H. Gmati, A. Mouakher, A. Gonzalez-Pardo [et al.] // Journal of Ambient Intelligence and Humanized Computing. — 2018. — P. 1–13.
He K. Hidden community detection in social networks / K. He, Y. Li, S. Soundarajan [et al.] // Information Sciences. — 2018. — Vol. 425. P. 92–106.
Herring S.C. Grammar and electronic communication. // The encyclopedia of applied linguistics. — 2012. — P. 2338–2346.
Jia Y. CommunityGAN: Community Detection with Generative Adversarial Nets / Y. Jia, Q. Zhang, W. Zhang [et al.] // Proceedings of the World Wide Web. — 2019. — P. 784–794.
Koltsova O. Redefining Media Agendas: Topic Problematization in Online Reader Comments / O. Koltsova, O. Nagornyy // Media and communications. — 2019. — Vol. 7, iss. 3. — P. 145–156.
Kriukova A. Explicit Semantic Analysis as a Means for Topic Labelling / A. Kriukova, A. Erofeeva, O. Mitrofanova [et al.] // Artificial Intelligence and Natural Language. AINL 2018. Communications in Computer and Information Science. — Springer, Cham, 2018. — Vol. 930. — P. 110–116.
Krzemień A. Detection of Jihadism in Social Networks Using Big Data Techniques Supported by Graphs and Fuzzy Clustering / A. Krzemień, C. Sánchez-Rebollo, C. Puente [et al.] // Advances in Complex Systems and Their Applications to Cybersecurity. — 2019. — Vol. 2019. — P. 1–13.
Lau J.H. Automatic labelling of topic models / J.H. Lau, K. Grieser, D. Newman [et al.] // Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies. — 2011. — P. 1536–1545.
Li Y.H. Classification of Text Documents / Y.H. Li, A.K. Jain // The Computer Journal. — 1998. — Vol. 41, №. 8. — P. 537–546.
Liu F. Deep learning for community detection: progress, challenges and opportunities / F. Liu, S. Xue, J. Wu [et al.] // Proceedings of the 29th International Joint Conference on Artificial Intelligence, IJCAI 2020. — 2020. — P. 4981–4987.
López-Rúa P. Teaching L2 vocabulary through SMS language: some didactic guidelines // ELIA. — 2007. — Vol. 7. — P. 165–188.
Magatti D. Automatic Labeling Of Topics / D. Magatti, S. Calegari, D. Ciucci [et al.] // Ninth International Conference on Intelligent Systems Design and Applications. — 2009. — P. 1227–1232.
Manika L. Author-Topic Modeling of DESIDOC Journal of Library and Information Technology (2008-2017), India [Электронный ресурс] / L. Manika, M. Margam // Library Philosophy and Practice (e-journal). — 2019. URL: (дата обращения: 10.12.2020).
Mehdi A.A knowledge-based topic modeling approach for automatic topic labeling / A.A. Mehdi, P. Seyedamin, K. Kochut [et al.] // International Journal of Advanced Computer Science and Applications. — 2017. —Vol. 8(9). — P. 335–349.
Mei Q. Automatic labeling of multinomial topic models. / Q. Mei, X. Shen, C. Zhai // Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining. — 2007. — P. 490–499.
Mirzagitova A. Automatic Assignment of Labels in Topic Modelling for Russian Corpora / A. Mirzagitova, O. Mitrofanova // Proceedings of 7th ExLing 2016. — 2016. — P. 115–118.
Mishra N. Clustering Social Networks. / N. Mishra, R. Schreiber, I. Stanton [et al.] // Algorithms and Models for the Web-Graph. WAW 2007. Lecture Notes in Computer Science. — Springer, Berlin, Heidelberg, 2007. — Vol. 4863. — P. 56–67.
Mitrofanova O. Topic Modelling of the Russian Corpus of Pikabu Posts: Author-Topic Distribution and Topic Labelling / O. Mitrofanova, V. Sampetova, I. Mamaev [et al.] // International conference «Internet and Modern Society» (IMS-2020) Proceedings, International Workshop «Computational Linguistics» (CompLing-2020). In press.
Panicheva P. Semantic feature aggregation for gender identification in Russian Facebook / P. Panicheva, A. Mirzagitova, Y. Ledovaya // Artificial Intelligence and Natural Language. AINL 2017. Communications in Computer and Information Science. — Springer, Cham, 2017. — Vol. 789. — P. 3–15.
Ramage D. Labeled LDA: A supervised topic model for credit attribution in multi-labeled corpora / D. Ramage, D. Hall, R. Nallapati [et al.] // Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. — 2009. — Vol. 1. — P. 248–256.
Reihanian A. Topic-oriented community detection of rating-based social networks / A. Reihanian, B. Minaei-Bidgoli, H. Alizadeh // Journal of King Saud University. Computer and Information Sciences. — 2016. — Vol. 28, iss. 3. — P. 303–310.
Rytsarev I.A. Clustering of social media content with the use of BigData technology / I.A. Rytsarev, A.V. Kupriyanov, D.V. Kirsh [et al.] // Journal of Physics: Conference Series. — 2018. — Vol. 1096. — P. 1–7.
Salz D. Hidden Community Detection in Online Forums / D. Salz, N. Benavides, J. Li // CS224W: Machine Learning with Graphs. — 2019. — P. 1–10.
Singh K. Clustering of people in social network based on textual similarity. / K. Singh, H. K. Shakya, B. Biswas // Perspectives in Science. — 2016. — Vol. 8. — P. 570–573.
Smoliarova A.S. Detecting pivotal points in social conflicts via topic modeling of twitter content / A.S. Smoliarova, S.S. Bodrunova, A.V. Yakunin [et al.] // Internet Science. INSCI 2018. Lecture Notes in Computer Science. — Springer, Cham, 2018. — Vol. 11551. — P. 61–71.
Squires L. Enregistering internet language // Language in Society. — 2010. — 457–492 pp.
Stevens K. Exploring Topic Coherence over Many Models and Many Topics / K. Stevens, P. Kegelmeyer, D. Andrzejewski [et al.] // Proceedings of the 2012 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. — 2012. — P. 952–961.
Tikhomirov M.M. Combined Approach to Hypernym Detection for Thesaurus Enrichment / M.M. Tikhomirov, N.V. Loukachevitch, E.A. Parkhomenko // Computational Linguistics and Intellectual Technologies. Papers from the Annual International Conference “Dialogue” (2020). — 2020. — Iss. 19. — P. 736–746.
Yadrintsev V.V. Distributional Models and Auxiliary Methods for Determining the Hypernyms of Words in Russian / V.V. Yadrintsev, A.A. Ryzhova, I.V. Sochenkov // Computational Linguistics and Intellectual Technologies. Papers from the Annual International Conference “Dialogue” (2020). — 2020. — Iss. 19. — P. 762–772.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Читать «Автоматическое выявление скрытых сообществ в текстах русскоязычного корпуса социальных сетей»

    Последние выполненные заказы

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Оксана М. Восточноукраинский национальный университет, студент 4 - ...
    4.9 (37 отзывов)
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политоло... Читать все
    Возможно выполнение работ по правоведению и политологии. Имею высшее образование менеджера ВЭД и правоведа, защитила кандидатскую и докторскую диссертации по политологии.
    #Кандидатские #Магистерские
    68 Выполненных работ
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Лидия К.
    4.5 (330 отзывов)
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все
    Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.
    #Кандидатские #Магистерские
    592 Выполненных работы
    Анастасия Л. аспирант
    5 (8 отзывов)
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибост... Читать все
    Работаю в сфере метрологического обеспечения. Защищаю кандидатскую диссертацию. Основной профиль: Метрология, стандартизация и сертификация. Оптико-электронное прибостроение, управление качеством
    #Кандидатские #Магистерские
    10 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    user1250010 Омский государственный университет, 2010, преподаватель,...
    4 (15 отзывов)
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.
    #Кандидатские #Магистерские
    21 Выполненная работа
    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    Кирилл Ч. ИНЖЭКОН 2010, экономика и управление на предприятии транс...
    4.9 (343 отзыва)
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все
    Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.
    #Кандидатские #Магистерские
    692 Выполненных работы

    Другие учебные работы по предмету

    Видовые различия в русской речи польских и чешских студентов
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Способы достижения эквивалентности при переводе конвенций ООН
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет
    Фразеологические единицы в политическом дискурсе
    📅 2021 год
    🏢 Санкт-Петербургский государственный университет