ВВЕДЕНИЕ
ГЛАВА 1. АКТУАЛЬНЫЕ ПРОБЛЕМЫ ОБРАБОТКИ
ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ТЕКСТОВ

1.1 Природа сложности задач автоматической обработки текста
1.2 Задача категоризации текстов
1.3 Анализ тональности текстов
1.4 Модели и ресурсы, применяемые в задачах
автоматической обработки текста

1.4.1 Векторные модели и Word Embeddings
1.4.2 Тезаурусы и лексиконы

1.5 Выводы

ГЛАВА 2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ И АЛГОРИТМ ПОСТРОЕНИЯ
МНОГОСЛОЙНОГО СЕМАНТИЧЕСКОГО ГРАФА

2.1 Общие требования к графовой семантической модели
2.2 Базовый семантический граф

2.2.1 Математическая модель семантического графа
2.2.2 Отношение синонимии
2.2.3 Отношение определения
2.2.4 Отношение ассоциации
2.2.5 Семантическая близость слов

2.3 Алгоритм извлечения данных из общелингвистических словарей

2.3.1 Словарь синонимов
2.3.2 Толковый словарь
2.3.3 Статистический анализ данных, извлеченных из словарей

2.4 Многослойный семантический граф на основе
структурированных текстов
2.4.1 Структура слоев

2.5 Многослойный семантический граф на основе
неструктурированных источников данных
2.6 Выводы

ГЛАВА 3. КАТЕГОРИЗАЦИЯ ТЕКСТОВ С ИСПОЛЬЗОВАНИЕМ
КОНДЕНСИРОВАННОГО СЕМАНТИЧЕСКОГО ГРАФА

3.1 Состав и структура обучающих данных
3.2 Алгоритм построения конденсированного семантического графа
на основе обучающей выборки

3.2.1 Фильтрация обучающих данных
3.2.2 Релаксация на базе домен-специфичного каркаса
3.2.3 Расчет центральностей и градиентов вершин
3.2.4 Выбор ключевых терминов домена
3.2.5 Оценка временной сложности построения
конденсированного графа

3.3 Метод категоризации текстов, основанный
на конденсированном графе

3.3.1 Построение семантических кластеров вокруг заданных терминов
3.3.2 Характеристическая функция принадлежности фразы кластеру
3.3.3 Алгоритм категоризации текстов
3.3.4 Результаты работы алгоритма категоризации

3.5 Выводы

ГЛАВА 4. ПРИМЕНЕНИЕ СЕМАНТИЧЕСКОГО ГРАФА В ЗАДАЧАХ
АНАЛИЗА ТОНАЛЬНОСТИ ТЕКСТОВ

4.1 Задача аспектно ориентированного анализа тональности
4.2 Модель системы анализа тональности коротких текстов

4.2.1 Подход к классификации
4.2.2. Статистический анализ обучающей выборки
4.2.3 Уровень поверхностного семантического анализа
4.2.4 Вычисление тональности короткого текста
на основе статистических данных
4.2.5 Семантический граф как источник неявной информации
о тональности

4.3. Алгоритм вычисления тональности текста

4.3.1. Общий вид весовой функции
4.3.2. Параметры семантического графа и вычисление неявной оценки
4.3.3. Обработка отрицаний на семантическом уровне анализа
4.3.4 Схема работы алгоритма

4.4. Результаты экспериментов по определению тональности

4.4.1. Лексический уровень
4.4.2. Семантический уровень

4.5 Аспектно-ориентированный анализ тональности
с использованием семантического графа
4.6 Выводы

ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЯ

Приложение А. Примеры работы алгоритмов
Приложение Б. Справка о внедрении
Приложение В. Свидетельства о государственной
регистрации программ для ЭВМ

Во введении обосновывается актуальность исследований;
раскрывается научная новизна; практическая значимость работы
и ее соответствие выбранной специальности; описывается состав
и структура диссертации.
В первой главе рассматриваются актуальные задачи обработки
естественных языков. Отдельно описываются проблемы категоризации
и аспектно-ориентированного анализа тональности. На примере данных
задач анализируются основные модели и подходы, применяемые для
их решения. Подробно рассматриваются преимущества и недостатки
векторных моделей и алгоритмов Word Embeddings, тезаурусов
и лексиконов. На основании анализа предметной области обосновывается
актуальность работы и формулируется ключевая задача диссертационного
исследования.
Вторая глава посвящена разработке семантической модели
русского языка в виде многослойного семантического графа, которая
может использоваться как в задачах АОАТ, так и в ряде других задач,
связанных с поиском и анализом текстовой информации. Предложенная
реализация модели русского языка обладает следующими свойствами:
• Независимость семантического контента от узкой предметной
области (доменная независимость).
• Простота и гибкость структуры графа.
• Возможность автоматического построения, дополнения
и расширения.
• Полнота и адекватность содержащихся знаний.
Предложена реализация базового семантического графа
на основании общелингвистических словарей русского языка (Толковый
словарь русского языка С.И.Ожегова и Н.Ю.Шведовой и Словарь русских
синонимов и слов с близкими значениями Н.Абрамова).
Рассмотрим ключевые понятия модели. Пусть A – алфавит
естественного языка. Множество ⊂ + — это конечное множество
понятий или лексикон модели. Элементы множества V – вершины
семантического графа. По общепринятой практике понятия — это как
отдельные слова, так и устоявшиеся фразеологические сочетания.
Множество не учитывает морфологическиеособенности
словообразования, т.е. слова представлены каноническими формами.
Рис. 1 демонстрирует частеречный состав лексикона, извлеченного
из выбранных словарей.
Дуги графа соответствуют нечетким отношениям синонимии,
определения, ассоциации. Каждая дуга имеет метку вида = { , , },
где 0 ≤ , , ≤ 1 и – отношение ассоциации, – отношение
синонимии, – отношение определения. Предложены алгоритмы
их автоматического извлечения из словарей.

Рис. 1 – Частеречный состав лексикона общелингвистических словарей
Приобработкеспециализированныхтекстоввозникает
необходимость отделять специфические знания от общих, в связи с чем
предлагается строить граф многослойным. В общем случае модель
семантического графа содержит ≥ 0 – количество слоев, при этом =
( , ) – семантический граф i-го слоя , 0 – граф базового уровня, а при
1 ≤ ≤ – слои расширения семантики. Вершины ⊂ графов всех
слоев помечены словами из V, дуги в множестве имеют метки типа
отношения множества L. Таким образом, модель в виде многослойного
семантического графа, предлагаемого в данной работе, описывается
следующим образом:
= ( , , , , 0 , 1 , … , ).
Для перехода от к +1 используются функции ( )
и ( ), так что +1 = ( ), где является суперпозицией функций
и . Функция предназначена для отсечения малозначимых
элементов в , а – для преобразования весов вершин в .
Введем понятие семантической близости слов x и y:
( , ) = (∏( −1 , )∈ ( −1 , )) , где = 1 , 2 , … =
– путь из x в y, ( −1 , ) – вес дуги ( −1 , ) в графе. Понятие
семантической окрестности ( , ) объекта x, в которой мера близости
между x и любой вершиной множества V не превышает некоторый
заданный порог , позволяет выделять группу семантически близких
объектов. Структура окрестности существенно зависит от весов
отношений в графе.
Реализованы алгоритмы извлечения понятий и отношений
из текстов различной природы. Проанализированы основные различия
между структурированными и неструктурированными текстами с точки
зрения извлекаемой семантики.
Втретьейглавепредложенареализацияалгоритма
категоризации текстов на базе конденсированного семантического
графа, который строится на основе наборов структурированных или
неструктурированных текстов, объединенных общей тематикой.
Первый вопрос, который должен быть решен при обработке
различных доменов – выбор такой методики, которая позволяет провести
обработку по сопоставимым статистическим характеристикам. Для
соблюдения этого требования на основе проведенного анализа
статистических характеристик различных текстовых наборов. При
тестировании предлагаемого алгоритма были использованы два набора
обучающих данных, соответствующие двум различным доменам –
«Фильмы»1 и «Рестораны»2.Численныехарактеристикинаборов
представлены на рис. 2.

Рис. 2 – Численные характеристики для оценки лексического
разнообразия текстовых наборов

Пусть l – общее число слов в тексте, m – число уникальных

канонических форм, тогда = – коэффициент постоянства корпуса
слов. Величина d характеризует, сколько слов в среднем приходится
на одну каноническую форму, и чем выше это значение, тем менее
лексически разнообразны тексты. С использованием величины
постоянства корпуса текстов на базе эмпирических законов Хипса
и Ципфа сформулированы такие критерии, которые связывают пороги
отсечения значимых n-грамм при = 1,2,3 … для различных доменов:
( )1 / ( )2 = n√ 1 / 2, где ( )1 / ( )2 – отношение порогов n-грамм
для выбранных доменов, 1 / 2 – отношение порогов отсечения униграмм,
определяемое статистикой выбранных доменов. Рис. 3 демонстрирует
вариант отсечения значимых униграмм для домена «Рестораны».
Алгоритм построения конденсированных семантических
графов реализован на основании статистических характеристик домен-
специфического набора текстов. Пусть 0 – семантический граф,
построенный на основе словарей. Для построения каркаса 1 домен-
КиноПоиск. Все фильмыпланеты https://www.kinopoisk.ru/
SemEval-2016 Task 5: Aspect Based Sentiment Analysis
специфических подграфов в процессе экспериментальной проверки
введенных соотношений используются два уровня модели: слова
и биграммы, отфильтрованные с использованием пороговых значений.
Пусть D – множество слов, удовлетворяющих выбранному порогу для
униграмм, а B – множество биграмм, удовлетворяющих критериям выбора
биграмм. Сложность алгоритма имеет порядок (| | ∗ (| | + | |), что
является достаточно хорошим показателем и позволяет с небольшими
затратами строить множество конденсированных графов на основе одних
статистических данных.

Рис. 3 – зависимость частотности униграмм от их рангов и порог
отсечения для домена «Рестораны»

Домен-специфический каркас строится по следующим правилам:
• Каждое слово ∈ порождает вершину графа 1 , которой
присваивается вес = , где – частота появления слова в
домене.
• Каждая биграмма ∈ формирует двунаправленную
контекстнуюассоциативнуюсвязьв 1 между
формирующими ее словами.
Полученный каркас 1 достраивается с использованием
семантического графа 0 на базе процесса релаксации, основанного на
алгоритме BFS (breadth-first search), модифицированном следующим
образом:
• В качестве начальной вершины берется очередное слово ∈ ,
которому присваивается текущий вес ω = √ .
• Поиск ведется параллельно по графам 1 и 0 , 1 в ходе
поиска динамически расширяется за счет включения домен-
независимых вершин и связей из 0 . Веса новых вершин u,
заимствуемых
из 0 , изначально равны нулю: = 0.
• При посещении еще не рассмотренной вершины ′ ей
передается релаксационный вес ω = ( , ′ ), где u – предок
вершины ′ , ( , ′ ) ∈ 1 ∪ 0 , а ( , ′ ) – функция
релаксации.
• Критерий остановки алгоритма BFS дополнен правилом ω < Релаксация запускается для всех вершин из D независимо, накопление весов происходит также независимо. Все релаксационные веса в конечном счете суммируются в итоговые значения Ω для всех ∈ 1 . Функция релаксации имеет вид ( , ′ ) = α ∙ ω ∙ ( , ′ ), где 0 < α < 1 – коэффициент затухания, не зависящий от домена, – текущий релаксационный вес вершины и ( , ′ ) = max ( , , ) – вес связи между и ′ . После окончания релаксации производится повторное отсечение малозначимых слов. В качестве критерия для отсечсения √ + Ω выбирается = 2 .Рис.4демонстрируетфрагмент конденсированного графа, сформированный словом «блюдо» и его ближайшими соседями. В результате на основе домен-специфической информации в графе возникают области сгущения семантических данных. Для выявления центров сгущения введены две характеристики - центральность и градиент вершины. Рис. 4 – фрагмент конденсированного графа, образованный словом «блюдо» и его ближайшими соседями Пусть σ ∈ {0, 1, 2 … } - ширина захвата контекста. При σ = 0 контекст вершины не учитывается вообще, при σ = 1 в контекст включаются соседи первого порядка, при σ = 2 – соседи второго порядка и т.д. Введем величину центральности вершины. Пусть Ω – вес вершины, вычисленный в ходе релаксации, 1 = ( , ) – домен-специфический граф с вершинами и ребрами . Тогда центральность вершины будем определять по формуле: Ω , σ = 0 ∑( , )∈ Ω Ω , σ = 1, √∑( , )∈ Ω2 ( ) = ∑( , )∈ ( ) Ω ,σ > 1
√ ∑( , )∈ 2 ( )
{
Рассмотрим вектор градиента для функции C(v): ( ) = ( ( ) −
( 1 ), ( ) − ( 2 ), … , ( ) − ( )),где { 1 , 2 , … , } – соседи
первого порядка для вершины v. Величина градиента определяется
формулой:
( ) = √( ( ) − ( 1 ))2 + ( ( ) − ( 2 ))2 + ⋯ + ( ( ) − ( ))2
Для графов, прошедших через процесс релаксации и отсечения
незначимых вершин, были рассчитаны значения центральности для σ = 1
и значения градиентов. После расчета был проведен анализ влияния
выбора вычисляемой характеристики на набор ключевых терминов
домена. Кроме этого, оценивалась согласованность ранжирования
(% слов, которые попали в топ-N и по градиенту, и по центральности). Вне
зависимости от домена согласованность колеблется в пределах 55-65%.
Таким образом, использование конкретной характеристики или
их комбинации определяется поставленной задачей.
На основе введенных характеристик реализован алгоритм
построения семантических кластеров. Пусть – граф 1-го слоя,
построенный методом конденсации для некоторого домена . Пусть
= ( , ) – граф с рассчитанными релаксационными весами вершин,
а = ( , ) и = ( , ) – графы с рассчитанными градиентом
и центральностью соответственно. = { 1 , 2 , … , } – центры кластеров,
выбранные из списков наиболее значимых терминов.
Пусть – выбранный радиус кластера, равный максимальному
числу переходов от центра кластера до слов лексикона этого кластера
в графе при обходе в ширину. В общем случае вершина включается
в кластер с весом ( ) = ( ), где 0 ≤ ≤ – число переходов
до выбранной вершины и 0 < ≤ 1 – коэффициент затухания, позволяющий снижать значимость терминов для кластера при удалении от центра. Рассмотрим множество терминов ( , ) = { 1 , 2 , … , } кластера с центром и радиуса . Необходимо ввести определение вероятности ( , ) появления термина a для ∈ {0, 1, … , } в кластере с центром : ( , ) = ( )/ ,где = ∑ ∈ ( , ) ( ) - суммарный вес всех вершин в ( , ). Фактически, в множестве ( , ) присутствует еще одно слово 0 – это любое другое слово, не известное в данной области (т.е., не включенное в кластер). Определим ( 0 , ) = 0, что не нарушает соотношения ∑ ∈ ( , ) ( ) = 1. Качественная характеристика принадлежности предложения кластеру определяется количеством информации, содержащейся в и соответствующей кластеру . В соответствии с формулой Шеннона количество информации ( , ) относительно кластера вычисляется по формуле ( , ) = − ∑ =1 ( , ) ∗ log 2 ( , ),где ( , ) - вероятность принадлежности слова сообщения кластеру . Принимая во внимание соотношение ( 0 , ) = 0, будем рассматривать в только слова из ( , ): ( , ) = − ∑ = & ∈ ( , ) ( , ) ∗ log 2 ( , ). На основании данной формулы с учетом соотношения ( , ) ≪ показано, что в качестве характеристической функции принадлежностикластеруможетбытьвыбрановыражение ( , = = & ∈ ( , ) , ∗ log 2 , и значение функции )∑() ( , ) не зависит от количества слов в предложении. Для любого предложения можно рассчитать n-мерный вектор характеристик ̅ ( , ) = { ( , 1 ), ( , 2 ), … , ( , )}, пиковые значения которого соответствуют наиболее значимым кластерам (категориям). В данной работе применяется фильтрация по порогу для ( , ), а максимальное число рассматриваемых пиков не превышает 2. Для оценки качества работы метода категоризации был построен семантический граф с порогами 4 и 2 для униграмм и биграмм соответственно. Выделены кластеры со следующими центрами: {ЕДА, ИНТЕРЬЕР, РЕСТОРАН, ОБСЛУЖИВАНИЕ}. Эти центры наиболее хорошо соответствуют категориям FOOD, RESTAURANT, AMBIENCE, SERVICE обучающего набора SemEval-2016, Task5. Из обучающего набора были случайно выбраны 30 отзывов, для которых метки предложений сравнивались с ответом системы. Подсчитывалось число меток, которые совпали с ответом системы, а также число тех, которые были пропущены. При анализе было обработано 282 предложения, на которые приходится 314 неповторяющихся категорий из списка (если в атрибутах предложения дважды и более указана категория RESTAURANT, учитывался только факт ее появления). Из 314 категорий верно были определены 218 (69,5%). Предложенный алгоритм является комбинированным и включает в себя статистический и семантический компоненты, поэтому частично перенимает их недостатки – в частности, не удается преодолеть проблему обнаружения редких семантических категорий. Тем не менее, ключевые значимые категории, обнаруженные алгоритмом, достаточно полно соответствуют реальным категориям, присутствующим в наборе данных. Поэтому метод может использоваться для категоризации текстов в пределах новых доменов, для которых набор целевых категорий не определен заранее. Категории, выделенные с использованием данного алгоритма, предназначены для аспектно-ориентированного анализа тональности. Для оценки эмоциональной окраски применяются адаптированные алгоритмы вычисления тональности коротких текстов. Четвертаяглавапосвященагибридномусемантико- статистическому алгоритму оценки тональности коротких текстов. Предложен алгоритм автоматического формирования тонального словаря на основе данных обучающей выборки, включающей более чем 220.000 русскоязычных постов социальной сети twitter3. Лексикон выборки по частеречному составу близок к лексикону лингвистических словарей, что говорит об адекватности обучающих данных. Для оценки тональности униграмм и биграмм предложена двумернаянепрерывнаяматематическаямодель,основанная на частотности употребления слов в негативных и позитивных текстах. Пусть – частота вхождения слова w в корпус позитивных твитов, а – в корпус негативных. Рассмотрим следующие величины: 1. Эмоциональная окраска слова w: − =. + Рубцова Ю.В. Построение корпуса текстов для настройки тонового классификатора [Текст]// Программные продукты и системы. – 2015, №1(109), – С.72-78 2. Степень распространенности слова w в словаре W: + =. ( + ) ∈ Значения величины s изменяются в пределах [-1;1], значению -1 соответствуют «сильно негативные» слова, значению 1 – «сильно позитивные». Величина характеризует степень принадлежности слова к числу общеупотребительных и используется для оценки значимости термина в пределах словаря при пороговой фильтрации. Каждому слову поставлена в соответствие двумерная оценка = ( , ). Характер распределения слов по шкале эмоциональной окраски после фильтрации по близок к теоретическому нормальному распределению (рис. 5), что свидетельствует об адекватности предлагаемой оценки. Рис. 5 – Распределение вычисленных оценок по шкале В ходе работы обучающая выборка анализировалась на уровне лексики и на уровне поверхностного семантического анализа средствами парсера RML. При поверхностном семантическом анализе формировались семантически обусловленные биграммы, а формы слов с отрицаниями рассматривались как самостоятельные единицы лексикона. Показано, что учет отрицаний и семантической связности при формировании биграмм повышает точность оценки на 3-9%. Для ранжирования отдельных слов по значимости в пределах лексикона предложена весовая функция. Пусть имеется слово w с известной оценкой = ( , ), значение T, определяющее степень покрытия лексикона, при котором T терминов лексикона удовлетворяют условию < и соответствующие ему векторы (1, ) и (−1, ). Тогда R – расстояние от до соответствующего по знаку вектора, а d – расстояние от центра координат до точки пересечения направляющего вектора с нормалью, опущенной из точки . В таком ( , ) − 2 случае вес слова вычисляется по формуле: = 2 ,где √2 g – фактор роста – параметр модели, характеризующий скорость роста высоты пика гауссианы вдоль направляющего вектора, r – скорректированая ширина колокола, вычисленная на основе R, ( , ) – ростовая функция, определяемая по одной из формул: log10 ( + 1), , 2 или . Рисунок 6 демонстрирует пример поведения ростовой функции с логарифмическим ростом. Рис. 6 – График при =0,15, g=2, ( , ) = 10( + 1) Для преодоления недостаточности словарного запаса тонального лексикона использовался семантический граф. Для термина, тональность которого неизвестна, строится семантическая окрестность. Термины из окрестности, тональность которых известна, формируют систему взвешенных точек на плоскости (S,O), для которой вычисляется центр масс. Полученное значение принимается в качестве неявной оценки тональности неизвестного слова с некоторой степенью доверия словарю, лежащей в пределах (0…1]. Экспериментально показано, что оптимальная структура семантической окрестности формируется при рассмотрении только отношений синонимии и определения, причем число переходов по ребрам графа не должно превышать 2. В качестве оценки тональности короткого текста предлагается рассматривать центр масс системы слов в его составе, для которых вычислена явная или неявная оценка тональности в лексиконе. Для оценки работы алгоритма на уровне общей лексики проведен ряд экспериментов, результаты которых приведены в таблице 1. Таблица 1. Результаты экспериментов по определению тональности для 200 положительных и 200 отрицательных твитов. СловариMax % точности для Max % точности для позитивных текстовнегативных текстов Семантические 7369 Лексические6960 Предложенный алгоритм позволяет достаточно точно определять тональность коротких текстов при сравнительно невысокой вычислительной сложности. В сочетании с алгоритмом категоризации реализован метод построения единого семантического ядра для задач аспектно-ориентированного анализа тональности. Многослойный семантический граф в сочетании с тональным лексиконом позволяют адекватно определять аспектные категории, а затем оценивать полярность соответствующих мнений. К основным преимуществам гибридного метода, предлагаемого в данной работе, можно отнести: 1. Невысокуювычислительнуюсложностьалгоритмов конденсации и кластеризации. 2. Возможность строить графы для произвольных доменов независимо, не прибегая к полному переформированию основного графа. 3. Возможность сочетать статистические данные (в виде весов в графе) с явными семантическими отношениями (отметки на дугах графа). Работы автора, в которых изложены основные результаты Диссертации Журналы из перечня ВАК: 1. Корней А.О. Категоризация текстов на основе сконденсированного графа /А.О. Корней, Е.Н. Крючкова // Информационные технологии, №3 (2021), C.138-146, Изд-во "Новые технологии" г. Москва. – 2021. 2. Корней А.О. Семантико-статистический алгоритм определения категорий аспектов в задачах сентимент-анализа /А.О. Корней, Е.Н. Крючкова // Известия ЮФУ. Технические науки №6 (2020) C. 66-74. В изданиях, индексируемых SCOPUS: 3. Korney A., Kryuchkova E., Savchenko V. (2020) Information Retrieval Approach Using Semiotic Models Based on Multi-layered Semantic Graphs // In: Jordan V., Filimonov N., Tarasov I., Faerman V. (eds) High- Performance Computing Systems and Technologies in Scientific Research, Automation of Control and Production. HPCST 2020. Communications in Computer and Information Science. Springer, Cham. – 2020. – Vol. 1304. – P. 162-177. Прочие издания: 4. Корней А.О. Применение адаптируемых обобщенных словарей в задачах аспектно-ориентированного анализа тональности /А.О. Корней, Е.Н. Крючкова // Программная инженерия, №11-12 (2019), C. 471-479, Изд-во "Новые технологии" г. Москва. - 2019. 5. Корней А.О. Автоматический анализ тональности лексикона на основе обучающей выборки /А.О. Корней, Е.Н. Крючкова // НАУКА. ТЕХНОЛОГИИ. ИННОВАЦИИ сборник научных трудов: в 10 частях. - 2017. С. 26-29, Изд-во «Новосибирский государственный технический университет», г. Новосибирск. 6. Корней А.О. Анализ тональности коротких текстов на основе семантического графа /А.О. Корней, Е.Н. Крючкова // НАУКА. ТЕХНОЛОГИИ. ИННОВАЦИИ сборник научных трудов: в 10 частях. 2017. С. 29-32, Изд-во «Новосибирский государственный технический университет», г. Новосибирск. 7. Корней А.О. Автоматический анализ эмоционального состояния автора в коротких текстах на естественном языке /А.О. Корней, Е.Н. Крючкова // XIV Всероссийская научно – техническая конференция «Наука и молодежь- 2017». [Электронный ресурс]. – URL: http://edu.secna.ru/media/f/pi2017v3.pdf (дата обращения: 29.09.2021). 8. Корней А.О. Анализ тональности коротких текстов на основе семантическогографа/А.О.Корней,Е.Н.Крючкова // XIV Всероссийская научно – техническая конференция «Наука и молодежь-2018».[Электронныйресурс].–URL: http://edu.secna.ru/media/f/pi2018v1.pdf (дата обращения: 11.10.2021). 9. Корней А.О. Анализ тональности коротких текстов на основе семантического графа /А.О. Корней, Е.Н. Крючкова // Робототехника и искусственный интеллект материалы X Всероссийской научно- технической конференции с международным участием. Сибирский федеральный университет; Межинститутская базовая кафедра «Прикладная физика и космические технологии». - 2018. С. 168-174, Изд-во «Литера-Принт) (г.Москва). 10. Корней А.О. Проблемы эффективности сентимент-анализа русскоязычных текстов в социальных сетях /А.О. Корней, Е.Н. Крючкова // Высокопроизводительные вычислительные системы и технологии. №2(9). – 2018. – C.87-92, Изд-во “Алтайский государственный университет” (Барнаул). 11. Корней А.О. Проблемы аспектного анализа в условиях несбалансированной обучающей выборки /А.О. Корней, Е.Н. Крючкова // Высокопроизводительные вычислительные системы и технологии. №3(1). – 2019. – C.161-165, Изд-во “Алтайский государственный университет” (Барнаул). 12. Корней А.О., Категоризация русскоязычных текстов на основе несбалансированной обучающей выборки /А.О. Корней // Конкурс научно-исследовательских работ: Технологические инновации и научные открытия, Сборник статей по материалам Международного научно-исследовательского конкурса, C. 266-274. Уфа, 2020. 13. Корней А.О. Категоризация текстовых данных на основе сконденсированных семантических графов /А.О. Корней, Е.Н. Крючкова // Компьютерные и информационные технологии в науке, инженерии и управлении «КомТех-2020»: материалы Всероссийской научно-технической конференции с международным участием: в 2 т. Т.1 C. 453-458 / Южный федеральный университет. – Ростов-на-Дону; Таганрог: Издательство Южного федерального университета, 2020.[Электронныйресурс].–URL: http://comtech.sfedu.ru/images/komtex2020/sbornik_comtech_2020_all.zip (дата обращения 15.11.2021). 14. Корней А.О. Проблемы эффективной доменной адаптации систем аспектно-ориентированногоаннотированиятекстовотзывов потребителей/А.О.Корней,Е.Н.Крючкова// Высокопроизводительные вычислительные системы и технологии. №5(1). – 2021. – C.299-303, Изд-во “Алтайский государственный университет” (Барнаул).

Актуальность работы. Технологический рост, наблюдаемый в последние
десятилетия, привел к существенным изменениям в повседневной человеческой
жизни. Современные персональные устройства – смартфоны, планшеты, «умные»
часы – обладают производительностью «суперкомпьютеров» тридцатилетней
давности. Технологические компании не стоят на месте и вкладывают огромные
средства в перспективные исследования, большая часть которых связана
с автоматической обработкой естественного языка.
На сегодняшний день одним из популярных направлений в данной области
является анализ тональности, основная цель которого состоит в извлечении
субъективной информации из текстов, выражаемой в виде мнений, а также
эмоциональных высказываний. Из всего перечня задач, связанных с извлечением
мнений, выделяется аспектно-ориентированный анализ тональности (АОАТ),
предполагающий работу с текстом на уровне отдельных аспектов/функций
целевого объекта.
Работа существующих систем аспектно-ориентированного анализа
тональности в основном опирается на методы обучения с учителем (supervised
learning), которые требуют наличия большого количества предварительно
размеченных данных. Разметка данных – длительный процесс, который
предполагает ручной труд компетентного эксперта, а значит – существенные
финансовые затраты. В современных условиях перечень областей, в которых могут
быть востребованы алгоритма АОАТ, вообще говоря, не ограничен. При этом
модель, построенная на основе некоторой специфической области, не может быть
в неизменном виде перенесена на другую область, а значит построение модели для
новой области требует нового массива размеченных данных. Поэтому важным
вопросом в задачах АОАТ является возможность эффективной адаптации
существующих моделей к новым предметным областям, либо снижение затрат
на построение новых моделей «с нуля». Для этого необходимы эффективные
модели представления языка, позволяющие работать с контекстными
зависимостями, при этом сохраняя гибкость и эффективность.
Степень проработанности темы исследования.
В автоматической обработке естественных языков большое распространение
получили семантические тезаурусы, как специализированные, так и общего
назначения. Существенное влияние на развитие семантических ресурсов оказал
выпущенный в 1998 году Принстонским университетом тезаурус WordNet,
который фактически стал промышленным стандартом в этой области.
Под влиянием роста доступной в сети Интернет информации активно
развивались статистические подходы, что привело к появлению целой группы
алгоритмов под общим названием Word Embeddings: word2vec [1], GloVe [2].
Технологический рост, в свою очередь, привел к расширению возможностей
машинного обучения. Сверточные, рекуррентные нейросети, включая архитектуру
LSTM [3] позволили совершить ряд существенных прорывов. По состоянию
на 2016 год ведущие технологические компании определяли LSTM как
технический стандарт будущих исследований.
Тем не менее, на сегодняшний день не существует единой модели, которая
позволяла бы эффективно снимать проблемы контекстной зависимости
и многозначности. Векторные представления, основанные на статистических
данных, формируют непрерывные представления значений/смыслов отдельных
понятий. Но для эффективной и корректной работы в условиях контекстной
зависимости необходимо различать отдельные значения. Такую возможность
предоставляют тезаурусы и семантические сети, которые зачастую используются
совместно с векторными представлениями. Некоторые исследователи [4] говорят
о необходимости встраивания обобщенных знаний в LSTM в таких сложных
задачах, как аспектный анализ тональности. Таким образом, поиск наиболее
эффективных и оптимальных семантических моделей ведется до сих пор.
Статистическим моделям недостает знаний о семантике, а их адекватность
существенно зависит от имеющихся текстов, на основе которых вычисляется
статистика. Семантические ресурсы, в свою очередь, не позволяют учесть все
возможные предметные области и контексты употребления для отдельных слов.
В данной диссертационной работе предлагается гибридная модель
представления языка, которая сочетает в себе концепции, лежащие в основе
векторных представлений, со структурными особенностями семантических сетей
и тезаурусов. Рассматриваются вопросы эффективной адаптации модели к новым
предметным областям на основании статистических данных о совместном
употреблении слов. Предлагается алгоритм тематической категоризации текстов
на основании данной модели, обладающей невысокой вычислительной
сложностью. Рассматриваются вопросы о построении единого семантического
ядра для решения кроссдисциплинарных задач на примере аспектно-
ориентированного анализа тональности.
Цель работы и задачи исследования. Настоящее диссертационное
исследование посвящено разработке гибридной семантико-статистической модели
представления языка в виде многослойного семантического графа,
предназначенного для проектирования алгоритмов категоризации текстов
и аспектного анализа тональности.
Для достижения поставленной цели в работе решаются следующие задачи:
1. Разработка общих требований, предъявляемых к модели, на основе
подробного анализа предметной области.
2. Разработка математической модели многослойного семантического
графа и алгоритмов его формирования на основе структурированных
и неструктурированных текстовых данных.
3. Разработка алгоритма построения конденсированных графов для
конкретных доменов на основе статистических данных.
4. Разработка алгоритма категоризации текстов на основе данных
конденсированных графов, анализ корректности работы алгоритма.
5. Разработка гибридного алгоритма анализа тональности коротких
домен-независимых текстов на основе статистических данных
и семантического графа.
6. Исследование возможности применения комбинированного алгоритма
для задач аспектного анализа тональности.
Соответствие диссертации паспорту специальности. Диссертация
соответствует области исследований специальности 05.13.17 – Теоретические
основы информатики по п. 5 «Разработка и исследование моделей и алгоритмов
анализа данных, обнаружения закономерностей в данных и их извлечениях
разработка и исследование методов и алгоритмов анализа текста, устной речи
и изображений»; п. 6 «Разработка методов, языков и моделей человеко-машинного
общения; разработка методов и моделей распознавания, понимания и синтеза речи,
принципов и методов извлечения данных из текстов на естественном языке»;
п. 12 «Разработка математических, логических, семиотических и лингвистических
моделей и методов взаимодействия информационных процессов, в том числе
на базе специализированных вычислительных систем».
Методы и методологии исследования. В данной работе при проведении
исследований применялись методы автоматической обработки текстов
(синтаксический и пресемантический анализ, токенизация, лемматизация), методы
математической статистики и теории вероятности, методы теории графов.
Научная новизна работы. К основным результатам, полученным
в диссертации, можно отнести следующие:
1. Предложена математическая модель многослойного семантического
графа, позволяющая независимо хранить, накапливать и обрабатывать
как обобщенные знания о мире, так и узкоспециализированную
информацию из отдельных областей человеческих знаний.
2. Предложен алгоритм автоматического построения графа на основе
структурированных текстовых данных, таких как
общелингвистические словари и энциклопедии.
3. Предложен метод построения конденсированного семантического
графа на основе неструктурированных текстов и алгоритм
категоризации текстов, основанный на выделении семантических
кластеров в пределах полученного графа.
4. Предложена математическая модель оценки тональности коротких
текстов, основанная на статистических данных и алгоритм вычисления
тональности на основе предложенной модели, включая расширение
лексикона тонального словаря за счет многослойного семантического
графа.
5. Предложен гибридный метод аспектно-ориентированного анализа
тональности, основанный на сочетании алгоритмов категоризации
и оценки тональности, приведены результаты работы алгоритма
и обозначены перспективы дальнейшего развития системы.
Теоретическая значимость работы. В рамках диссертационного
исследования разработаны: модель представления естественного языка в виде
многослойного семантического графа, алгоритмы автоматического извлечения
обобщенных и домен-специфических знаний из текстов различной структуры,
метод автоматической адаптации графа к ранее неизвестным прикладным
областям; модель и алгоритм оценки тональности короткого текста на основе
статистических характеристик; гибридный алгоритм аспектно-ориентированного
анализа тональности.
Практическая значимость работы. Полученные в диссертационной работе
алгоритмы и модели предназначены для практического применения в
программных комплексах анализа текстов, таких как системы аспектного анализа
тональности, системы автоматической категоризации текстов.
Реализация и внедрение результатов работы
Результаты диссертационного исследования внедрены в работу ООО
«Адаптивные технологии» и используются для категоризации запросов в группу
технической поддержки.
Достоверность полученных результатов подтверждается проведенными
экспериментами и моделированием, а также согласованностью с данными,
имеющимися в отечественной зарубежной литературе.
Апробация работы. Материалы работы докладывались на следующих
научных конференциях: XI Всероссийская научная конференции молодых ученых
“Наука. Технологии. Инновации” (г. Новосибирск, 2017), XIV Всероссийская
научно –техническая конференция «Наука и молодежь – 2017» (г. Барнаул, 2017),
XV Всероссийская научно – техническая конференция «Наука и молодежь – 2018»
(г. Барнаул, 2018), X Всероссийская научно-техническая конференция
с международным участием «Робототехника и искусственный интеллект»
(г. Железногорск, 2018), IX Международной научно-практической конференции
«Высокопроизводительные вычислительные системы и технологии в научных
исследованиях, автоматизации управления и производства» (г. Барнаул, 2019),
Всероссийская научно-техническая конференция с международным участием
имени профессора О.Н. Пьявченко “Компьютерные и информационные
технологии в науке, инженерии и управлении” «КомТех-2020» (г. Таганрог, 2020),
Конкурс научно-исследовательских работ: технологические инновации и научные
открытия (г. Уфа, 2020).
Публикации. По теме диссертационной работы опубликовано 14 печатных
работ, включая 2 статьи в журналах из списка ВАК и 1 индексируемая Scopus,
получено 3 свидетельства о регистрации программы для ЭВМ: №202066670,
№ 2021611508, № 2021611519.
Основные положения диссертации, выносимые на защиту.
1. Предложенные алгоритмы автоматического формирования
многослойного семантического графа на основе структурированных
и неструктурированных текстовых данных позволяют повысить
мобильность, скорость и качество настройки специализированных
систем автоматической обработки текстов (АОТ).
2. Представление модели домена в виде многослойного семантического
графа и алгоритм построения конденсированного графа на основе
статистических данных, извлеченных из текстов некоторого домена,
позволяют с высокой скоростью выделить семантические кластеры
вокруг ключевых терминов домена.
3. Предложенный алгоритм настройки АОТ разных доменов позволяет
с эквивалентными статистическими характеристиками выполнить
построение множества ключевых терминов доменов.
4. Предложенная модель оценки принадлежности текста некоторой
семантической категории и алгоритм категоризации текстов на основе
конденсированного семантического графа позволяет выполнить
аспектный анализ тональности как отдельных отзывов потребителей,
так и получить обобщенную оценку множества отзывов по наиболее
обсуждаемым ими категориям.

Личный вклад автора в работах, выполненных в соавторстве, заключается
в построении предлагаемых моделей, проведении соответствующих
статистических экспериментов, проектировании и реализации предлагаемых
алгоритмов, а также проведении необходимых численных экспериментов.
Структура и объем диссертации. Диссертационная работа состоит
из введения, четырех разделов, заключения, списка литературы, содержащего 147
наименований, и 3 приложения. Общий объем работы составляет 134 страницы,
в том числе 23 рисунка и 9 таблиц.

В диссертации предлагается решение актуальной научной проблемы –
разработки методов автоматической настройки систем обработки
неструктурированных текстов в специализированных областях. Предложенные
методы основаны на формировании домен-ориентированных знаний в виде
конденсированного семантического графа.
1. Разработана гибридная модель представления языка, которая сочетает
в себе концепции, лежащие в основе векторных представлений,
со структурными особенностями семантических сетей и тезаурусов.
2. Разработан алгоритм автоматического построения базового
семантического графа на основе структурированных текстовых данных,
таких как общелингвистические словари и энциклопедии.
3. Предложена математическая модель многослойного семантического
графа, позволяющая независимо хранить, накапливать и обрабатывать как
обобщенные знания о мире, так и узкоспециализированную информацию
из отдельных областей человеческих знаний.
4. Предложен алгоритм автоматического построения конденсированного
семантического графа на основе неструктурированных текстов и алгоритм
категоризации текстов, основанный на выделении семантических
кластеров в пределах полученного графа.
5. Предложен подход для вычисления пороговых значений с целью выделить
домен-ориентированных аспектных терминов в зависимости
от статистических характеристик лексикона домена, что позволяет
выполнить настройку АОТ разных доменов с эквивалентными
статистическими характеристиками множества ключевых терминов
домене.
6. Предложен гибридный метод аспектно-ориентированного анализа
тональности, основанный на сочетании алгоритмов категоризации
и оценки тональности.
Рекомендации и перспективы для дальнейшей разработки темы заключаются
в следующем.
Безусловный практический интерес представляет анализ фейковых текстов
в социальных сетях как с точки зрения их принадлежности классу фейков
по их тематической принадлежности, так и по их тональности. С этой целью
в дальнейшем можно доработать алгоритмы категоризации.
Очевидно, что для этого потребуется существенная доработка алгоритмов
формирования тонального лексикона с учетом доменной специфики.
Для вычисления соотношения между порогами отсечения разных доменов
представляется перспективным формировать их не только на основе коэффициента
лексического разнообразия текстов, но и на основе тематического разнообразия
домена, рассматривая предлагаемый в работе метод выявления категорий
как первичный этап для более точного сопоставления характеристик доменов.
Обширной областью исследования, связанной с методами автоматического
формирования семантических доменных графовых моделей, является анализ
узкоспециальных научных областей знания, таких как математика, медицина и т.п.
Представляет интерес как формирование конденсированных графов
на основе обработки соответствующих энциклопедий и справочников,
так и тематический анализ и категоризация научных статей на основе построенных
графовых моделей.
Список публикаций по тематике работы и её апробация
Основные результаты диссертационной работы изложены в 13 публикациях,
приведенных в списке литературы, и докладывались на следующих научно-
практических конференциях:
Журналы из перечня ВАК:
1. Корней А.О. Категоризация текстов на основе сконденсированного графа
/А.О. Корней, Е.Н. Крючкова // Информационные технологии, №3 (2021),
C.138-146, Изд-во “Новые технологии” г. Москва. – 2021.
2. Корней А.О. Семантико-статистический алгоритм определения категорий
аспектов в задачах сентимент-анализа /А.О. Корней, Е.Н. Крючкова
// Известия ЮФУ. Технические науки №6 (2020) C. 66-74.

В изданиях, индексируемых SCOPUS и/или Web of Science:
3. Korney A., Kryuchkova E., Savchenko V. (2020) Information Retrieval
Approach Using Semiotic Models Based on Multi-layered Semantic Graphs
// In: Jordan V., Filimonov N., Tarasov I., Faerman V. (eds) High-Performance
Computing Systems and Technologies in Scientific Research, Automation
of Control and Production. HPCST 2020. Communications in Computer and
Information Science. Springer, Cham. – 2020. – Vol. 1304. – P. 162-177.

ПРОЧИЕ ИЗДАНИЯ:
4. Корней А.О. Применение адаптируемых обобщенных словарей в задачах
аспектно-ориентированного анализа тональности /А.О. Корней,
Е.Н. Крючкова // Программная инженерия, №11-12 (2019), C. 471-479,
Изд-во “Новые технологии” г. Москва. – 2019.
5. Корней А.О. Автоматический анализ тональности лексикона на основе
обучающей выборки /А.О. Корней, Е.Н. Крючкова // НАУКА.
ТЕХНОЛОГИИ. ИННОВАЦИИ сборник научных трудов: в 10 частях. –
2017. С. 26-29, Изд-во «Новосибирский государственный технический
университет», г. Новосибирск.
6. Корней А.О. Анализ тональности коротких текстов на основе
семантического графа /А.О. Корней, Е.Н. Крючкова // НАУКА.
ТЕХНОЛОГИИ. ИННОВАЦИИ сборник научных трудов: в 10 частях. 2017.
С. 29-32, Изд-во «Новосибирский государственный технический
университет», г. Новосибирск.
7. Корней А.О. Автоматический анализ эмоционального состояния автора в
коротких текстах на естественном языке /А.О. Корней, Е.Н. Крючкова
// XIV Всероссийская научно – техническая конференция «Наука и молодежь
– 2017». [Электронный ресурс]. – URL:
http://edu.secna.ru/media/f/pi2017v3.pdf (дата обращения: 29.09.2021)
8. Корней А.О. Анализ тональности коротких текстов на основе
семантического графа /А.О. Корней, Е.Н. Крючкова // XIV Всероссийская
научно – техническая конференция «Наука и молодежь – 2018».
[Электронный ресурс]. – URL: http://edu.secna.ru/media/f/pi2018v1.pdf (дата
обращения: 11.10.2021)
9. Корней А.О. Анализ тональности коротких текстов на основе
семантического графа /А.О. Корней, Е.Н. Крючкова // Робототехника
и искусственный интеллект материалы X Всероссийской научно-
технической конференции с международным участием. Сибирский
федеральный университет; Межинститутская базовая кафедра «Прикладная
физика и космические технологии». – 2018. С. 168-174, Изд-во «Литера-
Принт) (г.Москва).
10. Корней А.О. Проблемы эффективности сентимент-анализа русскоязычных
текстов в социальных сетях /А.О. Корней, Е.Н. Крючкова
// Высокопроизводительные вычислительные системы и технологии.
№2(9). – 2018. – C.87-92, Изд-во “Алтайский государственный университет”
(Барнаул).
11. Корней А.О. Проблемы аспектного анализа в условиях несбалансированной
обучающей выборки / А.О. Корней, Е.Н. Крючкова
// Высокопроизводительные вычислительные системы и технологии. №3(1).
– 2019. – C.161-165, Изд-во “Алтайский государственный университет”
(Барнаул).
12. Корней А.О., Категоризация русскоязычных текстов на основе
несбалансированной обучающей выборки /А.О. Корней // Конкурс научно-
исследовательских работ: Технологические инновации и научные открытия,
Сборник статей по материалам Международного научно-исследовательского
конкурса, C. 266-274. Уфа, 2020.
13. Корней А.О. Категоризация текстовых данных на основе
сконденсированных семантических графов /А.О. Корней, Е.Н. Крючкова
// Компьютерные и информационные технологии в науке, инженерии и
управлении «КомТех-2020»: материалы Всероссийской научно-технической
конференции с международным участием: в 2 т. Т. 1., C. 453-458 / Южный
федеральный университет. – Ростов-на-Дону; Таганрог: Издательство
Южного федерального университета, 2020. [Электронный ресурс]. – URL:
http://comtech.sfedu.ru/images/komtex2020/sbornik_comtech_2020_all.zip (дата
обращения 15.11.2021)
14. Корней А.О. Проблемы эффективной доменной адаптации систем аспектно-
ориентированного аннотирования текстов отзывов потребителей /А.О.
Корней, Е.Н. Крючкова // Высокопроизводительные вычислительные
системы и технологии. №5(1). – 2021. – C.299-303, Изд-во “Алтайский
государственный университет” (Барнаул)

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?

Закажи новую работу, сделанную по твоим требованиям

Помогаем с подготовкой сопроводительных документов

Совместно разработаем индивидуальный план и выберем тему работы Подробнее

Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее

Поможем в написании научных статей для публикации в журналах ВАК Подробнее

Структурируем работу и напишем автореферат Подробнее

Хочешь уникальную работу?

Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все

Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!

#Кандидатские #Магистерские

50 Выполненных работ

Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно исполь... Читать все

Работа пишется на основе учебников и научных статей, диссертаций, данных официальной статистики. Все источники актуальные за последние 3-5 лет.Активно и уместно использую в работе графический материал (графики рисунки, диаграммы) и таблицы.

#Кандидатские #Магистерские

362 Выполненных работы

Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии ... Читать все

Образование высшее (2009 год) педагог-психолог (УрГПУ). В 2013 году получено образование магистр психологии. Опыт преподавательской деятельности в области психологии и педагогики. Написание диссертаций, ВКР, курсовых и иных видов работ.

#Кандидатские #Магистерские

592 Выполненных работы

Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). С... Читать все

Работы пишу, начиная с 2000 года. Огромный опыт и знания в области экономики. Закончил школу с золотой медалью. Два высших образования (техническое и экономическое). Сейчас пишу диссертацию на соискание степени кандидата экономических наук.

#Кандидатские #Магистерские

692 Выполненных работы

Пишу качественные выпускные квалификационные работы и магистерские диссертации. Опыт написания работ - более восьми лет. Всегда на связи.

#Кандидатские #Магистерские

21 Выполненная работа

Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на напис... Читать все

Высшее юридическое образование, красный диплом. Более 5 лет стажа работы в суде общей юрисдикции, большой стаж в написании студенческих работ. Специализируюсь на написании курсовых и дипломных работ, а также диссертационных исследований.

#Кандидатские #Магистерские

158 Выполненных работ

руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все

руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика

#Кандидатские #Магистерские

12 Выполненных работ

Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все

Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.

#Кандидатские #Магистерские

132 Выполненных работы

Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выв... Читать все

Имеют опыт грамотного написания диссертационных работ по медицине, а также отдельных ее частей (литературный обзор, цели и задачи исследования, материалы и методы, выводы).Пишу статьи в РИНЦ, ВАК.Оформление патентов от идеи до регистрации.

#Кандидатские #Магистерские

100 Выполненных работ