Генерация текста на основе цепей Маркова для чат-бота
В работе рассмотрена математическая модель для интеллектуальной генерации текста для чат-бота. С использованием сервиса DialogFlow Google мы разработали чат-бот TPU_VKR. Для обучения чат-бота мы создали корпус вопросов-ответов, затем разработали сценарий ведения диалога в зависимости от выбора пользователя. С использованием API DialogFlow Google на языке Python были выгружены диалоги, которые стали основой для интеллектуальной генерации текста с использованием цепей Маркова. Для определения семантического сходства между фразами мы использовали косинусное расстояние. Результаты расчетов показали, что косинусное расстояние между оригинальной фразой и сгенерированными фразами лежит в пределах 0,44 от 0,96.
1. Литературный обзор …………………………………………………………………………………….. 13
2. Генерация текста с использованием цепей Маркова ……………………………….. 16
3. Практическая часть …………………………………………………………………………………….. 18
3.1. Формирование корпуса вопросов-ответов …………………………………………………. 18
3.2. Программная реализация и развитие чат-бота ………………………………………….. 19
3.3. Интеграция чат-бота с мессенджером Telegram …………………………………………. 22
4. СОЦИАЛЬНАЯ ОТВЕТСТВЕННОСТЬ ………………………………………………………. 24
Правовые и организационные вопросы обеспечения безопасности …………………. 25
Эргономические требования к рабочему месту ……………………………………………….. 25
4.1 Производственная безопасность …………………………………………………………… 26
4.1.1 Отклонение показателей микроклимата в помещении ………………………… 28
4.1.2 Недостаточная освещенность рабочей зоны …………………………………………. 31
4.1.3 Повышенное значение напряжения в электрической цепи, замыкание
которой может пройти через тело человека ………………………………………….. 35
4.2 Экологическая безопасность ………………………………………………………………… 37
4.3 Безопасность в чрезвычайных ситуациях …………………………………………….. 38
4.4 Выводы по разделу «Социальная безопасность» ………………………………….. 40
ФИНАНСОВЫЙ МЕНЕДЖМЕНТ, РЕСУРСОЭФФЕКТИВНОСТЬ И
РЕСУРСОСБЕРЕЖЕНИЕ ……………………………………………………………………. 41
Предпроектный анализ …………………………………………………………………………………… 41
Потенциальные потребители результатов исследования ………………………………… 41
Анализ конкурентных технических решений с
позиции ресурсоэффективности и ресурсосбережения …………………………………… 42
SWOT-анализ ………………………………………………………………………………………………….. 44
Оценка готовности проекта к коммерциализации ………………………………………….. 46
Методы коммерциализации результатов научно-технического исследования .. 48
Инициация проекта ………………………………………………………………………………………… 49
Планирование управления научно-техническим проектом…………………………….. 51
1.1.2 Иерархическая структура проекта ……………………………………………………….. 51
1.1.3 План проекта ……………………………………………………………………………………….. 51
Бюджет научного исследования ………………………………………………………………………. 71
Специальное оборудование для научных(экспериментальных)работ ….. 71
Основнаязаработная плата …………………………………………………………………… 71
Дополнительная заработная плата……………………………………………………….. 73
Отчисления на социальные нужды ………………………………………………………. 73
Прочие прямые расходы ………………………………………………………………………. 74
Накладные расходы ……………………………………………………………………………… 74
1.1.4 План управления коммуникациями проектами …………………………………… 75
1.1.5 Реестр рисков проекта ………………………………………………………………………….. 75
1.2 Определение ресурсной (ресурсосберегающей), финансовой, бюджетной,
социальной и экономической эффективности исследования ……………………….. 76
1.2.2 Оценка сравнительной эффективности исследования………………………….. 82
Список публикаций студента …………………………………………………………………………… 85
Заключение ……………………………………………………………………………………………………… 86
Список литературы …………………………………………………………………………………………. 87
Приложение А………………………………………………………………………………………………….. 92
Приложение 1. Список вопросов и ответов . ………………………………………………….. 110
Приложение 2. Код программы для обработки и генерации текста ……………….. 113
Приложение 3. Косинусное сходство между оригинальным и сгенерированными
предложениями …………………………………………………………………………………. 119
Чат-боты – это автоматизированные системы, которые помогают пользователям
находить ответы на их запросы. Для предприятий и организаций они предоставляют
современный способ связи со своими сотрудниками, клиентами. Чат-боты
предоставляют удобный интерфейс для получения ответов на запросы без звонка по
телефону или электронной почты.
Чат-боты применяются практически во всех сферах жизнедеятельности, таких
как услуги, коммерция, развлечения и консультирование и могут быть разделены на
следующие группы: отвечающие на вопросы, ориентированные на выполнение задач,
социальные боты. В зависимости от группы к современным чат-ботам предъявляют
различные требования, в частности: иметь разговорные способности, представлять
семантически правильную информацию и содержательные ответы, иметь
возможность для обучения для конкретной предметной области. Для соответствия
этим требованиям в чат-боты могут быть заложены различные модели генерации
ответов, например, модели на основе шаблона, целевого поиска или генеративного
подхода.
Цель работы – разработать математическую модель для автоматизированной
генерации ответов чат-бота.
Для достижения поставленной цели были сформулированы следующие задачи:
1) Сформировать корпус вопросов-ответов.
В данной работе рассмотрена математическая модель для интеллектуальной
генерации текста для чат-бота. Мы разработали чат-бот с использованием сервиса
DialogFlow Google. Разработали корпус вопросов-ответов для обучения чат-бата.
В чат-бот был заложен сценарий, в котором диалог осуществляется в зависимости
от выбора пользователя.
С помощью API DialogFlow Google на языке Python мы выгрузили диалоги и
применили модель для интеллектуальной генерации текста.
Для определения сходства между двумя фразами мы использовали
косинусное расстояние. Результаты расчетов показали, что косинусное расстояние
между оригинальной фразой и сгенерированными фразами лежит в пределах 0,44
от 0,96.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!