Коллективный эволюционный метод многокритериальной оптимизации в задачах анализа речевых сигналов
ВВЕДЕНИЕ………………………………………………………………………………………………………. 4
Глава 1. Эволюционные алгоритмы многокритериальной оптимизации для распознавания эмоций человека по речи ………………………………………………………….. 11
1.1 Распознавание эмоций человека по речи …………………………………………………… 11
1.2 Обоснование интеграции эволюционных алгоритмов и средств интеллектуального анализа данных …………………………………………………………………. 14
1.3 Постановка задачи многокритериальной оптимизации ……………………………… 18
1.4 Обзор эволюционных алгоритмов многокритериальной оптимизации ……… 21
ВЫВОДЫ ……………………………………………………………………………………………………….. 31
Глава 2. Разработка, реализация и исследование коллективного генетического алгоритма многокритериальной оптимизации………………………………………………….. 32
2.1 Основы функционирования генетических алгоритмов многокритериальной оптимизации……………………………………………………………………………………………………. 32
2.2 Коллективныйгенетическийалгоритммногокритериальнойоптимизации..36 2.3 Тестовые задачи для исследования эволюционных алгоритмов
многокритериальной оптимизации ………………………………………………………………….. 48
2.4 Исследование эффективности разработанного коллективного генетического алгоритма многокритериальной оптимизации………………………………………………….. 53
ВЫВОДЫ ……………………………………………………………………………………………………….. 59
Глава 3. Применение коллективного генетического алгоритма многокритериальной оптимизации для автоматического генерирования искусственных нейронных сетей в задаче распознавания эмоций по речи ………… 61
3.1 Исследование эффективности классификаторов на задаче распознавания эмоций человека по речи …………………………………………………………………………………. 61
3.2 Искусственные нейронные сети как инструмент интеллектуального анализа данных ……………………………………………………………………………………………………………. 69
3
3.3 Автоматическое генерирование полносвязных персептронов многокритериальным генетическим алгоритмом ……………………………………………… 77
3.4 Исследование эффективности многокритериального генетического алгоритма автоматического проектирования полносвязных персептронов ……….. 82
ВЫВОДЫ ……………………………………………………………………………………………………….. 92
Глава 4. Извлечение информативных признаков в задаче распознавания эмоций человека по речи коллективным генетическим алгоритмом многокритериальной оптимизации……………………………………………………………………………………………………. 93
4.1 Основные подходы к извлечению информативных признаков…………………….. 93
4.2 Исследование эффективности подхода filter на задаче распознавания эмоций человека по речи……………………………………………………………………………………………… 98
4.3 Исследование эффективности подхода wrapper на задаче распознавания эмоций человека по речи ……………………………………………………………………………….. 110
4.4 Сравнительный анализ подходов filter и wrapper на задаче распознавания эмоций человека по речи ……………………………………………………………………………….. 116
ВЫВОДЫ ……………………………………………………………………………………………………… 119 ЗАКЛЮЧЕНИЕ …………………………………………………………………………………………….. 120 СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………………………….. 121
Приложение 1. Сравнение эффективности разработанного алгоритма с победителями соревнования CEC2009 …………………………………………………………… 139
Актуальность. На сегодняшний день качество распознавания устной речи интеллектуальными диалоговыми системами стремительно повышается. Однако для раскрытия смысла сообщения не достаточно знать совокупность слов, составляющих речевой сигнал. Правильная интерпретация контекста невозможна без учета невербальных сигналов, сопровождающих словесные конструкции. Поэтому распознавание эмоционального состояния говорящего является ключевым аспектом в ходе анализа устной речи. Однако в связи с особенностями задачи применение стандартных методов интеллектуального анализа данных не обеспечивает высокой эффективности. В качестве альтернативы предлагается использовать подходы, основанные на эвристических процедурах.
Дисциплина, зародившаяся на стыке машинного обучения (англ. machine learning) и эволюционных вычислений, переросла в направление (англ. evolutionary machine learning), охватывающее не только методы извлечения знаний из баз данных, проектирования моделей, алгоритмы их обучения, но и всю совокупность средств эволюционного поиска, необходимых для тонкой настройки данных технологий. В большинстве случаев применение эволюционных методов в области машинного обучения ограничивается привлечением стохастических алгоритмов для решения задач однокритериальной оптимизации. Однако учет нескольких критериев качества позволяет расширить возможности применяемого алгоритмического аппарата. Формальную модель такого рода задач целесообразно представлять как совокупность функционалов, отражающих те или иные аспекты проблемы: они могут быть согласованными, независимыми или конкурирующими.
За последние тридцать лет было предложено немало эффективных эволюционных, а именно генетических алгоритмов (ГА) многокритериальной оптимизации, реализующих принцип Парето-доминирования, идею элитизма, модификации селективного отбора и т.д. На сегодняшний день эволюционные методы широко используются не только как мощный алгоритмический аппарат
5
для решения оптимизационных задач, но и как эффективный вспомогательный инструментарий в области интеллектуального анализа данных.
Поэтому разработка и исследование эволюционных методов многокритериальной оптимизации, демонстрирующих высокую эффективность при их использовании в области машинного обучения, в том числе в сфере анализа речевых сигналов, является актуальной научно-технической задачей.
Несмотря на универсальность эволюционных алгоритмов, их довольно высокую эффективность в смысле точности и надежности и возможность функционирования в динамически изменяющемся пространстве, некоторые ученые приводят аргументы против интеграции машинного обучения и эволюционных вычислений. Во-первых, они апеллируют к необходимости выбора нужного алгоритма из широкого спектра эвристических методов, эффективность которых существенно меняется при переходе от одной задачи к другой. Во- вторых, по сравнению со стандартными аналогами эволюционные алгоритмы требуют больше вычислительных ресурсов. Поэтому целью диссертационной работы является повышение эффективности эволюционных методов, используемых для решения задач многокритериальной оптимизации в области анализа речевых сигналов.
Открытые вопросы рассматриваемой предметной области и сформулированная цель работы предопределили совокупность решаемых задач:
1. Проанализировать целесообразность применения эволюционных методов в задаче распознавания эмоций человека по речи.
2. Реализовать и исследовать ряд стандартных генетических алгоритмов многокритериальной оптимизации.
3. Спроектировать островную модель параллельного генетического алгоритма многокритериальной оптимизации, компонентами которого являются методы, основанные на различных эвристиках.
4. Реализовать предложенную схему алгоритма. Исследовать эффективность данного подхода на тестовых задачах.
6
5. Автоматизировать процесс генерирования структуры искусственной нейронной сети с учетом дополнительного критерия «вычислительная сложность модели».
6. Разработать многокритериальную математическую модель задачи извлечения информативных признаков из баз данных. На основе предложенной модели реализовать процедуру отбора релевантных атрибутов при помощи разработанного генетического алгоритма.
7. Апробировать предложенный алгоритмический аппарат и реализованное программное обеспечение на практических задачах распознавания эмоций человека по речи.
Методы исследования. В данной работе использовались методы
эволюционных вычислений, нейросетевого моделирования, оптимизации, теории вероятности и математической статистики, системного анализа и другие.
Научная новизна результатов диссертационной работы состоит в следующем:
1. Разработан новый коллективный параллельный генетический алгоритм для решения задач многокритериальной оптимизации, основанный на островной модели кооперации и отличающийся от своих компонент параллельной структурой, а также сочетанием различных концепций эволюционного поиска.
2. Разработан новый метод проектирования архитектуры нейросетевых классификаторов, позволяющий генерировать набор альтернативных моделей различной точности и вычислительной сложности, отличающийся от известных подходов возможностью выбора нейронной сети с компактной структурой, соответствующей заданному уровню точности.
3. Разработаны новые эволюционные методы извлечения информативных признаков из баз данных при решении классификационных задач, основанные на двухкритериальных оптимизационных моделях и отличающиеся от известных подходов способом представления решения и возможностью формирования коллективов классификаторов.
7
4. Реализованные алгоритмические схемы были впервые применены для решения задачи распознавания эмоций человека по речи. Использование разработанных технологий позволило повысить качество получаемых решений.
Теоретическая значимость результатов диссертационного исследования состоит в разработке нового многокритериального эволюционного алгоритма, сочетающего в себе три метода, основанных на различных концепциях. Островная модель алгоритма позволяет избежать выбора конечным пользователем наиболее эффективного метода из числа имеющихся, а параллельная реализация приводит к сокращению временных затрат, требуемых для работы алгоритма, что имеет существенное значение при использовании эволюционного поиска в области машинного обучения.
Практическая ценность. Разработанные алгоритмические схемы отличаются ориентацией на конечного пользователя, поскольку не требуют выбора оптимизационной процедуры при решении задач предобработки данных (отбора информативных признаков) и классификации. Параллельная работа компонент эволюционного алгоритма позволяет экономить время, требуемое для решения задачи.
Реализованные подходы были успешно применены для решения задачи распознавания эмоций человека по речи, что является одним из ключевых направлений интеллектуализации диалоговых систем.
Реализация результатов работы. Разработанные алгоритмы были использованы при выполнении исследований в рамках проекта «Разработка методов и технологий распараллеливания алгоритмов интеллектуального анализа данных в многопроцессорных и распределенных вычислительных системах» (ГК 14.В37.21.1521, в рамках ФЦП); российско-германских проектов, посвященных разработке методов интеллектуального анализа данных в мультилингвистических системах, выполняемых в рамках ФЦП по ГК No 11.519.11.4002 и 16.740.11.0742; проекта «Модели и алгоритмы функционирования систем интеллектуального анализа данных с пространственно-временным механизмом адаптации для
8
решения задачи моделирования и оптимизации сложных технических систем» (грант Президента РФ 2014-2015 гг. МК-5391.2014.9) и проекта No 140/14 «Разработка теоретических основ эволюционного проектирования интеллектуальных информационных технологий анализа данных» (государственное задание, утвержденное Минобрнауки России на 2014–2016 гг.). Проводимые исследования также были поддержаны Фондом содействия развитию малых форм предприятий в научно-технической сфере в рамках программы «Участник молодежного научно-инновационного конкурса» (У.М.Н.И.К.), 2014– 2015 гг.
Семь программных систем зарегистрированы в Роспатенте. Разработанное программное обеспечение используется в учебном процессе Института информатики и телекоммуникаций СибГАУ при выполнении лабораторных и курсовых работ.
Программные системы переданы для использования в две инновационные IT-компании г. Красноярска, а также в Ульмский университет (г. Ульм, Германия) для проведения исследования в сфере распознавания персональных характеристик пользователей диалоговых систем.
Основные защищаемые положения:
1. Разработанный параллельный эволюционный алгоритм многокритериальной оптимизации превосходит свои компоненты, включенные в состав островной модели, по точности, надежности и оперативности работы.
2. Разработанный подход к проектированию нейросетевых классификаторов позволяет строить системы, эффективные по точности и вычислительной сложности.
3. На множестве представленных задач применение эволюционных методов извлечения информативных признаков, основанных на двухкритериальных оптимизационных моделях, позволяет повысить точность классификации.
4. Спроектированные схемы извлечения информативных признаков являются эффективным средством предобработки данных и могут быть
9
успешно использованы в сочетании с коллективом классификаторов различной природы.
Апробация работы. Результаты диссертационной работы докладывались в
период 2010-2015 гг. более чем на 20 конференциях различного уровня, среди которых: INTERSPEECH 2015 (Dresden, Germany, 2015), Sixth International Conference on Swarm Intelligence (Beijing, China, 2015), IEEE Congress on Evolutionary Computation (Sendai, Japan, 2015), Informatics in Control, Automation and Robotics (Colmar, France, 2015; Vienna, Austria, 2014), International Conference on Engineering and Applied Sciences Optimization (Kos Island, Greece, 2014), The 9th edition of the Language Resources and Evaluation Conference (Reykjavik, Iceland, 2014), International Conference on Computer Science and Artificial Intelligence (Wuhan, China, 2014), International Workshop on Mathematical Models and its Applications (Krasnoyarsk, Russia, 2013, 2014, 2015), Пятая Международная конференция «Системный анализ и информационные технологии» (Красноярск, 2013), Третья Всероссийская научная конференция с международным участием «Теория и практика системного анализа» (Рыбинск, 2014), Всероссийская научно- техническая конференция «Информационно-телекоммуникационные системы и технологии» (Кемерово, 2014), XIII Международная научная конференция «Молодежь. Общество. Современная наука, техника и инновации» (Красноярск, 2014), ХIII Международная научная конференция «Интеллект и наука» (Железногорск, 2013), XVI и XVIII Международные научные конференции «Решетневские чтения» (Красноярск, 2012, 2014), и др. Кроме того, отдельные результаты работы были доложены на научных семинарах института информационных технологий университета г. Ульм (Германия, 2014), Мариборского университета в г. Крань (Словения, 2014), университета Восточной Финляндии в г. Куопио (Финляндия, 2015). Диссертация в целом обсуждалась на научно-технических семинарах кафедры системного анализа и исследования операций СибГАУ и кафедры систем автоматизированного проектирования (РК6) НИУ МГТУ им. Н.Э. Баумана.
10
Публикации. По материалам данной работы опубликовано 26 печатных работ, в том числе 6 статей в научных изданиях Перечня ВАК, 6 – в изданиях, индексируемых в международной базе Scopus, 2 – в изданиях, индексируемых в Web of Science.
Структура работы. Работа состоит из введения, четырех глав, заключения, списка литературы и приложений.
Помогаем с подготовкой сопроводительных документов
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!