Объяснимый искусственный интеллект для распознавания речи

Козлова Анна Олеговна
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

В последние годы искусственный интеллект набирает все большую популярность в роли инструмента решения различных задач для улучшения качества жизни человека. Примерами таких систем являются отрасль беспилотных автомобилей, здравоохранение и другие. Однако, у многих пользователей формируется недоверие к системам подобного рода, так как нет четкого объяснения как тот или иной алгоритм принимает решения. Также возникают правовые и этические вопросы: «Кто несет ответственность за принятые решения?» Проблемы лежащие в основе интерпретации работы алгоритмов относят к области XAI. В этой работе будут исследованы методы объяснения искусственного интеллекта на основе обученной модели для распознавания речи. В перспективе эта работа может быть использована для формирования рекомендаций при постановке медицинских диагнозов для людей с психическими отклонениями.

Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Обзор литературы . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
Глава 1. Распознавание эмоций в аудиоданных с использова-
нием глубоких нейронных сетей . . . . . . . . . . . . . 8
1.1. Предварительная обработка . . . . . . . . . . . . . . . . . 8
1.2. Выделение признаков . . . . . . . . . . . . . . . . . . . . . 10
Глава 2. Нейронная сеть . . . . . . . . . . . . . . . . . . . . . . . . 13
2.1. Сверточная нейронная сеть . . . . . . . . . . . . . . . . . 13
2.2. Предсказание на реальных данных . . . . . . . . . . . . . 19
Глава 3. XAI алгоритмы . . . . . . . . . . . . . . . . . . . . . . . . 21
3.1. Обзор популярных методов XAI . . . . . . . . . . . . . . . 21
3.1.1 Внутренне интерпретируемые методы. . . . . . . . . . 23
3.1.2 Модельно-агностические объяснения . . . . . . . . . . 25
3.1.3 Объяснения на основе примеров. . . . . . . . . . . . . 28
3.2. SHAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.3. LIME . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4. Результаты работы XAI методов . . . . . . . . . . . . . . . 38
Выводы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Приложение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

В настоящее время искусственный интеллект все чаще применяется
для извлечения пользы из различных задач машинного обучения. В послед-
ние годы такие системы стокнулись с проблемой потери “прозрачности”и
понятности, в особенности для конечных пользователей. В этой работе бу-
дут исследованы методы обьяснения искусственного интеллекта на основе
обученной модели для распознавания речи.
XAI или обьяснимый искусственный интеллект, это область ИИ, ко-
торая имеет набор интрументов, алгоритмов и методов, которые могут ге-
нерировать интуитивно понятные и интерпретируемые обьяснения для че-
ловека.
Глубокие нейронные сети используются в системах которые напря-
мую влияют на качество жизни человека. Примерами тому являются здра-
воохранение и беспилотный транпорт. Закрытые системы принятия реше-
ний, называются черными ящиками, и на данный момент не пользуются
доверием у пользователей.[1]
Интерпретируемость глубоких нейронных сетей, область машинного
обучения которая появилась совсем недавно. Результат ее работы нацелен
на лучшее понимание того как модели проводят отбор признаков, а также
получают решения своих задач[2].
Ежегодно публикуется неколько статей-обзоров, с посследними до-
стижениями в этой области, подробробнее остановимся на “Opportunities
and Challenges in Explainable Artificial Intelligence (XAI): A Survey”[1]. Клю-
чевыми этапами развития для таких популярных алгоритмов, как LIME
и SHAP обозначены усовершенствания классических моделей и примене-
ние существующих методов, в новых, неисследованных областях. Приме-
рами новых интерпретаций алгоритмов, могут служить: SLIME, QLIME,
KernelSHAP и др.
Основная сфера иссследования и примения агоритмов обьяснения мо-
делей машинного обучения, это медицина. Алгоритмы отлично себя про-
явлили во многих задачах от работы с изображениями до обработки есте-
ственного языка.[3] В этом исследовании, объединены последние тенденции
XAI и применение его для распознавания эмоций, которые в свою очередь
могут использоваться в медицине для помощи в постановке диагноза для
людей страдающих психическими расстройствами.
Для проведения исследования используется два набора данных. Пер-
вый включает в себя аудиозаписи актеров, разных полов: CREMA-D[4],
RAVDES[5], SAVEE[6], TESS[7]. Второй DAIC-WOZ Database Description
содержит клинические интервью, предназначенные для поддержки диагно-
стики психологических дистресс-состояний, таких как тревога, депрессия
и посттравматическое стрессовое расстройство[8].
Свидетельством того, что это направление набирает обороты, мож-
но связать с запуском первой глобальной конференции, посвященной ис-
ключительно этой развивающейся дисциплине, Международной совмест-
ной конференции по искусственному интеллекту: семинар по объяснимому
искусственному интеллекту (XAI)[9].
Европейский Союз ввел право на объяснение в Общем праве на за-
щиту данных (GDPR) как попытку справиться с потенциальными пробле-
мами, вытекающими из растущей важности алгоритмов. В Соединенных
Штатах страховые компании должны быть в состоянии объяснить свои
решения о ставках.[1] Другим примером является, использование XAI в
колл-центре для классификации звонков в соответствии с эмоциями, в
последствиии это применяется в качестве параметра производительности
для анализа разговоров, таким образом идентифицируя неудовлетворен-
ного клиента, удовлетворенность клиентов и т. д. Примение XAI способно
оказать помощь компаниям в улучшении их услуг. Он также может быть
использован в бортовой системе автомобиля, основанной на информации о
психическом состоянии водителя, которая может быть предоставлена си-
стеме для инициирования его/ее безопасности, предотвращающей несчаст-
ные случаи.[2]
Постановка задачи
Исследование можно разделить на две части:
1) решение задачи классификации распознавания речевых эмоций;
2) использование алгоритма XAI для объяснения результатов.
В первой части используются наборы аудиовизуальных данных: Crema-
D, Ravdess, Savee, Tess. Строим волновые диаграммы и спектограммы, из-
влекаем признаки и строим модель нейронной сети.
Вторая часть включает обьяснение результатов алгоримов XAI и при-
ведение результатов.
Обзор литературы
Работа началась cо знакомства с популярным предшественником объ-
яснимого ИИ, рекомендательными системами. Популярные в 70-80 гг. про-
шлого века, они включали в себя механизм вывода и базу знаний. Область
медицинской диагностики, ощутила на себе в числе первых, где они были
опробованы. Ранней версией экспертной системы была MYCIN, разрабо-
танная в 70х в Стэнфордском университете. MYCIN разрабатывалась для
работы с бактериями, а именно диагностировались те, что вызывают тя-
желые болезни, например, менингит. В том числе изучалось количество
необходимых антибиотиков, для благоприятного исхода болезни. Реализа-
ция была простой и включала в себя ответы «Да» или «Нет» на вопро-
сы медиков, в конце выдавалась рекомендация по дальнейшим действиям.
Система была описана в работе “Rule-based Expert System – The MYCIN
Experiments of the Stanford Heuristic Programming Project”. [10] Одним из
критериев новых систем подразумевалась понятность решений для профес-
сионалов своей области, а не только для IT специалистов.
Например, применение интерпретируемости в медицинских исследо-
ваниях, улучшит работу многих специалистов:
1) практикующие врачи смогут впоследствии использовать эти мето-
ды для рекомендаций в постановке диагнозов;
2) понимание решений ИИ, впоследствии обернется большим количе-
ством идей для реализации в медицинской практике.[11]
Открытыми остаются вопросы: «Кто несет ответственность за непра-
вильный прогноз и лечение?». Тот же вопрос задает автор работы ““Why
Should I Trust You?” Explaining the Predictions of Any Classifier”[12]. В ка-
честве пути решения, автор предлагает побороть недоверие к модели или
прогнозу. В роли инструментов для объяснения результатов, алгоритмы
XAI, дающие понятную интерпретацию работы модели.
Для анализа полученных результатов будут использованы алгоритмы

Построение моделей и умение делать правильные предсказания явля-
ются важнейшими задачами современного мира. В долгосрочной перспек-
тиве нынешние инициативы по искусственному интеллекту состоят в том,
чтобы внести свой вклад в разработку, проектрирование и внедрение ори-
ентирвоанных на человека систем ИИ. Агенты которых сотрудничали бы
с человеком интерпретирумым и объяснимым образом, чтобы обеспечить
принятие справедливых решений, а также их прозрачность. Для достиже-
ния этой цели, одними из инструментов реализации предлагаются алгорит-
мы XAI, а именно SHAP и LIME. Предполагаемая предметная область для
использования инструмента медицинская диагностика.
Первая глава посвящена обзору наборов аудиоданных и выделению
признаков из них.
Вторая глава описывает общую структуру работы нейронной сети
Третья глава формализует методы XAI, далее демонстрируется прак-
тическая часть применения двух алгоритмов обьяснения SHAP и LIME.
LIME – отличный инструмент для объяснения того, что делают клас-
сификаторы (или модели) машинного обучения.Он не зависит от модели,
использует простые и понятные идеи и не требует больших усилий для
запуска.Как всегда, даже при использовании LIME важно правильно ин-
терпретировать вывод.
SHAP – подходит для понимания любых моделей машинного обуче-
ния, а также имеет несколько других плюсов, например, может обьяснить
как индивидуальные результаты, так и общее решение, а также имеет хо-
рошую теоритическую основу из теории игр.
На пути к справедливым и прозрачным моделям, основанным на ИИ,
остатется много открытых вопросов, например как оценка рисков, избега-
ние алгоритмических и социальных предубеждений. Алгоритмы обьясни-
мого ИИ должны нести ответсвенность перед заинтересованными сторона-
ми за свое решение, а также оно должно подчиняться анализу, в котором
должна быть понятна степень прозрачности алгоритма.
Обьяснимые методы ИИ также могут быть использованы для выявле-
ния потенциальных рисков, например проверка модели на справедливость.
Будущее взаимодействие между людьми и машинами имеет важное
значение, для адаптивных обьяснимых моделей важно участие опытных
исследователей из предметной области. Коллективный опыт знания из раз-
личных областей (например, здравоохранение, финансы, медицина, без-
опасность, оборона) могут способствовать дальнейшему развитию иссле-
дований ИИ, ориентированных на человека. Таким образом, существует
необходимость в растущем интересе к междисциплинарным исследовани-
ям для продвижения ориентированного на человека искусственного интел-
лекта, а также XAI в критически важных исследованиях для различных
областей.

[1] Arun Das, Paul Rad Opportunities and Challenges in Explainable Artificial
Intelligence (XAI): A Survey . arXiv:2006.11371, 2020

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Логик Ф. кандидат наук, доцент
    4.9 (826 отзывов)
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские дисс... Читать все
    Я - кандидат философских наук, доцент кафедры философии СГЮА. Занимаюсь написанием различного рода работ (научные статьи, курсовые, дипломные работы, магистерские диссертации, рефераты, контрольные) уже много лет. Качество работ гарантирую.
    #Кандидатские #Магистерские
    1486 Выполненных работ
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Антон П. преподаватель, доцент
    4.8 (1033 отзыва)
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публик... Читать все
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публикуюсь, имею высокий индекс цитирования. Спикер.
    #Кандидатские #Магистерские
    1386 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет