Извлечение и неизбыточное представление закономерностей в многомерных данных

Катаева, Алина Владимировна

Введение …………………………………………………………………… 4
Глава 1 Зависимости между данными как основа повышения эффективности клинической диагностики……………………………… 11
1.1 Методы интеллектуального анализа данных в медицинских аналитических системах клинической диагностики …………… 11
1.2 Специфика медицинских данных ………………………………. 15
1.3 Виды зависимостей между данными и методы их извлечения… 18
1.4 Выводы по главе 1………………………………………………… 20
Глава 2 Построение неизбыточного минимаксного базиса строгих ассоциативных правил…………………………………………………… 22
2.1 Анализ формальных понятий и ассоциативные правила……… 23
2.2 Задача извлечения ассоциативных правил и проблема числа правил ……………………………………………………………… 30
2.3 Метод построения неизбыточного минимаксного базиса
строгих ассоциативных правил…………………………………… 34
2.4 Алгоритм MClose построения неизбыточного минимаксного базиса строгих ассоциативных правил………………………….. 42
2.5 Экспертная группировка признаков как дополнительный
прием сокращения числа ассоциативных правил……………… 48
2.6 Выводы по главе 2………………………………………………… 50
Глава 3 Средства снижения размерности матрицы «объектпризнак».. 52
3.1 Снижение размерности признакового пространства …………. 53
3.2 Снижение числа анализируемых объектов……………………… 57
3.3 Алгоритм ELIMINATION………………………………………… 58
3.4 Выводы по главе 3………………………………………………… 62
Глава 4 Программное обеспечение и результаты экспериментальных исследований……………………………………………………………… 63
4.1 Состав программных модулей и схема их взаимодействия…… 63
4.2 Анализ диагностики наркозависимости с применением ассоциативных правил…………………………………………… 70
4.3 Оценка результативности средств снижения размерности
матрицы «объектпризнак»……………………………………… 76
4.4 Выводы по главе 4………………………………………………… 83
Заключение ……………………………………………………………….. 84 Список литературы ………………………………………………………. 86

Актуальность темы исследования. Современные методы интеллекту- ального анализа данных ориентированы на исследование многомерных и разнотипных данных с целью выявления знаний в виде закономерностей. Значительный вклад в развитие интеллектуального анализа данных внесли российские ученые: Ю.И. Журавлев (алгебраическая теория распознавания), Г.С. Лбов (логические методы распознавания), К.В. Рудаков (алгебраический синтез корректных алгоритмов), В.Н. Вапник, А.Я. Червоненкис (статистиче- ская теория обучения), Н.Г. Загоруйко (когнитивный подход, FRiS-функции), С.О. Кузнецов, М.И. Забежайло (оценки сложности ДСМ-процедур) и др.
Средством описания причинно-следственных закономерностей в мно- гомерных данных, представленных матрицей «объектпризнак», служат ас- социативные правила, отражающие, какие признаки, события или явления появляются вместе и насколько часто это происходит. Широкий интерес к этому классу закономерностей начался со статьи R. Agrawal, T. Imielinski, A. Swami, опубликованной в 1993 году, и с тех пор ежегодно появляются не- сколько сотен публикаций, содержащих новые методы и алгоритмы извлече- ния ассоциативных правил. Для многих приложений наиболее значимы стро- гие ассоциативные правила – правила с единичной достоверностью. Напри- мер, они широко востребованы при решении задач клинической диагностики. В национальном проекте «Электронное здравоохранение», утвержденном Президиумом Совета при Президенте Российской Федерации по стратегиче- скому развитию и приоритетным проектам (протокол No 9 от 25.10.2016 г.) отмечается, что для повышения эффективности оказания медицинской по- мощи гражданам необходимо широкое внедрение в организации здравоохра- нения новейших лечебно-диагностических информационных технологий, ба- зирующихся на интеллектуальном анализе данных [73].
В настоящее время практическое применение ассоциативных правил (АП) во многом ограничивается проблемой размерности [2, 7, 17, 22]. Число
5
АП, извлекаемых современными методами анализа данных, часто достигает несколько десятков тысяч. Это существенно усложняет их интерпретацию и снижает степень доверия пользователя к полученным результатам. Для ре- шения данной проблемы применяются два подхода: фильтрация с помощью мер значимости и когнитивный подход. Меры значимости позволяют чис- ленно оценивать достоверность и поддержку АП и предъявлять пользовате- лю только те из них, для которых значения мер значимости превышают уста- новленные пороговые значения. Когнитивный подход предполагает создание базисов как «сжатых» форм представления множества искомых АП. Между тем, оба подхода не исключают появление в результирующем множестве из- быточных правил. Ассоциативное правило принято считать избыточным, ес- ли его удаление из множества выявленных правил не приводит к потере ин- формации об ассоциациях между анализируемыми данными. Формальное определение избыточности предполагает уточнение, какая именно информа- ция не должна быть утеряна. Для строгих АП такой информацией, прежде всего, служит уровень или порог поддержки  величина, характеризующая минимальную представительность этих правил в анализируемых данных.
Степень разработанности темы исследования. На сегодняшний день наиболее развиты методы формирования базисов строгих АП. В них под ба- зисом понимается минимальное в некотором смысле множество строгих АП с заданным уровнем поддержки. Особого внимания заслуживают методы и алгоритмы построения канонического и минимаксного базисов, основанные на алгебраическом подходе, разработанном группой ученых под руково- дством Р. Вилле и известном в литературе как анализ формальных понятий [95, 116, 117].
Канонический базис (базис Дюкена-Гига) создается из минимального числа строгих ассоциативных правил, рекуррентно задаваемых в терминах псевдосодержаний. Этот базис достаточно полно изучен в работах B. Ganter, V. Duquenne, S. Rudolph, С.О. Кузнецова, С.А. Объедкова [95, 107109, 112, 116, 120, 128].

6
Минимаксный базис формируется из строгих АП, имеющих минималь- ную посылку и максимальное следствие. Именно такие АП интересны для клинической диагностики, поскольку каждое из них может определять ми- нимальный набор симптомов заболевания и максимальный набор признаков, задающих его последствия. Другой аргумент в пользу выбора минимаксного базиса для клинической диагностики – это наличие хорошо апробированных практикой алгоритмов его построения. В их числе различные версии алго- ритма Close, представленные и изученные в работах M.J. Zaki, C.J. Hsiao, T. Uno, T. Asai, Y. Uchida, H. Arimura [93, 114, 127, 132].
Вычислительные эксперименты показали, что канонические и мини- максные базисы могут содержать избыточность, устранение которой – это дополнительный шаг, позволяющий сокращать число строгих АП, предъяв- ляемых пользователю для интерпретации. С этой целью представляет инте- рес использование выводимостей Армстронга [83]. Известно, что строгие АП подчиняются шести выводимостям Армстронга, которые позволяют порож- дать из одних правил другие правила [60]. Однако в общем случае выводи- мости Армстронга не гарантируют сохранение заданного уровня поддержки (далее кратко сохранение поддержки). Как отмечали в своих работах J.L. Balcazar, N. Pasquier, Y. Bastide, R. Taouil и L. Lakhal, именно этим огра- ничивалось применение выводимостей Амстронга для базисов строгих АП [87,115]. Поэтому актуальны исследования выводимостей Амстронга с по- мощью анализа формальных понятий и выявление среди них тех, которые сохраняют поддержку АП, и с помощью которых можно устранять избыточ- ность в минимаксном базисе при его построении, а далее при необходимости порождать из него строгие АП с сохранением поддержки.
Цель и задачи. Целью диссертационной работы является повышение эффективности анализа данных при решении задач клинической диагностики путем установления для строгих ассоциативных правил набора выводимо- стей, гарантирующих сохранение поддержки, и разработка на их основе ма- тематического и программного обеспечения.

7
Поставленная цель достигается путем решения следующих задач:
1. Установить свойства строгих ассоциативных правил и получить на- бор выводимостей, гарантирующих сохранение поддержки этих правил. Раз- работать и теоретически обосновать метод построения неизбыточного мини- максного базиса строгих ассоциативных правил.
2. Разработать алгоритм, реализующий метод построения неизбыточно- го минимаксного базиса строгих ассоциативных правил.
3. Сформировать набор средств снижения размерности матрицы «объ- ектпризнак», позволяющих уменьшать число искомых ассоциативных пра- вил.
4. Разработать программное обеспечение, реализующее алгоритмы вы- явления строгих ассоциативных правил, построения неизбыточного мини- максного базиса, а также снижения размерности матрицы «объектпризнак».
5. Провести экспериментальные исследования по оценке результатив- ности разработанных метода, алгоритмов и программ на медицинских дан- ных.
Научная новизна.
1. Разработан и теоретически обоснован новый метод построения неиз- быточного минимаксного базиса строгих ассоциативных правил. В отличие от существующих метод позволяет устранять ту избыточность в минимаксном базисе, которые не способны удалять другие методы, сохра- няя при этом поддержку строгих ассоциативных правил.
2. Разработан новый алгоритм извлечения строгих ассоциативных пра- вил и представления их в форме неизбыточного минимаксного базиса. Алго- ритм расширяет возможности известного алгоритма Close путем включения в него процедур по удалению из искомого множества зависимостей тех ассо- циативных правил, которые распознаны как избыточные, без дополнительно- го обращения к анализируемому набору данных.

8
Методы исследования. Для решения поставленных в работе задач ис- пользовались методы анализа формальных понятий, статистические методы и методы объектно-ориентированного программирования.
Теоретическая значимость работы. Предложенный в работе метод построения неизбыточного минимаксного базиса быть использован для даль- нейшего развития раздела интеллектуального анализа данных, связанного с извлечением закономерностей в данных и устранением избыточности в их представлении.
Практическая значимость работы. Применение результатов диссер- тационной работы в практическом здравоохранении позволяет повысить уро- вень информатизации клинической работы врачей, содействует верной и оперативной диагностике заболеваний. Результаты диссертационной работы могут быть также применены для тех приложений, где требуется высокая степень достоверности установленных ассоциативных правил и важна их «сжатая» форма представления, например, в информационной безопасности и анализе компьютерных сетей.
Положения, выносимые на защиту.
1. Доказательство выводимостей Армстронга с помощью анализа фор- мальных понятий и установление среди них тех выводимостей, которые со- храняют поддержку строгих ассоциативных правил.
2. Метод построения неизбыточного минимаксного базиса строгих ас- социативных правил.
3. Алгоритм формирования неизбыточного минимаксного базиса стро- гих ассоциативных правил, устраняющего избыточность из минимаксного базиса в процессе его построения без дополнительного обращения к анализи- руемому набору данных.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Помогаем с подготовкой сопроводительных документов

    Совместно разработаем индивидуальный план и выберем тему работы Подробнее
    Помощь в подготовке к кандидатскому экзамену и допуске к нему Подробнее
    Поможем в написании научных статей для публикации в журналах ВАК Подробнее
    Структурируем работу и напишем автореферат Подробнее

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Родион М. БГУ, выпускник
    4.6 (71 отзыв)
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    Высшее экономическое образование. Мои клиенты успешно защищают дипломы и диссертации в МГУ, ВШЭ, РАНХиГС, а также других топовых университетах России.
    #Кандидатские #Магистерские
    108 Выполненных работ
    Екатерина П. студент
    5 (18 отзывов)
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно... Читать все
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно занимаюсь английским языком, уровень владения - Upper-Intermediate.
    #Кандидатские #Магистерские
    39 Выполненных работ
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Сергей Е. МГУ 2012, физический, выпускник, кандидат наук
    4.9 (5 отзывов)
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым напра... Читать все
    Имеется большой опыт написания творческих работ на различных порталах от эссе до кандидатских диссертаций, решения задач и выполнения лабораторных работ по любым направлениям физики, математики, химии и других естественных наук.
    #Кандидатские #Магистерские
    5 Выполненных работ
    Екатерина С. кандидат наук, доцент
    4.6 (522 отзыва)
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    Практически всегда онлайн, доработки делаю бесплатно. Дипломные работы и Магистерские диссертации сопровождаю до защиты.
    #Кандидатские #Магистерские
    1077 Выполненных работ
    Юлия К. ЮУрГУ (НИУ), г. Челябинск 2017, Институт естественных и т...
    5 (49 отзывов)
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - ин... Читать все
    Образование: ЮУрГУ (НИУ), Лингвистический центр, 2016 г. - диплом переводчика с английского языка (дополнительное образование); ЮУрГУ (НИУ), г. Челябинск, 2017 г. - институт естественных и точных наук, защита диплома бакалавра по направлению элементоорганической химии; СПХФУ (СПХФА), 2020 г. - кафедра химической технологии, регулирование обращения лекарственных средств на фармацевтическом рынке, защита магистерской диссертации. При выполнении заказов на связи, отвечаю на все вопросы. Индивидуальный подход к каждому. Напишите - и мы договоримся!
    #Кандидатские #Магистерские
    55 Выполненных работ

    Последние выполненные заказы

    Другие учебные работы по предмету

    Расширенное суперпиксельное представление изображений для их обработки и анализа
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод восстановления динамических изображений на основе оптимальной интерполяции
    📅 2022год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»
    Метод конверсационного анализа неструктурированных текстов социальных сетей
    📅 2021год
    🏢 ФГАОУ ВО «Самарский национальный исследовательский университет имени академика С.П. Королева»