Решение задачи длительной эксплуатации нескольких ресурсов методами дифференциальных игр
Работа посвящена изучению математических моделей управления ресурсами с многомерной фазовой переменной. Рассматриваются два типа ресурсов: вложения в рекламную кампанию различными фирмами – в главе 2, и объемы выпуска продукции, пропорциональные объемам вредных выбросов в окружающую среду – в главе 3. Показывается, что и в случае кооперации игроков при нахождении оптимального управления, и в некооперативной постановке игры, в случае нахождения равновесия по Нэшу, в классе позиционных стратегий решение определяется неединственным образом. Рассматриваются два метода для отбора допустимых решений: математический подход и экономический критерий. Также, в случае кооперативной постановки задачи находится распределение общего выигрыша между игроками в соответствии с вектором Шепли, а затем распределение его компонент во времени согласно процедуре распределения дележа (ПРД). В четвертой главе строится дифференциальная игра на сети для модели управления выбросами, где находится решение коалиционной игры.
Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Основные цели и задачи . . . . . . . . . . . . . . . . . . . . . . 6
Обзор литературы . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1. Основные методы . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.1. Постановка задачи оптимального управления . . . . . . . . 11
1.2. Критерии отбора допустимых решений в случае их неедин-
ственности . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.2.1. Экономический критерий Басса . . . . . . . . . . . . 12
1.2.2. Математический метод для линейно-квадратичных за-
дач оптимизации . . . . . . . . . . . . . . . . . . . . . 13
1.3. Принцип оптимальности в кооперативной игре . . . . . . . . 14
1.3.1. Дележ. Вектор Шепли . . . . . . . . . . . . . . . . . 14
1.3.2. Принцип динамической устойчивости. Процедура рас-
пределения дележа . . . . . . . . . . . . . . . . . . . . 15
1.4. Дифференциальная игра на сети . . . . . . . . . . . . . . . . 16
2. Теоретико-игровая модель управления инвестициями в
рекламу . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Кооперативный случай . . . . . . . . . . . . . . . . . . . . . 20
2.3. Применение критериев для отбора допустимых решений . . 22
2.3.1. Математический метод для линейно-квадратичных за-
дач оптимизации . . . . . . . . . . . . . . . . . . . . . 22
2.3.2. Экономический критерий Басса . . . . . . . . . . . . 23
2.4. Распределение кооперативного выигрыша . . . . . . . . . . . 24
3. Теоретико-игровая модель управления объемами вредных
выбросов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2. Равновесие по Нэшу . . . . . . . . . . . . . . . . . . . . . . . 28
3.2.1. Применение критериев для отбора допустимых решений 33
3.3. Модификация модели . . . . . . . . . . . . . . . . . . . . . . 34
3.3.1. Графическая интерпретация . . . . . . . . . . . . . . 36
3.4. Кооперативный случай . . . . . . . . . . . . . . . . . . . . . 37
3.4.1. Графическая интерпретация . . . . . . . . . . . . . . 39
3.4.2. Распределение кооперативного выигрыша . . . . . . 41
4. Сетевая дифференциальная игра управления объемами
вредных выбросов . . . . . . . . . . . . . . . . . . . . . . . . 42
4.1. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . . 42
4.2. Функции выигрыша . . . . . . . . . . . . . . . . . . . . . . . 43
4.3. Решение коалиционной игры . . . . . . . . . . . . . . . . . . 44
Вывод . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Заключение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Список литературы . . . . . . . . . . . . . . . . . . . . . . . . . 50
В настоящее время модели управления ресурсами имеют широкое
применение в таких важных областях как экономика и экология, поскольку
позволяют решать актуальные проблемы.
Грамотная рекламная политика является основным методом привле-
чения целевой аудитории, и, как следствие, неотъемлемой частью успешно-
го функционирования компании, поэтому вопрос об управлении инвестици-
ями в рекламную кампанию становится актуальным. Также как и вопрос
об управлении объемами вредных выбросов в окружающую среду в связи
с современной неблагоприятной экологической ситуацией.
В данной работе исследуются теоретико-игровые модели управления
ресурсами с многомерной фазовой переменной на бесконечном временном
промежутке с постоянной ставкой дисконтирования. В качестве ресурсов
рассматриваются инвестиции в рекламу и количество выбросов в окружа-
ющую среду.
В первой главе приводятся основные модели и методы, используе-
мые в ВКР. Формулируется постановка задачи оптимального управления
на бесконечном промежутке времени с интегральной формой выигрыша
и дисконтированием подынтегральной функци, рассматривается метод ее
решения, а также критерии для отбора допустимых решений. Поиск оп-
тимальных управлений в кооперативной дифференциальной игре также
может быть описан в форме задачи оптимального управления, поскольку
игроки объединяются с целью максимизации общего суммарного выигры-
ша.
Проблема распределения суммарного выигрыша между игроками, в
том числе, с учетом фактора времени, описана с точки зрения пробле-
мы динамической устойчивости. Распределение компонент дележа игро-
ков предлагается осуществить согласно процедуре распределения дележа
(ПРД).
Кроме того, в главе I формализуется постановка сетевой дифферен-
циальной игры.
Во второй главе изучена кооперативная дифференциальная игра управ-
ления инвестициями в рекламную кампанию для случая n симметричных
игроков, которые конкурируют за объем собственных продаж некоторого
однородного продукта с учетом амортизации, свойственной рынку. В тре-
тьей главе предложена модель управления объемами вредных выбросов
при производстве взаимозаменяемых товаров для двух симметричных иг-
роков при отсутствии абсорбции. Дифференциальная игра изучается как в
кооперативной постановке, для которой также находится распределение об-
щего выигрыша игроков, так и в некооперативной, в которой рассматрива-
ется вопрос существования квадратичного решения задачи. Показывается,
что решение в обеих моделях является неединственным, поэтому осуществ-
ляется отбор допустимых решений с помощью критериев, предложенных
в первой главе. В главах II и III также изучается проблема динамической
устойчивости, т.е. реализации при долгосрочном процессе. Для решения
данной проблемы используются схемы ПРД из главы I.
В последней главе математическая модель управления вредными вы-
бросами формулируется как дифференциальная игра на сети, в которой
находится равновесие по Нэшу.
Основные цели и задачи
В ходе проделанной работы были рассмотрены модели управления
в дифференциальных играх двумя типами ресурсов: инвестирование в ре-
кламу (в кооперативной постановке для n игроков) и выбросы в окружа-
ющую среду (в кооперативной и некооперативной постановке для двух иг-
роков).
Показано, что уравнение Гамильтона–Якоби–Беллмана имеет неедин-
ственное решение, которое требует изучения для отбраковки несостоятель-
ных решений. В ходе применения экономического критерия и классическо-
го метода, используемого для линейно-квадратичных задач оптимизации
(LQR), было установлено:
дифференциальная игра управления рекламой имеет допустимое ре-
шение, которое удовлетворяет обоим критериям;
игра управления вредными выбросами в некооперативной постановке
не имеет решений в указанных классах функций, полученные результаты
также были проинтерпретированы графически.
Кроме того, в случае кооперативной постановки задачи в рассмат-
риваемых моделях было найдено распределение общего выигрыша меж-
ду игроками в соответствии с выбранными принципами оптимальности, а
именно, вектором Шепли, а затем распределение его компонент во времени
согласно процедуре распределения дележа (ПРД).
Также для модели управления выбросами была построена диффе-
ренциальная игра на сети для трех игроков. Выражения для управлений
игроков в коалиционной игре были получены в аналитическом виде.
Таким образом, поставленные цели и задачи были достигнуты.
[1] Беллман Р. Динамическое пргораммирование М.:И.Л., 1960.
[2] Красовский Н. Н., Субботин А. И. Позиционные дифференциальные иг-
ры. М.: Наука, 1974. 455 с.
[3] Frutos J., Martin-Herran G. Selection of a Markov perfect Nash equilibrium
in a class of differential games. Dynamic Games and Applications. Vol. 8,
№ 3. 2018. P. 620–636.
[4] Fershtman C., Nitzan S. Dynamic voluntary provision of public goods.
European Economic Review. Vol. 35, № 5. 1991. P. 1057–1067.
[5] Wirl F. Dynamic voluntary provision of public goods: extension for nonlinear
strategies. European Journal of Political Economy. Vol. 12, № 3. 1996.
P. 555–560.
[6] Dockner E. J. Optimal pricing in a dynamic duopoly game model. Zeitschrift
fur Operations Research. Basar T. Informationally nonunique equilibrium
solutions in differential games. 1985. P. 1–16.
[7] Leitmann G., and Schmitendorf W. E. Profit maximization through
advertising: nonzero-sum differential game approach. IEEE Transactions on
Automatic Control. Vol. 23, № 4. 1978. P. 645–650.
[8] Basar T. Informationally nonunique equilibrium solutions in differential
games. SIAM Journal on Control and Optimization. Vol. 15, № 4. 1977.
P. 636—660.
[9] Driskill R. Durable goods monopoly, increasing marginal cost and
depreciation. Economica. Vol. 64, № 253. 1997. P. 137—154.
[10] Cartigny P., Michel P. On the Selection of One Feedback Nash Equilibrium
in Discounted Linear-Quadratic Games. Journal of Optimization Theory
and Applications. Vol. 117, № 2. 2003. P. 231—243.
[11] Громова Е. В., Громов Д. В., Лахина Ю. Э. О дифференциальной игре
управления инвестициями в рекламную кампанию. Труды института
математики и механики УРО РАН. Т. 24, № 2. 2018. С. 64–75.
[12] Петросян Л. А., Зенкевич H. А., Шевкопляс Е. В. Теория игр. СПБ.:
Изд-во БХВ-Петербург, 2012. 432 с.
[13] Жуковский В. И., Чикрий A. А. Линейно-квадратичные дифференци-
альные игры. Киев: Науковая думка, 1994. 320 с.
[14] Olsder G. G., Basar T. Dynamic Noncooperative Game Theory, 2nd
Edition. New York: Academic Press, 1999. 519 p.
[15] Dockner E. J., Jorgensen S., Long N. V., Sorger G. Differential Games
in Economics and Management Science. Cambridge: Cambridge University
Press, 2000. 396 p.
[16] Jorgensen S., Zaccour G. Differential Games in Marketing. Boston: Kluwer
Academic Publisher. 2004. 159 p.
[17] Papavassilopoulos G., Olsder G. J. On the linear-quadratic, closedloop, no-
memory Nash game. Journal of Optimization Theory and Applications. Vol.
42, № 4. 1984. P. 551—560.
[18] Reddy P. V., Zaccour G.: Feedback Nash equilibria in linear-quadratic
difference games with constraints. IEEE Transactions on Automatic Control.
Vol. 62, № 2. 2017. P. 590—604.
[19] Шевкопляс Е. В. Устойчивая кооперация в дифференциальных играх
со случайной продолжительностью. УБС, 31.1. 2010. С. 162—190.
[20] Singh R., Wisznieszka-Matyszkiel A. Linear-quadratic game of exploitation
of common renewable resources with inherent constraints. Topological
Methods in Nonlinear Analysis. Vol. 51, № 1. 2018. P. 23—54.
[21] Dockner E.J., Sorger G.: Existence and properties of equilibria for a
dynamic game on productive assets. J. Economic Theory. Vol. 71, № 1.
1996. P. 209—227.
[22] Singh R., Wisznieszka-Matyszkiel A.: Discontinuous Nash Equilibria in a
Two Stage Linear-Quadratic Dynamic Game with Linear Constraints. IEEE
Transactions on Automatic Control. Vol. 64, № 7. 2018. P. 3074–3079.
[23] Kononenko A.: The structure of the optimal strategy in controlled dynamic
systems. USSR Computational Mathematics and Mathematical Physics.
Vol. 20, № 5. 1980. P. 13–24.
[24] Malafeev O.: Stationary strategies in differential games. USSR
Computational Mathematics and Mathematical Physics. Vol. 17, № 1. 1977.
P. 37–46.
[25] Basar T.: On the uniqueness of the Nash solution in linear-quadratic
differential games. International Journal of Game Theory. Vol. 5, № 2-3.
1976. P. 65—90.
[26] Gromova E., Lakhina Yu. On the selection of the Nash equilibria in a
linear-quadratic differential game of pollution control. Frontiers of Dynamic
Games. Ed. by L. Petrosyan, V. Mazalov, N. Zenkevich. St. Petersburg.
2018. P. 37–48.
[27] Bass F. M., Krishnamoorthy A., Prasad A., Sethi S. P. Generic and brand
advertising strategies in a dynamic duopoly. Marketing Science. Vol. 24, № 4.
2005. P. 556–568.
[28] Александров А. Г. Оптимальные и адаптивные системы: Учеб. пособие
для вузов по спец. «Автоматика и упр. в техн. системах». М.: Высшая
школа, 1989. 263 с.
[29] Петросян Л. А. Кооперативные дифференциальные игры на сетях. Тр.
Ин-та математики и механики УрО РАН. Т. 16, № 5, 2010. С. 143–150.
[30] Мазалов В. В. Математическая теория игр и приложения. Спб.: Изд-во
Лань, 2010. 448 с.
[31] Жабко А. П., Котина Е. Д., Чижова О. Н. Дифференциальные уравне-
ния и устойчивость. Спб.: Изд-во Лань, 2015. 310 с.
[32] Лахина Ю. Э. Оптимальное управление инвестициями в рекламу на
рынке однородной продукции. Процессы управления и устойчивость.
2018. Т. 5. № 1. С. 470–474.
[33] Лахина Ю. Э. О существовании равновесия по Нэшу в некооператив-
ной дифференциальной игре управления объемами вредных выбросов.
Процессы управления и устойчивость. 2020.
[34] Лахина Ю. Э. Оптимальное управление в задаче эксплуатации
нескольких ресурсов. Архив открытого доступа Санкт-Петербургского
государственного университета. 2018. 45 с.
Последние выполненные заказы
Хочешь уникальную работу?
Больше 3 000 экспертов уже готовы начать работу над твоим проектом!