Математика для экономистов - Красс М.С.
ISBN 5-94723-672-9
Скачать (прямая ссылка):
внп^шх A,,J,.
(13.3)
Указанный выбор стратегий называется максиминной со стороны t -го игрока — его выигрыш в любом случае будет не меньше максиминно-го значения (или нижней цены игргн):
h > maxfmin k \;
для 2-го ифока выбранная стратегия называется минимаксной, и его прошрыш не будет превосходить минимаксного значения (или верхней цены игры):
13.1. Элементы теории игр 239
Из алгебры матриц известно, что для произвольной прямоугольной матрицы всегда выполнено неравенство
max^min AyJ < min^max ft„ J. (13.4)
Если верхняя цена игры равна нижней, т. е.
max^min hf J = min ^ max A^-J = Aj1 (13.5)
то значение h' называется ценой игры, а элемент А,у матрицы выигрышей, равный к]-, седловой точкой матрицы Я.
Пример 1. Пусть у игрока 1 две стратегии, а у игрока 2 — три стратегии, причем матрица выигрышей для игрока 1 имеет вид
1-1 О GJ
Найти седловук! точку матрицы И, т. с. определить цену игры.
Решение. Выбор игрока 1 — это первая строка матрицы Я, поскольку при выборе 2-й строки игрок 2 будет придерживаться стратегии проигрыша первого игрока, равного -1. Согласно критерию (13.2), игрок 1 придерживается своей первой стратегии, обеспечивающей ему выигрыш, равный I. Игрок 2 рассматривает свои худшие варианты при условии выбора игроком 1 своей первой стратегии — строки 1 матрицы -Я:
-3 -1 -5^ 1 0 -6/
Игрок 2, согласно критерию (13.3), выберет свою їлорую стратегию, соответствующую второму столбцу матрицы -Н, т. е. когда его проигрыш минимален и равен 1. Таким образом, седловой точкой матрицы выигрышей является элемент А1г= 1.
Следует заметить, что не всегда существует седловая точка матрицы выигрышей, а значит, не всегда есть выбор макснмннной стратегии или решение матричной игры в чистых стратегиях: Тогда для каждого из игроков становится важным, чтобы соперник не угадал выбора его стратегии. В таком случае используются смешанные стратегии, при которых реализуется схема случайного выбора чистой стратегии.
240 Глава 13. Методы расчета рисковых ситуаций в экономике
Эта схема представляет собой вероятностные распределения па множестве стратегий игроков 1 и 2, задаваемые, соответственно, векторами р н Tj:
?/>. =i. 2>=1- С13.6>
На множестве смешанных стратешй игрок 1, стремящийся достичь наибольшего из гарантированных выигрышей, выбирает вектор вероятностей р так, чтобы получить максимум минимальных значении ижидаемых выигрышей, т. с, решает задачу макснмина математического ожидания
M=J)Hf1 (13.7)
т. е. поиск вектора р * такого, что
M1 = M(P") = max min р II qT. (13.8)
Соответственно, игрок 2 решает задачу мннимакса математического ожидания р H <?т — поиск вектора q * такого, что
M11 = Af (?*) = min max р H q1. (13.9)
В соотношениях (13.8) и (13.9) верхний индекс ->т*> означает транспонирование. В теории игр фундаментальной является теорема имшш-максе, согласно которой задачи (13.8) и (13.9) для игроков 1 и 2 всегда имеют решение для любой матрицы выигрышей II, причем
W1 = м, =ма.
Как и для случая решения в чистых стратегиях, стратегия р * игрока 1 называется максиминной стратегией, стратегия q игрока 2 называется минимаксной стратегией, а значение Мя — ценой игры.
Пример 2. Найти решение игры, имеющей платежную матрицу
и J'2
{ 3 -4
Решение. Нетрудно увидеть, что данная матрица не имеет седловой точки, так как M1 = -2, а = 3 и критерий (13.5) не выполнен. Следовательно, данная игра имеет решение в смешанных стратегиях. Пусть оптимальные стратегии игроков определяются, соответственно, векторами вероятностей р=(р|Г р.) и q =(qr q2), компоненты которых удовлетворяют условиям нормировки
Pi + Рз = L <7, + 4-і =
13.1, Элементы теории игр 241
Согласно формуле (13.7), функция выигрыша имеет вил
Л/ = q,(-2р, +Zp1) + <?;(Зр, - Ар, ).
Поскольку, согласно критеріпо (13.8), ищется максимум функции выигрыша для 1-го игрока, то в силу теоремы о мпнимаксе, подставляя в это равенство вместо M значение Ма, получаем, что для оптимальных вероятностей /j, и P2 должно быть выполнено равенство
С учетом второго нормировочного условия имеем, ЧТО M11 = = (q, -і- п.) M1,. и тогда подстановка в последнее равенство дает
q,(-2p, +Ip1 -MJ + qXip,-4р, -AfJ = O. Поскольку это равенство должно выполняться для произвольных положительных q, и фг, то отсюда необходимо получаем, что
-2/>, + Зр2 = 3/J, -Ap1.
Совместное решение этого уравнения с нормировочным условием для P1 и р-, приводит к решению для оптимальной стратегии первого трока: р, =7/12, ра =5/12. Аналогичные рассуждения применительно ко второму игроку приводят к получению оптимальных вероятностей: г/, =7/\2,q? =5/12. Подстановка вычисленных оптимальных вероятностей смешанных стратегий в функцию выигрыша дает цену игры: Mn = 1/12, Именно такую величину выигрыша при использовании своей оптимальной стратегии получает первый игрок независимо от того, какой стратегии придерживается второй игрок. Верно и другое: если второй игрок будет придерживаться своей оптимальной стратегии, го независимо от игры его соперника результат игры будет таким же.