Критерии Байеса и Лапласа для оценки выигрышей в теории игр с природой

Автор работы: Пользователь скрыл имя, 25 Октября 2011 в 18:50, практическая работа

Краткое описание

Содержание работы

Введение 3
Теоретическая часть 4
Практическя часть 11
Заключение 13
Список используемой литературы 14

Скачать целиком (75.58 Кб) Сколько стоит заказать работу?

Содержимое работы - 1 файл

ТПР.doc

— 255.00 Кб (Скачать файл)

Федеральное Государственное Общеобразовательное Учреждение Высшего Профессионального Образования

“Финансовая Академия при Правительстве РФ”

Кафедра “Математическое моделирование экономических процессов”

Теоретико-практическая работа

на тему:

Критерии Байеса и Лапласа для оценки выигрышей в теории игр с природой.

Выполнила

Бучинчик Анна,

У2-3

Научный руководитель:

д.ф-м.н., профессор

Михеев Игорь Михайлович

Москва

2010

Содержание

Введение

В экономической практике во многих задачах принятия решений существенно важным элементом является неопределенность особого вида, не связанная с сознательным целенаправленным противодействием противника и заключающаяся в недостаточной информированности лица, принимающего решение, об объективных условиях, в которых будет приниматься решение, как это представлено в антагонистических играх. Неопределенность такого рода может порождаться различными причинами: нестабильность экономической ситуации, покупательский спрос на товар конкретного вида, меняющийся объем перевозок, рыночная конъюнктура, политика правительства, надежность партнера, выход из строя технического оборудования, курс валюты, уровень инфляции, налоговая политика, биржевая ситуация, экологическая обстановка, стихийные бедствия и др.

Во всех задачах такого рода выбор решения зависит от объективной действительности, называемой в математической модели ''природой ". Сама же математическая модель подобных ситуаций называется "игрой с природой ".

Таким образом, в игре с природой осознанно действует только один игрок, а именно, лицо, принимающее решение, которое будет обозначаться через А. Природа, обозначим ее через П, является вторым игроком, но не противником игрока А, ибо она не действует осознанно против игрока А, а принимает неопределенным образом то или иное свое состояние, не преследуя конкретной цели и безразлично к результату игры.

Теоретическая часть

Рассмотрим игру с природой, в которой статистик-игрок А имеет т возможных стратегий , а природа П может пребывать в одном из п своих состояний . Совокупность формируется либо на основе имеющегося опыта анализа состояний природы, либо в результате предположений и интуиции экспертов.

Предположим, что статистик может оценить последствия применения каждой своей чистой стратегии , в зависимости от каждого состояния природы П, т. е. статистику известен численный результат при выборе каждой стратегии , , и при каждом состоянии природы , . Тогда игру с природой можно задать платежной матрицей размера

	П₁	П₂	…	П_n
А₁	a₁₁	a₁₂	…	a_1n
А₂	a₂₁	a₂₂	…	a_2n
…	…	…	…	…
А_m	a_m1	a_m2	…	a_mn

(1)

А=

Данная матрица содержательно отличается от матрицы антагонистической игры тем, что элементы столбцов не являются проигрышами природы при соответствующих ее состояниях.

Задача выбора игроком А чистой или смешанной стратегии, более эффективной, чем остальные, в игре с природой, с одной стороны, проще аналогичной задачи в антагонистической игре, поскольку в игре с природой отсутствует с ее стороны систематическое противодействие игроку А, а с другой стороны, эта задача осложняется наличием неопределенности, связанной с дефицитом осведомленности игрока А о характере проявления состояний природы.

Если какая-нибудь из стратегий игрока А окажется доминирующей каждую из остальных его стратегий, то она и должна выбираться игроком А в качестве предпочтительной, поскольку его выигрыш при этой стратегии и при любом состоянии природы П не меньше выигрыша при любой из остальных стратегий.

Если же матрица игры не обладает указанным свойством, т.е. у игрока А нет стратегии, доминирующей каждую из остальных его стратегий, то нужно посмотреть, нет ли у него доминируемых или дублирующих стратегий. При наличии таковых соответствующие им строки матрицы можно удалить, уменьшив тем самым ее размерность.

Таким образом, в играх с природой можно и полезно пользоваться принципом доминирования стратегий игрока А (строк матрицы игры). Однако принцип доминирования стратегий (состояний) природы (столбцов матрицы игры) недопустим, поскольку природа не выбирает свои состояния с целью по возможности большего уменьшения выигрышей игрока А, для нее нет более или менее эффективных состояний. Это обстоятельство является еще одним свойством, отличающим игры с природой от антагонистических матричных игр.

При решении вопроса о выборе возможной стратегии в игре с природой игрок А должен исходить из матрицы выигрышей. Однако матрица выигрышей не всегда адекватно отражает имеющуюся ситуацию. На выбор стратегии должны влиять не только выигрыши, составляющие матрицу игры, но и показатели "удачности" или "неудачности" выбора данной стратегии при данном состоянии природы и благоприятности этого состояния для увеличения выигрыша.

Показателем благоприятности состояния П_j природы П для увеличения выигрыша называется наибольший выигрыш при этом состоянии, т.е. наибольший элемент в j-столбце матрицы игры:

(2)

Таким образом, благоприятность состояния природы рассматривается как фактор, благоприятствующий увеличению выигрыша игрока А при этом состоянии природы.

Предположим, что решая вопрос оптимизации стратегии игры нам известны не только состояния , в которых может находиться природа П, но и соответствующие вероятности , с которыми природа П реализует эти состояния. Задача принимает вид задания, сопряженного с риском

Показателем эффективности стратегии по критерию Байеса относительно выигрышей называется математическое ожидание выигрыша i-строки с учетом вероятностей всех возможных состояний природы. Если обозначить среднее значение через , то получится формула

(4)

Оптимальной среди чистых стратегий по критерию Байеса относительно выигрышей считается стратегия с максимальным показателем эффективности (4), т.е. с максимальным средним выигрышем

. (5)

Выбранное решение является оптимальным не по каждому параметру в отдельности, а в усредненном значении данных параметров

Рассмотрим показатель эффективности по критерию Байеса относительно выигрышей относительно смешанных стратегий игрока А.

Пусть некоторая смешанная стратегия игрока А, при которой чистая стратегия используется им с вероятностью . Тогда выигрыш игрока А при смешанной стратегии и при состоянии природы будет равен

. (6)

Показателем эффективности смешанной стратегии по критерию Байеса относительно выигрышей будет являться среднее значение выигрышей (6) с учетом известных нам вероятностей состояний природы. Обозначим этот показатель через .

Используя (4), можно вывести формулу:

(7)

Таким образом, как видно из равенства (7), показатель эффективности смешанной стратегии по критерию Байеса относительно выигрышей представляет собой взвешенное среднее показателей эффективности чистых стратегий , по тому же критерию с весами ,.

Если, в частности, стратегия является чистой стратегией ,, то и ее показатель эффективности как смешанной стратегии , определяемый формулой (7), превращается в ее показатель эффективности как чистой стратегии , вычисляемый по формуле (4).

Пусть - множество всех смешанных (в том числе и чистых) стратегий игрока А. Оптимальной среди всех стратегий множества по критерию Байеса относительно выигрышей назовем стратегию , показатель эффективности (7) которой максимален: .

В этом определении в связи с бесконечностью множества встает вопрос о существовании оптимальной среди всех стратегий множества стратегии . Существование такой стратегии обосновывается следующим образом. Из представления (7) функции заключаем, что она линейна и, следовательно, непрерывна по векторному аргументу . А поскольку к тому же она определена на симплексе , являющемся ограниченным замкнутым множеством в m-мерном евклидовом пространстве , то по теореме Вейерштрасса функция достигает на симплексе своей верхней грани, т.е. найдется стратегия такая, что .

Также данный факт может быть выведен посредством решения следующей теоремы:

Стратегия , оптимальная среди чистых стратегий по критерию Байеса относительно выигрышей является оптимальной по тому же критерию и среди всех смешанных стратегий множества .

Доказательство может быть представлено в следующем виде:

Пусть - произвольная смешанная стратегия игрока А. Тогда для ее показателя эффективности (7) в силу (5) и нормировочного равенства будем иметь

откуда

(8)

С другой стороны, для чистой стратегии , координаты которой для и , имеем

(9)

Из неравенств (8) и (9) получаем равенство

, (10)

которое означает, что стратегия является оптимальной среди всех стратегий множества .

Данная теорема показывает, что при принятии решения в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные.

В критерии Байеса известные вероятности состояний Природы могли быть получены из статистических данных, отражающих многократное решение подобных задач, или в результате наблюдений за поведением природы. Однако довольно часто складывается такая ситуация, когда мы лишены возможности определить вероятности состояний природы указанными способами. Желая все же принять решение в условиях риска, мы вынуждены оценить вероятности состояний природы субъективно. Существуют различные методы численной субъективной оценки степени правдоподобности состояний природы. Один из них со стоит в том, что мы не можем отдать предпочтение ни одному из состояний природы и потому считаем их равновероятными, т.е. . Этот принцип называется "принципом недостаточного основания" Лапласа. На нем основан критерий Лапласа относительно выигрышей.

Показателем эффективности стратегии по критерию Лапласа относительно выигрышей называется среднее арифметическое выигрышей i-строки:

Информация о работе Критерии Байеса и Лапласа для оценки выигрышей в теории игр с природой