Игра «Дилемма заключенных»

Задержаны два человека по подозрению в совершении преступления. Следствие, однако, не располагает достаточными уликами, позволяющими передать дело в суд, и потому провоцирует их на добровольное признание. Каждому из задержанных предлагается сделка такого рода. Если оба сознаются, то каждый получит по 5 лет тюрьмы. Если один сознается, возложив вину на другого, то первый будет немедленно отпущен на свободу после проведения одного года в предварительном заключении, а второй получит суровый приговор — 10 лет лишения свободы. Если же ни один из них не сознается, дело будет невозможно закончить и оба проведут в тюрьме по 2 года — максимально возможный срок предварительного заключения. Матрица выигрышей данной игры, которую определяют как «Дилемма заключенных», имеет две строки и два столбца, поскольку каждый игрок может выбрать одну из двух стратегий поведения: «Сознаваться» и «Не сознаваться». Все элементы этой матрицы отрицательны, поскольку в любом случае каждый заключенный проведет некоторое время в тюрьме, получив отрицательный «выигрыш» (табл. 3.4). Реализуя несолидарные стратегии поведения, заключенные выберут вариант поведения «Сознаваться» и получат по 5 лет тюрьмы.

Таблица 1 – Игра «Дилемма заключенных»

	Заключённый 2 хранит молчание	Заключённый 2 даёт показания
Заключённый 1 хранит молчание	-5, -5	-1, 10
Заключённый 1 даёт показания	-10, -1	-2, -2

Во-первых, стратегия «Сознаваться» является доминирующей по отношению к стратегии «Не сознаваться», поэтому последняя является нерациональной.

Во-вторых, стратегия «Сознаваться» является осторожной стратегией для каждого игрока. Следуя ей, заключенный получает гарантию, что его срок заключения не превысит 5 лет (значение максимина) независимо от действий другого заключенного.

В-третьих, стратегия «Сознаваться» является равновесной для каждого заклю- ченного. Отклонение от нее, т. е. выбор варианта поведения «Не сознаваться», приведет к увеличению срока заключения на 5 лет — с 5 до 10 лет. Прирост срока за- ключения в данном случае равен эффекту отклонения. Тот факт, что единственной равновесной точке матрицы выигрышей отвечает стратегия «Сознаваться», означает, что при доминировании несолидарных видов поведения в обществе складывается институциональная норма, требующая от индивидов признания своей вины.

В-четвертых, инновационное поведение заключенного в данном случае неце- лесообразно, поскольку равновесие единственно. Если он все же систематически отклоняется от равновесной стратегии, отказываясь сознаваться в преступлениях (предполагается, что его арестовывают весьма часто), то в результате он добьется лишь увеличения суммарного срока заключения за период экспериментирования и в итоге будет вынужден вернуться к исходной равновесной стратегии «Сознаваться».

Как следует из матрицы выигрышей, в этом случае они получат лишь по два года заключения, а не по 5 лет, как в случае несолидарного поведения. Таким образом, солидарное поведение оказалось выгоднее для игроков, чем любой вид несолидарного поведения. Если нормы общественной жизни устроены по типу игровой матрицы заключенных в том смысле, что они делают более выгодным солидарное поведение индивидов, то в обществе начинает доминировать именно этот вид поведения. И тогда «экономический человек» окончательно уступает место «институциональному человеку», для которого внутренние этические нормы обеспечивают выполнение более выгодных согласованных стратегий, которые не могут быть реализованы при несолидарном поведении.

2. Равновесие в доминирующих стратегиях – принцип оптимальности, используемый в теории игр при решении некооперативных игр, содержащих доминирующие стратегии.

Формально, если в игре в нормальной форме:

каждый игрок имеет доминирующую стратегию ,

то ситуация , образованная выбором этих стратегий всеми игроками, образует равновесие в доминирующих стратегиях.

Равновесие в доминирующих стратегиях является равновесием Нэша.

	А	В
А	1, 1	0, 0
В	0, 0	0, 0
Слабое доминирование

Более того, если стратегии являются строго доминирующими, то такое равновесие в игре единственно. Если доминирование нестрогое, то помимо равновесия в доминирующих стратегиях, в игре могут существовать и другие равновесия Нэша.

В ней стратегии А обоих игроков слабо доминируют их стратегии B. Ситуация (А, А) является равновесием в доминирующих стратегиях. Однако, ситуация (В, В) также является равновесием Нэша в этой игре.

3. Равновесие по Нэшу - так в теории игр называется тип решений игры двух и более игроков, в котором ни один участник не может увеличить выигрыш, изменив свою стратегию, когда другие участники стратегий не меняют. Такая совокупность стратегий, выбранных участниками, и их выигрыши называются равновесием Нэша

Допустим, (S, H) - некооперативная игра n лиц в нормальной форме,

где S — набор чистых стратегий,

а H — набор выигрышей.

Когда каждый игрок выбирает стратегию в профиле стратегий игрок i получает выигрыш

Выигрыш зависит от всего профиля стратегий: не только от стратегии выбранной самим игроком i, но и от чужих стратегий

Профиль стратегий является равновесием по Нэшу, если изменение своей стратегии с на не выгодно ни одному игроку то есть для любого

Игра может иметь равновесие Нэша в чистых стратегиях или в смешанных (то есть при выборе чистой стратегиистохастически с фиксированной частотой). Нэш доказал, что если разрешить смешанные стратегии, тогда в каждой игре n игроков будет хотя бы одно равновесие Нэша.

4. Модель Штакельберга – теоретико-игровая модель олигополистического рынка при наличии информационной асимметрии. Названа в честь немецкого экономиста Генриха фон Штакельберга, впервые описавшего ее в работе «Структура рынка и равновесие», вышедшей в 1934 г.

В этой модели поведение фирм описывается динамической игрой с полной совершенной информацией, в которой поведение фирм моделируется с помощью статической игры с полной информацией. Главной особенностью игры является наличие лидирующей фирмы, которая первой устанавливает объём выпуска товаров, а остальные фирмы ориентируются в своих расчетах на нее.

Основные предпосылки использования модели:

Отрасль производит однородный товар: отличия продукции разных фирм пренебрежимо малы, а значит, покупатель при выборе, у какой фирмы покупать, ориентируется только на цену
Фирмы устанавливают количество производимой продукции, а цена на неё определяется исходя из спроса.
Существует так называемая фирма-лидер, на объём производства которой ориентируются остальные фирмы

В дуополии Штакельберга предполагается иерархия игроков. Первым свое решение объявляет игрок I, после этого стратегию выбирает игрок II. Первый игрок называется лидером, а второй - ведомым. Равновесием по Штакельбергу в игре называется набор стратегий , где есть наилучший ответ игрока II на стратегию , которая находится как решение задачи

5. Оптимальность по Парето - такое состояние некоторой системы, при котором значение каждого частного показателя, характеризующего систему, не может быть улучшено без ухудшения других.

Таким образом, по словам самого Парето: «Всякое изменение, которое никому не приносит убытков, а некоторым людям приносит пользу (по их собственной оценке), является улучшением». Значит, признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Множество состояний системы, оптимальных по Парето, называют «множеством Парето», «множеством альтернатив, оптимальных в смысле Парето», либо «множеством Парето-оптимальных альтернатив». Используются также термины «компромиссные», «неулучшаемые» альтернативы.

В экономике ситуация, когда достигнута эффективность по Парето — это ситуация, когда все выгоды от обмена сторон исчерпаны.

Эффективность по Парето является одним из центральных понятий для современной экономической науки. Одним из приложений парето-оптимальности является т. н. парето-распределение ресурсов (трудовых ресурсов и капитала) при международной экономической интеграции, то есть экономическом объединении двух и более государств. Интересно, что парето-распределение до и после международной экономической интеграции было адекватно математически описано.

Экономический анализ показывает, что добавленная стоимость секторов экономики и доходы трудовых масс находятся в противоречии, что в физике аналогично хорошо известным уравнением теплопроводности, движением частиц газа или жидкости в пространстве. Эта аналогия даёт возможность применить физические методы анализа в отношении экономических задач по дрейфу экономических параметров.

Оптимум по Парето подразумевает, что суммарное благосостояние общества достигает максимума, а распределение благ и ресурсов становится оптимальным, если любое изменение этого распределения ухудшает благосостояние хотя бы одного субъекта экономической системы.

Парето-оптимальное состояние рынка — ситуация, когда нельзя улучшить положение любого участника экономического процесса, одновременно не снижая благосостояния как минимум одного из остальных.

Согласно критерию Парето (критерию роста общественного благосостояния), движение в сторону оптимума возможно лишь при таком распределении ресурсов, которое увеличивает благосостояние по крайней мере одного человека, не нанося ущерба никому другому.

Игра «Дилемма заключенных»

Поиск по сайту