Кто должен управлять миром?




Проблема «недовольных» членов любого сообщества, нарушающих установленные правила социальных отношений, особенно остро проявляется в международных делах. И для Гоббса, и для Локка государство представляло собой единое целое, объединяющее народ в «политическое тело», в огромного, безжалостного и воинственного Левиафана. При этом страны и народы, выступая в качестве объединенных множеств, вновь напоминают отдельных людей в естественном, диком состоянии, когда над ними не было никакой верховной власти. Государствам, как и людям, также приходится осознавать, говоря словами Локка, что «состояние мира, доброжелательности, сотрудничества и созидания противостоит состоянию вражды, ненависти, насилия и разрушения».

Гоббс отлично понимал сложность проблемы и не видел для нее ясного решения, что проявляется даже в стиле изложения. Выступая строгим логиком при анализе отношений людей друг с другом и с государством, Гоббс теряется, доходя до рассмотрения межгосударственных отношений, и неожиданно переходит к страстным жалобам:

Во все времена короли и правители, будучи независимыми, завистливо и внимательно следили друг за другом, напоминая гладиаторов на арене, сжимающих мечи и готовых к атаке. Поэтому им приходится постоянно возводить крепости и укрепления на границах своих государств, непрерывно вооружаться и шпионить друг за другом. Фактически они находятся в состоянии непрерывной войны. (T. Hobbes. 1651. Leviathan, ch. 51.)

Конец XVII века, расцвет, как считают, эпохи разума, прославился поразительной жестокостью и воинственностью. Кроме того, почти все европейские правители того времени как на подбор отличались удивительной ограниченностью, мелочностью и мстительностью, что и приводило в отчаяние строгого рационалиста Гоббса, искавшего во всём порядок и закономерность. Интересно, что бы подумал Гоббс о правителях современного мира?

С этой точки зрения очень интересно задуматься о возможностях создания всемирного правительства, что активно обсуждали многие выдающиеся мыслители начала XX века, среди которых стоит особо отметить писателя Герберта Уэллса и физика Лео Силарда (Сциларда). Сложность проблемы связана с тем, что никакое содружество государств не может без использования силы ничего сделать с «нарушителями», т. е. странами, отказывающимися соблюдать принятые остальными нормы. Формально обязанность и возможность необходимого принуждения возложена на Организацию Объединенных Наций, но даже западные демократии не всегда подчиняются требованиям ООН. Декларация ООН о правах человека не выполняется, а многие страны игнорируют решения Международного суда. Нельзя притворяться, что в современном состоянии эта организация способна хоть в какой-то мере выполнять функции мирового правительства.

Может ли мировое правительство быть установлено мирным путем? Даже если это возможно, хотим ли мы этого? Идея мирового правительства восходит как минимум к Канту и Руссо. Но Кант отверг ее, несмотря на то что благодаря мировому правительству могло быть построено «государство всеобщего мира». Причина: рано или поздно это приведет к возникновению «самой ужасной деспотии». Для предотвращения постоянных войн между европейскими государствами Руссо предлагал создать из них федерацию, но его планы были очень далеки от того, к чему пришла современная Европа. Руссо мечтал о сильном объединении, способном диктовать своим членам требуемое поведение, а нынешний Евросоюз является очень рыхлой федерацией, которую даже самые ярые еврофобы не могут обвинить в авторитаризме.

Роберт Каган из отдела Фонда Карнеги по проблемам международной безопасности (Вашингтон, округ Колумбия) считает, что Евросоюз представляет собой воплощение кантианского представления о вечном мире и играет благотворную роль в современной международной политике. В то же время он предлагает довольно парадоксальную точку зрения на мировую политику, полагая, что кантианское миролюбие Евросоюза может проявляться лишь потому, что во всём остальном мире ведущую роль играют могущественные США, придерживающиеся гоббсовской философии превосходства силы. Европа уже живет в «постисторическом раю» и поэтому может спокойно заниматься проблемами мира и международной безопасности. Безопасность этого состояния Европы обеспечивается военной мощью Соединенных Штатов, которые пока еще «продолжают брести в болоте всемирной истории» и т. д. (R. Kagan. 2002. «Power and weakness». Policy Review 113, June & July). Стоит отметить, что предлагаемая Каганом картина весьма упрощена, так как он рассматривает международные отношения с чисто гоббсовских позиций войны и враждебности, не учитывая важной роли, которую играют сейчас в мировой политике экономика, торговля, культура и история. Кроме этого, он упускает из виду некоторые нюансы международных отношений (например, антагонизм между США и многими исламскими государствами может быть обусловлен не принципиальными противоречиями, а конкретной политикой США в регионе Ближнего Востока). В то же время работа Кагана еще раз наглядно демонстрирует, что вопросы организации международных отношений, сформулированные еще в эпоху Просвещения, так и остались нерешенными, да и обсуждаются практически в тех же терминах.

Смогут ли народы когда-нибудь начать сотрудничество без внешнего принуждения? Каким образом может осуществляться такое сотрудничество, если сейчас могущественные державы продолжают эксплуатировать население и ресурсы малых стран? Следует ли отдельным странам становиться агрессивными «ястребами» или миролюбивыми «голубями»? Полезно ли мирному государству притворяться ястребом, демонстративно наращивая военную мощь и создавая атомное оружие? Какие действия следует признавать «правильными» (Локк, конечно, употребил бы определение «естественными») при отражении агрессии? Какие войны можно назвать справедливыми? Теория игр позволяет не только ответить на некоторые из этих вопросов, но и выявить заложенные в них очень непростые противоречия и мотивы, т. е. сформулировать эти вопросы более точно.

Окопная война

Начнем рассмотрение войны, которую никто не может считать не то что справедливой, но даже разумной. Историк Эрик Хобсбаум пишет: «С 1914 года начался век массовых убийств. Миллионы людей были загнаны в окопы и жили за песчаными брустверами вместе с крысами и вшами». В этой кровавой схватке Франция потеряла пятую часть всех мужчин призывного возраста, а Англия — полмиллиона мужчин в возрасте до 30 лет. «Западный фронт, — писал Хобсбаум, — привел к немыслимому ужесточению военных действий и политических решений. Каждая из сторон стремилась к полному уничтожению противника, не считаясь даже с собственными потерями в живой силе и материальных ценностях» (E. Hobsbawm. 1994. Age of Extremes, pp. 24–26. Abacus, London). Безусловно, тотальная война 1914–1918 годов сделала возможным массовое уничтожение гражданского населения в последующих конфликтах и подготовила трагедии Хиросимы и Холокоста.

Читателя может удивить, что я выбрал столь жестокий период истории для обсуждения проблем терпимости и сотрудничества, но мне хочется напомнить о некоторых обстоятельствах, давно ставших легендой Первой мировой войны. Речь идет о знаменитых рождественских перемириях на Западном фронте, когда солдаты воюющих сторон на короткое время прекращали боевые действия, поздравляли друг друга и даже играли в футбол на нейтральной полосе между линиями окопов и рядами колючей проволоки. Легенда гласит: после этого солдаты возвращались в окопы и продолжали воевать. На самом деле всё обстояло значительно сложнее. Один из английских офицеров, инспектировавших войска на передовой, в своих воспоминаниях пишет, что он был поражен не столько грязью, бессмысленностью и убожеством окопной жизни, сколько обыденным отношением солдат к войне вообще:

Я был удивлен, увидев немецких солдат, разгуливающих в непосредственной близости от наших окопов, причем наши солдаты не обращали на них никакого внимания и не пытались стрелять. На мои замечания никто не реагировал, хотя я настойчиво повторял всем, что такое поведение на войне является ненормальным. Похоже, солдаты обеих армий временами забывали о войне и действовали по житейскому принципу «живи и давай жить другим». (G. Dugdale. 1932. Langemarck and Cambrai, p. 94. Wilding & Son, Shrewsbury.)

Разумеется, солдаты не забывали о войне, но одновременно понимали, что на Западном фронте никто не может одержать победу. Поведение солдат объяснялось вовсе не трусостью, ленью или отчаянием. Оно было просто рациональным, т. е. люди делали то, что считали самым разумным в сложившейся обстановке. Это безразличие к исполнению своего воинского долга, естественно, вызывало тревогу и беспокойство у командования, вследствие чего время от времени отдавался приказ о наступлении, бросавшем такие «миролюбивые» части в безнадежные атаки. Военное руководство как бы старалось внушить или напомнить солдатам, что именно их вчерашние собеседники и почти приятели являются смертельными врагами, которых следует уничтожать.

Проблема заключалась в том, что немцы находились в такой же ситуации. Выбор был очень прост и ограничен. Солдаты могли следовать приказам командования, что означало непрерывную войну, т. е. артиллерийский обстрел вражеских позиций и безжалостную стрельбу снайперов по каждому дураку, который осмеливался поднять голову во вражеских окопах. Однако солдаты обеих сторон по негласному соглашению предпочитали воздерживаться от любых боевых действий, если на них не было прямого приказа сверху. Каждый надеялся как-то спастись и перебраться в тыл до следующего кровопролитного и бессмысленного наступления. Никому не хотелось дополнительно рисковать своей жизнью в перерывах между боевыми действиями.

Известно, что в армиях всех стран большое внимание уделяют военной пропаганде, демонизирующей врага и заставляющей солдат искренне ненавидеть противника. Конечно, частично такая агитация имела успех, и многие англичане наверняка глубоко ненавидели и презирали «бошей», однако в окопах эти иллюзии быстро развеивались, особенно когда солдаты убеждались, что немцы с удовольствием оставляют их в покое, как только они сами перестают обстреливать противника. Некоторые армейские части доходили до того, что действительно заключали формальные соглашения о перемирии с противостоящими им немецкими частями. Разумеется, командование рассматривало такие действия как прямую измену, и военно-полевые суды приговаривали инициаторов таких перемирий к расстрелу. Однако никакие карательные меры не помогали, и принцип «живи и давай жить другим» постоянно демонстрировал свою силу вдоль всей передовой даже при отсутствии прямых контактов между сторонами. Принцип побеждал благодаря молчаливому соучастию солдатской массы, несмотря на ярость и отчаяние генералов обеих армий.

Перемирия не были гуманными соглашениями о прекращении убийств (или по крайней мере не начинались с таких размышлений). Скорее наоборот, убийства приводили к перемириям. Солдаты прекрасно понимали, что если, например, они нарушат негласное соглашение о прекращении артиллерийского обстрела, то противнику придется ответить тем же, в результате чего обе стороны понесут тяжелые потери. Дж. Белтон Кобб в своей книге Stand to Arms (1916) писал: «Как только англичане начинают обстрел германских позиций, немцы отвечают тем же, так что потери сторон примерно выравниваются. Удачному попаданию английского снаряда, убивающему пятерых немцев во вражеских окопах, в скором времени будет соответствовать столь же удачный выстрел немецкой пушки» (G. B. Cobb. 1916. Stand to Arms, p. 74. Wells Gardner, Darton, London).

Другим словами, война на Западном фронте велась по принципу быстрого, прямого и примерно равного возмездия — зуб за зуб. Такой обмен действиями, который можно назвать смертельной формой коммуникации, означает: «Мы поступим так же, как вы!» Это можно рассматривать одновременно и как угрозу, и как приглашение к миру, поскольку подразумевается, что неагрессивное поведение не будет встречено в штыки.

Соглашения, заключенные на основе принципа «живи и давай жить другим», часто диктуются основными потребностями. Например, человек должен питаться, очевидно, что он не может одновременно и есть, и сражаться. Исходя из этого, на передовой самопроизвольно, но практически постоянно прекращались артиллерийские обстрелы в обеденное время. Аналогично солдаты не обстреливали телеги, подвозившие пропитание к вражеским окопам (даже в то время, когда это было очень легко сделать), поскольку прекрасно понимали, что ответом станет уничтожение их собственного продовольственного обоза. В книге Goodbye to All That Роберт Грейвс вспоминает, как время от времени солдаты на передовой прекращали стрельбу, чтобы дать друг другу возможность вынести с нейтральной полосы убитых и раненых и отправить их в тыл.

Почему все войны не заканчиваются таким образом? Я думаю, что свою роль сыграли особые условия, сложившиеся на Западном фронте, когда обе стороны оказались в тупике, лишающем смысла даже сами военные действия. В обычных войнах солдаты сталкиваются с противником либо при сражениях мобильных армий, либо при коротких стычках, связанных с партизанскими или диверсионными операциями. Вероятность повторной встречи с тем же самым противником невелика. Стремление убивать возможно большее число врагов в таких обстоятельствах естественно и оправданно. Другое дело, когда вы проживаете рядом, буквально лицом к лицу с врагом в течение длительного времени. Тут вы вынуждены искать какие-то пути к сотрудничеству вместо непрерывной конфронтации, ведь на ваш сегодняшний удар противник может нанести ответный удар в будущем. Ситуация несколько напоминает отношения в деловом мире: при долгосрочном сотрудничестве невыгодно задерживать платежи, ведь партнер может ответить тем же, а при разовых сделках недобросовестный партнер может пойти на обман.

Кроме того, в отсутствие прямого контакта с противником требуется достаточно продолжительное время для выработки политики на основе принципа «живи и давай жить другим», создания атмосферы определенного доверия к противнику. Затишье на фронте предоставляет такую возможность.

Забавно, что солдаты вскоре стали понимать, что несанкционированные перемирия страшно раздражают высшее командование, в результате чего сверху поступают приказы о наступлении или других активных действиях. Учитывая это, солдаты каждой стороны стали даже изобретать методики имитации энергичных боевых действий, которые не приводили к реальным потерям сторон. Они старательно изображали атаки, убеждая собственных офицеров, что негласного соглашения о перемирии не существует. Такие имитации военных действий не только обманывали генералов, но и позволяли продемонстрировать противнику свою «добрую волю». Историк Тони Эшворт, тщательно изучавший действие системы «живи и давай жить другим» во время Первой мировой войны, пишет по этому поводу:

Во время окопной войны был разработан целый ритуал агрессивного поведения, при котором стороны иногда обменивались целыми сериями фактически безопасных артиллерийских и стрелковых залпов, символизирующих одновременно дружеские чувства и веру в полное взаимопонимание. (T. Ashworth. 1980. Trench Warfare 1914–1918: The Live and Let Live System, p. 144. Holmes & Meier, New York.)

Подобные ритуальные схватки действительно широко распространены во время военных действий и других конфликтов. Среди животных они приобретают форму поединков за лидерство, например олени устрашающе размахивают своими мощными рогами и даже сталкиваются ими, вынуждая противника отступить, но крайне редко такие схватки заканчиваются смертельным исходом. Впрочем, такие ритуалы в природе используются для определения победителя, а на Западном фронте они позволяли солдатам избежать бессмысленного кровопролития, которое представлялось абсолютно необходимым командовавшим ими генералам.

Стратегия «живи и давай жить другим» и легенда о перемириях на Западном фронте свидетельствуют не только о терпимости и сдержанности, но и о взаимной доброжелательности людей, посланных убивать друг друга. Но если это происходило, то было не причиной, а следствием кооперативного поведения. Возможно, что стрелявшие в воздух солдаты руководствовались не высокими моральными принципами, а пониманием, что они таким поведением повышают собственные шансы на выживание. Сотрудничество возникало из эгоистических интересов.

Качественная картина такого поведения представляется достаточно простой, а вот его научное описание можно обнаружить — очередная ирония судьбы! — в разработках американского военного «мозгового центра».

Великий турнир

Представьте себе, что вы находите в вагоне трамвая туго набитый бумажник. Ваши действия? На первый взгляд это простейший случай бинарного выбора, подобный описанным в гл. 13. Вы можете либо попытаться вернуть бумажник хозяину, например разыскав в нём визитную карточку и документы владельца или передав бумажник водителю для дальнейшего розыска, либо... положить его в собственный карман.

Модели поведения, которые мы рассматривали в предыдущих разделах книги, исходят из предположения, что агенты в коллективных сценариях отвечают на действия соседей определенным, в какой-то мере автоматическим образом: действие А вызывает ответ Б, или однозначно, или с некоторой вероятностью.

Но в данном случае выбор не так прост. Разумеется, есть люди абсолютно честные и есть люди абсолютно бесчестные. Но нормальные, обычные люди, составляющие большинство, находятся между этими крайностями. У такого человека при подобной находке непроизвольно возникает ряд мыслей: а кто узнает? А если бы я потерял кошелек? Как бы я себя чувствовал? После чего человек начинает оценивать свои возможные действия по некоему моральному кодексу, однако этот кодекс уже отравлен искушением.

Искушение, или соблазн, является одним из серьезнейших факторов, управляющих любым человеческим сообществом. Именно искушение превращает добрых, порядочных и деликатных людей в злобные, жестокие и грубые создания. Если мои соседи такие кроткие и законопослушные, то почему бы мне не присвоить часть их земли или имущества? В жестоком мире, придуманном Гоббсом, все люди ничтожны и несчастны одинаково. Однако попробуйте представить себе гоббсовского дикого человека в Эдеме, в мире всеобщего доверия и доброты. Ведь он наверняка, пользуясь полной безнаказанностью, впадет там в буйство, разгул, стяжательство и т. п. (разумеется, если он не верит в Бога). Соблазны играют очень важную роль в человеческом поведении, и это проблема всех утопий: не все люди совершенны, а преступление иногда окупается.

Ранее мы постоянно уподобляли людей частицам. Но как частица может впасть в искушение? В 1950-х годах Меррилу Флуду и Мелвину Дрешеру из «РЭНД Корпорэйшн» удалось в какой-то мере смоделировать это человеческое чувство. Придуманная ими простая математическая модель включала элемент соблазна во взаимодействие между агентами-частицами.

Модель представляла собой своеобразную игру, в которой применялись элементы математической теории игр, созданной Джоном фон Нейманом в 1920-х годах. Стоит упомянуть, что фон Нейман был одним из самых замечательных ученых прошлого века и внес огромный вклад в развитие самых разных областей науки. В частности, он создал теоретическую основу компьютерной техники и сыграл очень важную роль в создании атомной бомбы. Он пользовался репутацией гениального плейбоя, посвящая массу времени азартным играм, особенно покеру, но он не только играл в эти игры, он пытался понять их.

Для пущей сложности математики обычно принимаются анализировать шахматы. Но в определенном смысле покер представляет собой гораздо более сложную игру, потому что она включает в себя психологический элемент — блеф или обман. В шахматах ищут лучший ход в конкретной позиции, в покере — ход, который лучше сможет спровоцировать, дезориентировать или смутить оппонента. Элементы риска и неопределенности, присущие азартным играм этого типа, позволили фон Нейману уловить их связь с экономикой и написать в 1944 году (совместно с экономистом Оскаром Моргенштерном) книгу Теория игр и экономическое поведение.

Придуманная Флудом и Дрешером игра может быть отнесена к азартным. Она стала широко известной под названием «Дилемма заключенного» и действительно внедрила теорию игр в социологию, биологию и политологию. В игре участвуют два агента, которых ради удобства и удачной метафоры можно уподобить двум заключенным, подозреваемым в совершении какого-то преступления. Каждый из них предупрежден, что если он даст показания против второго заключенного, то первый получит свободу, а второй — строгий приговор. Если заключенные выступят с взаимными обвинениями, то оба получат одинаковое, но не очень строгое наказание, так как показания в таком случае считаются сомнительными. Если же они оба уклонятся от показаний, то оба получат совсем небольшой срок наказания ввиду недостаточности улик.

Естественно, что у каждого из заключенных возникает соблазн обвинить другого и выйти на свободу. Однако если оба заключенных поступят так, то каждый получит более суровое наказание, чем при обоюдном молчании. Следует ли заключенному отказываться от показаний, надеясь, что партнер сделает то же самое? При «рациональном» подходе следует давать показания, поскольку в любом случае это обеспечит лучший результат. Если заключенный 1 дает показания, а заключенный 2 отказывается от показаний, то заключенный 1 выходит на свободу — куда уж лучше. Если в этой ситуации заключенный 2 тоже дает показания, оба получают средний срок — всё лучше, чем полный. Собственно, никакой дилеммы нет — надо «стучать». Но ведь можно отделаться минимальным наказанием, которое лучше среднего, но для этого нужно как-то договориться с подельником. А можно ли ему доверять?

В самой простой формулировке «Дилемма заключенного» сводится к выбору между «честным сотрудничеством» и «обманом» в ситуации, когда договоренность о сотрудничестве имеется или предполагается. Максимальный выигрыш для одного заключенного связан с ситуацией, когда он выбирает обман и дает показания, а второй заключенный честно сотрудничает (разумеется, с подельником, а не с полицией). В этом случае заключенный 1 получает свободу, а заключенный 2 выглядит «лохом», получая суровый приговор. Но если агенты поступают рационально, то они не выбирают ни этот вариант, ни следующий, связанный с обоюдным честным сотрудничеством, а предпочитают обоюдный обман со средним приговором.

В рамках обычной жизни эта дилемма выглядит как выбор между законопослушным поведением (сотрудничеством с обществом) и преступлением (обманом закона и общества). Ее можно свести к утверждению, что следование общественным установлениям — хорошо, но их нарушение иногда сулит еще большие блага. Рассмотрением этой дилеммы занимались еще Руссо и Спиноза. В Эссе о происхождении неравенства Руссо даже придумывает на эту тему сценку из жизни первобытных людей, в которой пятеро дикарей отправляются на охоту за оленем, договорившись разделить добычу поровну. Во время охоты один из них бросается за зайцем и ловит того, но без его помощи четверо других упускают оленя. Руссо отмечает, что «нарушитель договоренности» получает в награду зайца, а все остальные — ничего.

На первый взгляд кажется, что «Дилемма заключенного» лишь подтверждает пессимизм Гоббса, считавшего, что эгоизм отдельных людей постоянно заставляет их выискивать возможности обмана. Однако математики из «РЭНД Корпорэйшн» пытались объяснить и предложить стратегам «холодной войны» нечто большее, чем иллюстрацию склонности человека к обману. Математики задумались об основах примитивной стратегии военного командования, когда обе стороны старательно создавали всё более мощные арсеналы разнообразного вооружения и пассивно готовились к тому, что противник может в любой момент нанести удар. Если вы — генерал, то в такой ситуации представляется очевидным, что вам следует быть умнее и постараться нанести упреждающий удар. Если же противник согласится на какое-то сотрудничество (например, на ограничение своих запусков и т. д.), то необходимо воспользоваться этим и обмануть его. Пусть он окажется «лохом», а вы — победителем. Такая атмосфера подозрительности и постоянного ожидания атаки не позволяла даже думать о построении гармонии и согласия в международных отношениях. Ситуация очень похожа на «Дилемму заключенного», но в этой модели есть еще одна, очень важная деталь.

Дело в том, что в описанной игре участники или, если угодно, заключенные не имеют возможности общаться друг с другом. Для общей пользы им лучше договориться о сотрудничестве, но отсутствие связи не позволяет им сообщать о своих намерениях, в результате чего каждый подозревает другого в самом худшем.

Однако если дать игрокам возможность сыграть в эту игру несколько раз подряд, то у них появляется своего рода информационный канал: они говорят о намерениях своим поведением. Например, если один из игроков проявляет готовность к сотрудничеству в одном туре, то другой может ответить ему тем же в следующем и т. д. Благодаря такому взаимодействию игроки, которые в первых турах безжалостно доносят друг на друга, могут прийти к лучшему общему результату5. У игроков нет моральных или иных стимулов к сотрудничеству, помимо единственного — собственных интересов, что и заставляет их искать наилучшую стратегию поведения.

Это означает, что тупиковая ситуация, когда игроки вынуждены обманывать друг друга в первом раунде игры, может быть разрешена в последующих раундах. Кстати, именно так ведут себя люди в обычных условиях, заключая сделки и улаживая бытовые вопросы. Общающимся соседям или деловым партнерам невыгодно обманывать друг друга, и они вынуждены поддерживать разумный уровень доверия между собой. То же можно сказать и о странах, имеющих общие границы, которые не могут избежать экономического, политического и социального взаимодействия.

Повторение игры (математики называют это итерацией) в «Дилемму заключенного» дает игрокам возможность учиться на собственных ошибках и строить отношения на основе взаимного доверия. Так может возникнуть сотрудничество.

А как играют в эту игру реальные люди? Психологи тщательно изучили этот вопрос с использованием контрольных тестов и установили, что сотрудничество между людьми действительно развивается, но его степень может изменяться в очень широких пределах, в зависимости от природы и величины выигрыша, характера игроков и особенностей их взаимодействия; например, психологически легче обмануть ожидания человека заочно, а не глядя ему в глаза при личной встрече.

Кроме того, не следует забывать об элементе соблазна. Выяснив, что партнер доверчив и легко вступает в сотрудничество, игрок вполне может соблазниться и «изобразить» случайную ошибку в отношениях, в результате которой его выигрыш значительно возрастает. Если партнер окажется забывчивым или необидчивым, то эту операцию можно будет затем повторять, разумеется, не слишком часто, чтобы не вызвать подозрений. К сожалению, именно так очень часто и происходит в реальных деловых и бытовых отношениях.

Именно с этим связана проблема, которой посвящена эта глава: какая стратегия является наилучшей при повторяющейся игре в «Дилемму заключенного»? Какой стратегии следует придерживаться, если вам ничего не известно о партнере?

В конце 1970-х годов Роберт Аксельрод придумал эксперимент, позволяющий ответить на эти вопросы. Он попросил известных специалистов в области теории игр выработать разные типы стратегий повторяющейся игры в «Дилемму заключенного», а затем собрал предложенные ими программы и провел между ними круговой турнир на компьютере. Программы сражались друг с другом в течение многих раундов, победитель определялся по максимальному числу очков, набранных во всех встречах. Турнир заинтересовал специалистов из разных областей науки — психологов, математиков, экономистов, социологов и политологов, представивших 14 программ-участниц. Каждая стратегия предусматривала собственные правила выбора между сотрудничеством и обманом. Например, программа может постоянно соглашаться на сотрудничество (это плохой вариант, потому что эту программу будут обманывать все остальные, за исключением таких же простаков — «безусловных кооператоров»). Или программа в целом ориентирована на сотрудничество, но периодически обманывает, например в каждом четвертом раунде.

Многие представленные на турнире программы были намного сложнее описанных выше, но победителем оказалась наиболее простая из них, разработанная психологом Анатолем Рапопортом из университета Торонто. Он назвал свою программу Tit for Tat (TFT), что соответствует русскому «зуб за зуб». Ее единственным правилом было следующее: начинай с сотрудничества, а далее делай то, что делал твой оппонент в предыдущем раунде.

Например, играя против безусловного кооператора, TFT сразу принимает его тактику, в результате чего игра заканчивается одинаково выгодно для обеих программ. В игре против безусловного обманщика TFT, конечно, проигрывает в первом раунде (проявив желание сотрудничать), но зато потом постоянно обманывает, так что проигрыш TFT в этой встрече остается небольшим — только очки, потерянные в первом раунде. При встречах с программами, применяющими смешанную стратегию сотрудничества и обмана, TFT отвечает в соответствии с поведением партнера в предыдущем раунде. Таким образом, можно сказать, что TFT пользуется плодами сотрудничества, когда это возможно, но не позволяет обманывать себя. С другой стороны, TFT сама не обманывает чужих ожиданий, в результате чего, кстати, она никогда не получает очков больше, чем ее противник. У всех остальных программ были свои достоинства и недостатки, так что некоторые из них очень удачно выступали против преимущественных кооператоров или, наоборот, против преимущественных обманщиков, но именно TFT в целом набрала максимальное число очков, выступая одинаково ровно против всех остальных стратегий. Можно сказать, что это была скромная и даже простодушная победа.

Первый компьютерный турнир оказался очень успешным и получил широкую известность, поэтому когда Аксельрод организовал второй турнир по тем же правилам, в нём приняли участие уже 62 программы из 6 стран. Более того, в отличие от первого турнира, где участвовали профессиональные ученые, во втором турнире смогли соревноваться и программы, составленные любителями компьютерных игр, включая десятилетнего мальчика. Все они знали о результатах первого турнира, поэтому неудивительно, что многие из них пытались модифицировать и улучшить программу TFT, сделав ее более сложной и эффективной. Этому искушению не поддался только сам автор программы, Рапопорт выставил на турнир ту же программу, и она вновь стала победительницей!

Означает ли это, что TFT действительно представляет собой наилучшую стратегию при повторяющейся игре в «Дилемму заключенного»? Мне кажется, что говорить о наилучшей стратегии в этом случае вообще неверно, так как результат в значительной степени зависит от состава участников. Если ваши противники в большинстве своем являются безусловными кооператорами, то преимущественный или безусловный обман принесет лучший результат, чем стратегия TFT. Но основной вывод из проведенных Аксельродом компьютерных турниров всё же гласит, что при игре с неизвестными противниками стратегия TFT является лучшей.

В чем заключается основная особенность TFT? Прежде всего стоит отметить ее гибкость: она открыта к сотрудничеству, но не позволяет беззастенчиво обманывать себя. Удачное сотрудничество с другим игроком сразу вызывает у TFT стремление продолжать сотрудничество в следующих турах, а обман вызывает немедленную ответную реакцию. Программа TFT всегда поступает с другими так, как они поступают с ней самой. Отметим, что такое поведение соответствует Ветхому Завету, а не Новому, где в ответ на удар рекомендуется подставить другую щеку.

Именно простота и ясность поведения стали причиной успеха TFT. Стратегия одной из программ — участниц второго турнира заключалась в разгадке правил, которые управляют поведением противника, и их использования в игре6. Такое угадывание чужого поведения весьма распространено и в реальной жизни, так как люди очень часто пользуются известной им реакцией своих друзей и врагов на определенные события и поступки. Разница между человеком и компьютерной программой состоит в том, что люди часто пытаются предварительно выяснить чужую реакцию или действуют наудачу, в то время как TFT простодушно поощряет задним числом любое сотрудничество и наказывает за обман.

Успех TFT может быть связан еще с одной особенностью — эта программа никогда первой не отказывается от сотрудничества. Стратегии всех остальных программ турнира разделились именно по этому принципу на две большие группы в зависимости от того, как их авторы решают основную проблему: следует ли первым отказываться от сотрудничества или нет? Участники даже стали называть стратегии, которые не отказываются от сотрудничества первыми, термином приятные (для другой группы программ название не выработалось, но по логике вещей их следовало бы назвать противными). Аксельрод считает, что приятные программы практически всегда лучше противных, и действительно, уже на первом турнире им достались первые восемь мест, последующие с большим разрывом в набранных очках заняли противные.

Секреты сотрудничества

Таким образом, «Дилемма заключенного» при повторяющейся игре выглядит не столь удручающей, поскольку демонстрирует, что «приятность» манер и сотрудничество эффективнее «противности» и обмана ожиданий. Даже индивидуальный эгоизм не мешает возникновению атмосферы того, что англичане называют честной игрой (fair play).

Конечно, одно лишь стремление к сотрудничеству вовсе не гарантирует успеха, особенно в более жестких играх. Аксельрод сформулировал четыре требования, которым должна удовлетворять успешная стратегия, и выразил их в виде рекомендаций игрокам:

  • Не обманывай первым. Будь приятным!
  • Всегда отвечай взаимностью, то есть реагируй «зеркально».
  • Не будь слишком умным.
  • Не будь завистливым.

1. Не обманывай первым. Будь приятным!

2. Всегда отвечай взаимностью, то есть реагируй «зеркально».

3. Не будь слишком умным.

4. Не будь завистливым.

Что означает «завистливый» в данном контексте? Аксельрод подразумевал, что в программу следует закладывать не стремление обязательно выиграть, а желание «выступить в свою силу», без внимания к действиям других игроков. Дело в том, что «Дилемма заключенного» не относится к так называемым играм с нулевой суммой, т. е. выигрыш одного игрока не означает потерь для его соперников. При сотрудничестве выигрывают оба игрока, хотя выигрыш каждого из них меньше гипотетического, который мог быть при обмане. Аксельрод полагал, что и в реальных играх многие игроки несут потери из-за того, что не могут избавиться от излишнего духа соперничества и зависти. Он даже провел серию повторяющихся игр в «Дилемму заключенного» со студентами-добровольцами и обнаружил, что острое соперничество между участниками действительно ухудшает их показатели, так как, увлекаясь соревнованием друг с другом, они теряют осторожность и начинают играть по более рискованной стратегии. При этом непроизвольно возникают целые серии немотивированных отказов в сотрудничестве, связанных с ростом недоверия.

Особенности войны на Западном фронте, описанные в предыдущем разделе, отлично иллюстрируют действие принципа «живи и давай жить другим», основанного на стратегии TFT. В упомяну



Поделиться:




Поиск по сайту

©2015-2024 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-10-11 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту: