Часть 2. Где возникает дилемма заключённого и парадокс шантажиста
Видео и статья на тему «Основы рационального поведения»
Нарушение правил (00:00)
Общий ресурс – это, например, выполнение правил. Если все выполняют какие-то правила, то всем хорошо. Но каждый раз локально выгодно это правило нарушить – это и является примером дилеммы заключённого.
Приведём пример. Вы куда-то опаздываете, едете в автобусе или за рулём своей машины, и думаете, как было бы хорошо, если бы автобус проскочил на жёлтый или мигающий зелёный. Но при этом, когда вы не спешите или переходите дорогу как пешеход, вас такие водители жутко раздражают (см. рис. 1).
Рис. 1. Нарушение правил дорожного движения
Ещё один пример с правилами дорожного движения. Есть маленький переулок с односторонним движением. Вам не хочется объезжать, поэтому кажется, что ничего страшного, если проскочить. Но именно наличие этого порядка и следование ему всеми участниками движения выгодно всем.

Это проблема хорошо раскрывается в фильме «Место встречи изменить нельзя» – спор Жеглова и Шарапова. Можно ли подбрасывать кошелёк преступнику, чтобы доказать, что он преступник? Шарапов говорит, что если мы один раз закон под себя подмяли, второй раз и если все так будут делать, то это будет «не закон, а кистень». Кажется, что когда один раз нарушаешь, то ничего страшного, но если все начнут нарушать, то это будут уже не правила, а неконтролируемый процесс. Локально нам выгодно один раз нарушить или дать взятку инспектору, если нарушили, но глобально мы все против коррупции, против беззакония на дорогах и т. д.
Закон – это именно та внешняя сила в дилемме заключённого для двоих, которая гарантирует им, что обоим лучше «не признаваться». Закон распространён на всех и поддерживается внешней силой – государством.
Шум в классе (02:12)
Когда нет учительницы, все разговаривают друг с другом. Плохо слышно, и ученики начинают говорить громче. В классе шум, всем всё равно плохо слышно, но сотрудничать не получается. Как договориться? Достаточно зайти учительнице – и все сразу договариваются: даже если и переговариваются, то тихо (см. рис. 2). Пользуемся тишиной как общим ресурсом, а внешним фактором или силой в данном случае является учительница.
Рис. 2. Учительница – внешний фактор для борьбы с шумом в классе
Каждый сам может вспомнить много примеров из жизни с похожими внешними факторами.
Парадокс шантажиста (03:05)
Пример парадокса шантажиста. Жильцы договорились нанять уборщицу, которая будет убирать подъезд. Естественно, если кто-то из жильцов не заплатит, он будет локально в выигрыше. Каждый человек в этом случае принимает решение добровольно. Например, в подъезде живёт 10 человек. 9 из них договариваются по очереди убирать, а один отказывается. В среднем грязно всего лишь 1 день из 10, поэтому ничего страшного. Или, если такая же ситуация возникает в пример с уборщицей, то нам придётся платить приблизительно на 10% больше, чтобы доплачивать за этого одного человека. Но при этом дальше, если мы будем делать какие-то вещи в подъезде, такого человека мы учитывать не будем. Отношение к нему тоже изменится. Но локально он прав, ему выгодно так поступить, если речь идёт об «одноразовой игре». На коротких дистанциях выгодно, а на длинных – нет.
Дилемма заключённого по отношению к себе (04:00)
Такая схема размышления применима и в ситуации, когда ты ни с кем не играешь, когда ты один. Предположим, что я решил бросить курить. Для этого достаточно выдержать 100 дней, и тогда будет всё легко. Наступает первый день, и мои рассуждения являются рассуждениями заключённого из дилеммы. Если те «ребята» (я в каждый из оставшихся дней) оставшиеся 99 дней не будут курить, а сегодня я поддамся своей привычке, то 99 дней хватит, чтобы бросить курить. Если же они будут курить, то тогда тем более я могу сегодня поддаться привычке (всё равно не выдержим). Если я выделю только один день, то получится дилемма заключённого в чистом виде (см. рис. 3).
Рис. 3. Иллюстрация примера о курении
Казалось бы, рационально и разумно мне сегодня покурить, я получаю удовольствие потакая своей привычке, а после я перекладываю ответственность на тех «людей» – себя в будущем. Значит, я должен найти какой-то внешний фактор. Не нужно говорить, что я должен не курить 100 дней. Например, нужно просто сказать: «Все, с сегодняшнего дня я не курю».

Т. е. мы видим, что в быту, в окружающей нас жизни почти каждый день мы так или иначе встречаемся с дилеммой заключённого. Эта дилемма настолько распространена, что лучше о ней знать, уметь её находить и разрешать. Это могут быть скандалы с соседями на участке, конфликты в быту и т. д.
Героизм (06:09)
Героизм в битвах – это рациональный подход, хотя кажется, что он является чем-то иррациональным. Представим себе, что мы – два незнакомых человека, сидим в окопе и на нас наступают. Я рассуждаю: если другой человек не выдержит и побежит, то мне точно нужно бежать, иначе меня одного убьют (см. рис. 4.1).
Рис. 4.1 Размышление заключённого в примере с героизмом
Если же он не побежит, то мне тоже выгоднее бежать – он задержит врага, а, значит, я дальше убегу, и у меня будет больше шансов на спасение. Получается, в любом случае мне выгодно бежать (см. рис. 4.2).
Рис. 4.2 Размышление заключённого в примере с героизмом
Но если мы оба так рассуждаем, значит, и побежим оба, а следовательно, большая вероятность, что нас обоих и убьют (или возьмут в плен). Т. е. возникает неустойчивая ситуация. Что можно сделать? Один вариант: мы оба герои (оба «не признаёмся» в терминах дилеммы заключённых). Другой вариант: один из нас герой, другой – не очень. Предположим, сзади нас расположен заградотряд. Это могут быть реальные люди в форме НКВД, а может быть просто наша честь. Если кто-то побежит, то с позором он просто дальше не сможет жить. Или он знает, что там, сзади, его просто расстреляют. В обоих случаях этот «негерой» сидит в окопе, не бежит. Кому это выгодно? Нам обоим выгоден этот заградотряд. И герою, потому что он сидит уже спокойно и знает, что другой не побежит, и тому, негерою, так как это повышает его общие шансы на выживание. Так что какая-то внешняя сила: дисциплина, совесть, честь, заградотряд – играет важную роль. Ещё один вариант разрешения дилеммы: если мы давно воюем вместе, то тут уже существует ощущение коллектива, команды, есть доверие друг к другу. Поэтому обстрелянные боевые единицы намного ценнее, чем необстрелянные, потому что у них есть доверие друг к другу.
Гонка вооружений (08:55)
Мы поговорили о дилемме заключённого на нескольких примерах взаимоотношений людей, групп людей, но понятно, что самая большая организованная группа людей – это государство. До этого у нас государство выступало в роли внешней силы, которая регулировала взаимоотношения между людьми, а также разрешала возникающие споры. Понятно, что конфликтные ситуации могут возникать и между государствами. Естественно, что государства могут доверять друг другу или не доверять. Опять же всё основывается либо на опыте длительных взаимоотношений, либо на понятиях доверие/недоверие и какой-то внешней силе, которая может существовать и для государств.

Ярким примером является гонка вооружений. В холодной войне (см. рис. 5) внешней силой выступила боязнь уничтожения всей Земли.
Рис. 5. Плакаты времён холодной войны
Гонку вооружений стали обуздывать, когда поняли, что возникающая ситуация неустойчива. Т. е. дилемма заключённого может описывать и взаимоотношения между государствами. Я не уверен, как вы себя поведёте, вы не уверены, как поведу себя я. Но на всякий случай я пока буду наращивать вооружение. Пока каждый из нас думал в терминах, кто из нас плохой, решить задачу дипломатическим путём оказалось трудно. Последней точкой могла стать просто ядерная война, которая привела бы к уничтожению Земли в принципе.

Отдельно стоит сказать, что некоторые математики, например Джон фон Нейман (см. рис. 6), говорили, что, наоборот, стоит атаковать первыми. Он говорил: «Если вы мне скажете, что нужно бомбить в среду, я спрошу – почему не в понедельник? Если скажете – в 5 часов, я скажу – почему не в час дня?». Т. е. он предлагал использовать приоритет вооружений, пока он есть. Его предложение полностью укладывается в классическую дилемму заключённого. Фон Нейман фактически предлагал признаться, причём признаться первыми, чтобы извлечь максимальную выгоду. Но, слава Богу, совместно выработанное решение состояло в том, чтобы отказаться от гонки вооружений и начать сотрудничать друг с другом.
Рис. 6. Цитата Джона фон Неймана
Оказывается, что наращивание вооружения – это решение парадокса шантажиста.. Если шантажист точно знает, что второй человек не согласится на выдвигаемые им условия, то он и не будет их предлагать, потому что тоже заинтересован хоть что-то получить. В переводе на язык гонки вооружений: у второго человека есть, чем ответить шантажисту. Тогда шантаж не проходит. Поэтому в некотором смысле гонка вооружений полезна как сдерживающий фактор.
Конкуренция (12:33)
До этого мы приводили в основном негативные примеры. Конкуренция – это пример, где дилемма заключённого работает на благо людей. Если бы бизнесмены, производящие близкие по характеристикам продукты, могли договариваться о цене на свои товары, они бы её не понижали. В таком случае не нужно было бы думать о снижении себестоимости своего производства.

Например, два хлебокомбината производят хлеб. Зачем улучшать производство? Больше ведь никто не производит хлеб, и так купят. Мы просто договариваемся, и всё. Но именно то, что мы не можем договориться, или то, что государство следит за тем, чтобы мы не договаривались – антимонопольный комитет, антикартельное законодательство, – приводит к тому, что мы, борясь за покупателя, улучшаем качество (или снижаем цену) и тем самым повышаем общее благосостояние. Хотя, с другой стороны, тут же появляется и минус, потому что конкуренция приводит к избыточной рекламе и, как следствие, удорожанию стоимости продукта из-за затрат на рекламу. Т. е. существуют два противоположных эффекта. Общего решения, конечно, нет. Другой пример: мы хотим переманить квалифицированных рабочих друг у друга, поэтому предлагаем им большую зарплату. Мы могли бы договориться и сказать, что выше этого порога зарплату не ставим, но такие договорённости на практике почти невозможны. Сейчас на рынке труда среди программистов это отчётливо видно.
Конкуренция – это пример положительного проявления дилеммы заключённого.
Можно привести другой пример сговора. Например, ОПЕК – организация стран производителей нефти. Они договариваются о том, чтобы ограничить объём добычи нефти, уменьшить предложение и поднять цену. Опять же мы видим парадокс шантажиста, так как те страны, которые не входят в ОПЕК, могут рассуждать так: раз они договорились, тогда можно занять освободившуюся нишу, увеличив собственный объём добычи. Так же, как поступает Япония в примере с китами.
Экология (14:41)
Человечество научилось договариваться на уровне государств только тогда, когда появляется общий враг, например разрушение окружающей среды.

Пример. Пётр I издал экологический указ о запрещении вырубки лесов в 10-километровой зоне от берега реки:
Указ от 1 февраля 1703 г. предписывал: «Во всех городах и уездах, в дворцовых, и в патриарших, и в монастырских, и всяких чинов помещичьих и вотчинниковых землях осмотреть и описать леса заповедных пород, к которым отнесены: дуб, клён, сосна, вяз, карагач, лиственница. При том сосну только такую, которая в отрубе в 12 вершков и больше, годная на корабельные и иных морских судов строение. А описав, где таких лесов и насколько мерою есть от больших рек в стороны на 50 вёрст, а от средних и малых рек, которые в те большие реки впали, а плавному ходу по ним можно, по 20 и 30 вёрст, а буде где явятся заповедные леса от рек указанными вёрстами, и те леса описать везде, чтобы вышеописанных заповедных лесов не в описи нигде не было»
До этого каждый крестьянин вырубал деревья там, где хотел, где ему это было выгодно, хотя всем вместе, очевидно, было невыгодно, если река обмелеет. А именно это произойдёт, когда весь лес около реки будет вырублен. Таким образом, опять внешняя сила решила задачу дилеммы заключённого, лес не вырубался – реки сохранились.

То же самое проделал сёгун в Японии в XVI веке. Сказал пересчитать все деревья и присвоил их себе. Так он запретил их вырубать и сохранил леса. Наверное, это локально повлияло на население, рождаемость, выживание и прочее. Однако в целом для Японии это оказалось выгодным.

Есть ситуации, когда этого не сделали. Например, на Гаити (см. рис. 7) жители вырубили почти весь лес, и произошла экологическая неприятность. То же самое происходило в Исландии.
Рис. 7. Растительность на Гаити
Ещё один пример – отказ от пластиковых пакетов. Понятно, что каждому локально выгодно использовать пластиковый пакет: удобный, дешёвый и многоразовый. И магазину удобно, и нам удобно – всем удобно. Но если всех спросить: что выгоднее – не использовать пластиковые пакеты и перейти на разлагаемые бумажные, при этом сохранив океан (см. рис. 8), то большинство, конечно, согласится перейти на бумажные пакеты.
Рис. 8. Загрязнение океана пластиком
Но, опять-таки, возвращаясь к в дилемме заключённого, мы не можем решить эту проблему без внешнего фактора – государства. Сейчас в России обсуждают предложение о запрете использования пластиковых стаканов, бутылок, пакетов и т. д. в рекреационных зонах.

Здесь о решении может думать только государство, потому что даже если кто-то и начнёт решать эту задачу локально и говорить, что он не будет использовать пластик, то понятно, что в общей массе людей это будет незаметно.
Дилемма заключённого в эволюции (19:06)
Не нужно думать, что только у людей такая проблема с дилеммой заключённого. С ней столкнулись и, например, павлины. Если бы все самцы могли эволюционно договориться, то им бы не нужно было таскать такие большие красивые хвосты – ведь самки не могут отказаться от спаривания, потому что иначе не будет продолжения рода. Но поскольку они договориться не могут, то половая избирательность зацепилась за этот признак и стали «побеждать» те особи, у которых гены предполагали более красивый и пышный хвост, так как они быстрее и больше размножались. В итоге – очень неудобный хвост, который мешает спасаться от хищников, зато привлекает самок (см. рис. 9).
Рис. 9. Павлиний хвост
Иногда (в эволюционном смысле) это доходит до абсурда. Существует птица большой аргус (фазан), у которого маховое перо на крыле (см. рис. 10) стало таким большим в результате этого полового отбора, что она не умеет летать. Тут ничего рационального нет, это просто эволюционный тупик.
Рис. 10. Большой аргус
Ещё один пример – это оленьи рога (см. рис. 11). Это половой признак, который никакой другой функции, кроме как функция отбора, не несёт. Понятно, что неудобно ходить по тайге с такими рогами, но у кого они красивее, выше, больше, тот имеет преимущество на таком вот межполовом торге. Поскольку основная задача – это продление рода, то он получает преимущество и его гены распространяются больше. Рога становятся все больше и больше.
Рис. 11. Оленьи рога
Дилемма заключённого – общая логическая конструкция, поэтому она заслуживает название математической. Конечно, математики её обобщают и формализуют гораздо сильнее в специальном разделе, который называется теорией игр.
Заключение (21:49)
Доверие и длина технологической цепочки – это связанные вещи. То, что я не заготавливаю на зиму дров и знаю, что город меня обеспечит теплом, позволяет мне продолжать делать свою работу. Каждый действует так, и мы вместе образуем длинную технологическую цепочку и двигаемся вперёд, порождая прогресс.
Другие материалы