Дилемма заключённого. Часть 1. Парадокс шантажиста
Видео и статья на тему «Основы рационального поведения»
Введение. Разделение труда (00:00)
Предположим, что сейчас осень и скоро наступит зима. К вам приехал какой-то дальний родственник из глухой деревни на севере, который никогда нигде не был, кроме своей деревни. Он спросит: «А где твои дрова? Ты их заготовил на зиму? Чем отапливаться будешь? А где вода, если что-то замёрзнет?». Но ведь он прав. Действительно, почему вы продолжаете делать то, что делаете обычно? Почему вы не идёте в лес и не рубите дрова? Ответ прост: вы доверяете остальным. Вы знаете, что остальные делают своё дело и что отопительная система будет работать. Вода в кране тоже будет, а если не будет, то эту ситуацию быстро устранят, т. е. у нас существует разделение труда.
Почему сложно собрать деньги на торт (01:52)
Рассмотрим такой пример. Собрались 10 человек. Нам нужно купить торт за 150 рублей. Мы бросаем деньги в шляпу, причём никто не знает, кто сколько бросит денег, но предполагается, что каждый кинет 20 рублей. Тогда в шляпе получится 200 рублей, что больше, чем необходимые для покупки 150 (см. рис. 1).
Рис. 1. Если каждый положит по 20 рублей
Но каждый понимает, что можно, вообще-то, и 10 рублей бросить. Если все положат по 20, то у меня останется лишних 10 рублей, а денег на торт всё равно хватит. И задача решится, и я в плюсе. Но если каждый будет так рассуждать, то в шляпе соберётся всего 100 рублей, и торт мы уже не купим (см. рис. 2).
Рис. 2. Если каждый подумает о собственной выгоде и положит только 10 рублей
Дилемма заключённого (02:32)
В математике это называется дилеммой заключённого. Она формулируется для двух человек и немного в мрачном тоне, потому что действие происходит в тюрьме. Классическая её формулировка следующая: есть два преступника, которым следствие предлагает заключить сделку. Заключённые находятся в разных камерах и не могут общаться друг с другом (см. рис. 3).
Рис. 3. Условие дилеммы заключённого
Условие сделки очень просты (см. табл. 1). Если оба признаются, то получат по 4 года тюрьмы; если один признается, а другой – нет, то тот, кто признался, выходит на свободу как заключивший сделку, а второй получает 6 лет; если оба хранят молчание, то они получают по 2 года заключения.
Таблица 1. Условия сделки
Поставим себя на место заключённого. Он думает про второго: «Если он признается, а я нет, то я получу 6 лет тюрьмы – выгоднее признаться. С другой стороны, если он будет молчать, то мне тоже выгодно признаться, потому что тогда я выйду на свободу. В любом случае выгоднее признаться». Оба рассуждают так и приходят к выводу, что каждому из них выгоднее признаться. В итоге оба признаются и сидят 4 года вместо 2. В этом и заключается дилемма (парадокс) – каждый по отдельности рассуждает правильно, но решение для обоих оказывается неоптимальным.
Они бы решили эту задачу и не признались, если бы:

  • доверяли друг другу, то есть это была бы устойчивая группировка;
  • присутствовал внешний фактор, например босс мафии, которого они боятся больше, чем 2, 4 или 6 лет заключения;
  • они уже много раз оказывались «за решёткой» и знают о таких сделках.
Т. е. для решения таких задач должен существовать некий внешний фактор или расширение этой задачи. Каждому отдельно выгодно признаться, но если бы они думали о себе как о единой команде, то для команды в целом выгодно не признаваться. В таком случае они бы оба выиграли. Вспомним пример с покупкой торта: если каждый скинется по 10 рублей, то торт купить не получится, т. е. всем не выгодно. Но если бы эти люди доверяли друг другу, то исход был бы совсем другим.
Императив Канта (06:08)
Это классическая проблема. На самом деле мы относимся так практически к любому общему ресурсу. Почему возникает коррупция? Потому что локально мне выгодно, например, забрать эти трубы себе на дачу или украсть что-то, подкупить кого-то и т. д. Я против коррупции вообще, но в данной ситуации мне это более выгодно, т. е. я не доверяю остальным. Но, поскольку так рассуждают многие, страдает общество в целом.

Существует так называемый императив Канта (см. рис. 4): «Поступай так, чтобы ты всегда относился к человечеству и в своём лице, и в лице всякого другого так же, как к цели, и никогда не относился бы к нему только как к средству». Это общественное правило, для выполнения которого нужна совесть. Так как если за вами никто не следит, то, кроме совести, никто не поможет решить эту задачу.
Рис. 4. Императив Канта
Подчеркнём один важный вывод из дилеммы заключённого. Эта задача может быть решена в двух случаях: наличие внешнего фактора (например, босс мафии) или расширение задачи («игра» происходит много раз – они не первый раз попадают «за решётку»).

Рассмотрим альтернативную постановку дилеммы заключённого: предположим, что годы заменены на минуты: 6 минут, 4 минуты и 2 минуты соответственно. Разница между 6 минутами и 2 минутами не такая большая, поэтому в первый раз я могу рискнуть и не признаться в надежде, что напарник тоже не сознается. А в следующих ситуациях вести себя исходя из того, как повёл себя напарник в прошлый раз (такая стратегия называется «око за око»). В результате выработается устойчивое доверие или недоверие.
Парадокс шантажиста (07:57)
Ранее мы говорили о сотрудничестве. Теперь рассмотрим пример такой игры, в которой один из участников отказывается сотрудничать.

Предположим, что нас с вами приглашает некий человек и предлагает поделить между собой $100 000 (см. рис. 5). Если мы договоримся, то каждый забирает оговорённую сумму. Если не договоримся – оба останемся ни с чем. Т. е. если хотя бы один из нас не согласится с предложенным распределением, то оба ничего не получают.
Рис. 5. Вам предлагают разделить $100 000
Кажется логичным разделить сумму пополам – мы оба не работали, не зарабатывали эти деньги, поэтому по-честному будет разделить их пополам (см. рис. 6). И вдруг оказывается, что второй – шантажист. Он предлагает разделить сумму 90/10: ему $90 000, а «приличному» – $10 000, или «приличный» вообще ничего не получит, так как на другие условия шантажист не согласен (см. рис. 7).
Рис. 6. Вариант разделения суммы 50/50
Рис. 7. Предложение шантажиста
Далее понятно. У человека есть две модели поведения. Или он пойдёт на принцип и ничего не получит. Или согласится получить хотя бы $10 000, так как это всё равно лучше, чем ноль. Вообще говоря, обе модели поведения разумны. В такой постановке задача является немного надуманной. Понятно, что всегда есть какие-то дополнительные условия. Например, человек, которому предлагают $10 000, может быть бедным, и ему эти деньги очень нужны. Естественно, что такой человек согласится. Или он наоборот обеспеченный, такой шантаж заставит его почувствовать себя ущемлённым, недовольным. В таком случае он не возьмёт эти деньги. Лучше 0, чем несправедливость.

Если никаких дополнительных факторов нет, то эта задача в чистом виде шантаж, с которым мы часто сталкиваемся и в жизни ещё с детства.

Например, в послевоенное время дети часто играли в игру (6 человек), где одни были русскими, а другие – немцами. Как-то дети делились, играли, а потом менялись. Кто-то говорил: «А я не буду немцем!». Что же делать? Можно не брать его с собой на игру, но тогда игроков будет 5 – не удастся на команды поделиться. Или поддаться на такой шантаж, чтобы игра продолжилась.

В таких ситуациях бывают все. Кто-то идёт на принцип, а остальные соглашаются с условиями шантажиста.
Проклятие общего ресурса (10:38)
Близкая ситуация с проклятием общего ресурса. Все договорились не вылавливать китов, а пара стран (например, Япония) говорит, что будет продолжать их вылавливать. Что делать остальным странам? Если все согласятся продолжать вылавливать, то скоро китов совсем не останется. Поэтому приходится терпеть, причем пока это выгодно и Японии, и всему остальному миру.

В биологии это называется паразитизмом. Паразит живёт в теле за счёт организма хозяина. Он умрёт, если умрёт хозяин, но он приносит ему вред. Он знает, что хозяин его кормит, потому что сам хочет выжить.
Как себя вести? (11:31)
Конечно возникает вопрос: «Можно ли бороться? И как себя вести?» Если эта игра или ситуация одноразовая для двух данных людей, то решения нет. Можно вести себя любым образом в зависимости от контекста или ожидаемых результатов. Возможно, вы будете себя всю жизнь плохо чувствовать от того, что «прогнулись» под кого-то, поддались на шантаж, или, наоборот, будете жалеть о том, что не взяли $10 000. Но если эта ситуация повторяется, то после первого раза можно сделать вывод: данный человек шантажист. Во-первых, в следующий раз вы уже вряд ли захотите иметь общее дело с этим человеком. Во-вторых, его не возьмут для участия в длинных технологических цепочках. Именно длинные технологические цепочки выгодны обществу. А шантажист может подвести или запросить слишком высокую цену. Т. е. такой человек испортит себе репутацию.
Технологическая цепочка – совокупность технологических операций, выполняемых в определённой последовательности, начиная с переработки сырья, необходимая и достаточная для изготовления конечного продукта.
Т. е. задача для одного раза не решаема, но если расширить её до большого количества раз, то шантажиста исключают, и он в конечном итоге проигрывает. Его не будут звать для участия в выгодных мероприятиях.
Заключение (13:12)
На этом уроке мы поговорили о дилемме заключённого и парадоксе шантажиста. Далее мы рассмотрим несколько приложений – ситуаций из жизни, в которых они встречаются: шум в классе, гонка вооружений, большие рога оленей и т. д. Сделаем это для того, чтобы каждый мог использовать решение этих задач в качестве схемы для размышления в тех ситуациях, в которые он попадает.

Другие материалы