Из прошлого урока мы узнали, что каждая игра состоит из игроков, действий, или стратегий, и выплат. В этом уроке я объясню, как представить такую игру в нормальной форме. За основу мы возьмем дилемму заключенного. Сценарий таков: два человека совершили преступление. Ограбили банк, к примеру. Им не повезло, их поймали. И копы первым же делом рассадили их по разным камерам, чтобы устроить допрос. У пойманных есть два варианта. Они могут либо признаться в содеянном, либо закрыть рты на замок. Подвох в том, что у копов нет достаточно доказательств, чтобы закрыть их за фактическое ограбление. Так что если оба будут молчать, то срок получится меньше. Но если признаются, то копы посадят их надолго. Ситуация усложняется тем, что если один игрок признается, а другой нет, тому, что признался и сдал сообщника, ослабят наказание. Мы углубимся в теорию во второй части, это краткий набросок происходящего. Итак, кто участвует в этой игре? Мы можем назвать их преступник-1 и преступник-2, но я назову их игрок-1 и игрок-2. И действия, которые они могут совершить, это либо признаться (Confess), либо не признаться (Don't confess). "D" у меня означает "Не признаться". Здесь нужно кое-что прояснить в терминологии. Вам могут встречаться "C" и "D" в качестве "Содействовать" и "Дезертировать". Я привык использовать "Признаться" и "Не признаться". Когда вы используете терминологию "Содействовать" и "Дезертировать", выплаты отличаются. Так что если вы в замешательстве, смотрите, что в выплатах. В нашем случае мы всегда используем "Признаться" и "Не признаваться". Хорошо, теперь мы распишем выплаты. Каковы исходы для игрока-1? Выплата игрока-1, когда они оба признаются, когда признается игрок-1 и игрок-2, равняется 2-м. Мы обозначим это число в качестве лет, которые им сбавят с назначенного срока, потому что помните, что игрок по сути получил награду, так что наши выплаты будут представлять собой годы, которые им сбавили. Теперь, выплата игрока-1, когда он признается, но игрок-2 не признается, равняется 4-м. Помните, игрок-1 получает награду, когда сдает своего сообщника, в то время как его сообщник молчит. Таким образом, копы могут посадить игрока-2 на больший период, а игрок-1 получает меньший срок, потому что признался в преступлении. Что насчет выплаты игрока-1... когда он не признается, он молчит, но игрок-2 признается в преступлении и сдает сообщника. В этом случае игроку-1 сбавляют лишь 1 год. Наконец, когда они оба молчат, игрок-1 молчит, игрок-2 молчит, тогда им сбавляют 3 года с их срока. Возможно, им не повесят срок за ограбление банка, но они получат что-то вроде нападения при отягчающих обстоятельствах, что-то с меньшим сроком, чем ограбление банка. Теперь я думаю о том, что им могут дать. Окей, итак, это игра, у нас есть игроки, действия и выплаты. Хочу уточнить, что выплаты для игрока-2 будут одинаковыми, то есть это симметричная игра, и когда они оба признаются, игрок-2 получает 2 года, когда они оба не признаются, игрок-2 получает 3 года, и оставшееся меняется местами. Например, если игрок-1 не признается, а игрок-2 признается, игрок-2 получает 4 года за то, что сдал напарника, и так далее. Хорошо, теперь мы представим эту игру в нормальной форме. Я нарисовал здесь игроков, игрока-1 и игрока-2, и их действия: признаться, не признаться. Единственная вещь, которой здесь не хватает, это заполнить выплаты. Давайте начнем с игрока-2, игрок-2 красный. Если они оба признаются, игрок-2 признается и игрок-1 признается, мы говорим, что награда игрока-2, в смысле его ослабление срока, составляет 2. Когда игрок-2 признается, но игрок-1 молчит, так что игрок-2 выдает игрока-1, игроку-2 сбавляют срок на 4 года.. Когда игрок-2 не признается, но игрок-1 признается, игрок-1 сдает игрока-2, тогда игрок-2 получает минус 1 год. И наконец, когда они оба молчат, никто ничего не говорит, они оба не признаются — игрок-2 получает в награду 3. Теперь проделаем то же самое для игрока-1. Мы сказали, что если они оба признаются, игрок-1 также получает 2 года. Когда игрок-1 признается, а игрок-2 не признается, игрок-1 получает в награду 1, потому что игрок-2 выдал его. Таким же образом, когда игрок-2 признается — простите, когда игрок-1 признается, но игрок-2 ничего не говорит, тогда игрок-1 получает награду за то, что он выдал игрока-2, и он получает 4 года минус. В конце концов, когда они оба ничего не говорят, им обоим скидывают по 3 года. Это и есть представление дилеммы преступника в нормальной форме. У нас есть игроки: игрок-1 в синем, игрок-2 в красном; действия: признаться и не признаться; и выплаты. Еще раз, например, мы видим, что если игрок-1 признается и игрок-2 признается, у них у обоих выплата равна 2-м. И мы можем сделать это для любой стратегической комбинации, чтобы получить выплаты всех игроков в любом сходящемся параметре. В следующем уроке мы вычислим равновесие Нэша для этой игры и решим ее.