Форум "Солнечногорской газеты"-для думающих людей - Показать сообщение отдельно

Константин Сонин · #8 01.06.2014, 16:48

Урок № 6. Подбросить монетку перед самым серьезным выбором? Это может быть совершенно рационально

1988 год. Это был последний шанс сборной СССР по футболу завоевать звание чемпиона Европы. После фантастических голов Рууда Гуллита и Марко ван Бастена советские футболисты проигрывали 0:2, но время еще оставалось, и тут — это не так часто случается в финалах чемпионатов Европы! — судья назначил пенальти в ворота голландцев. Бить взялся Игорь Беланов, за два года до этого названный лучшим футболистом Европы. Он забивал пенальти лучшим вратарям мира — Ринату Дасаеву и Жан-Мари Пфаффу, на его удар было просто невозможно среагировать — мяч летел как ядро. И голландский вратарь Ханс ван Брекелен даже не пытался реагировать. Он бросился наугад. Пущенный Белановым с невероятной силой мяч попал ему в ногу и отскочил в поле. Сборная СССР упустила свой шанс.

Конечно, это была чистая случайность. Сильно пущенный мяч пролетает одиннадцать метров за полсекунды, и никакая реакция не может здесь помочь. Полети мяч в другой угол, ван Брекелен оказался бы бессилен, а сборная СССР получила бы возможность отыграться. Но, оказывается, прыгать «случайно» — это и есть самая лучшая стратегия, так что ван Брекелену есть чем гордиться. Он поступил оптимальным образом.
СМЕШАННЫЕ СТРАТЕГИИ

Если спросить экономиста, что произойдет в той или иной ситуации, в которой у участников есть возможность выбирать стратегию, он вам ответит — надо посмотреть, что произойдет «в равновесии». А что такое равновесие? Это такой выбор каждого из действующих лиц, что, если бы они знали, что выбирают оппоненты, они бы не стали пересматривать свой выбор. А что же делать, если, узнав выбор других, хочется поменять свой?

Представьте себе такую игру: один игрок пишет на бумажке «черное» или «белое», а второй угадывает. Если угадает, то заработает рубль, а если нет — то проиграет рубль. Правила понятны?

У каждого из игроков по две чистые стратегии: у одного — загадать один из двух цветов, у другого — сказать «черное» или «белое». Но если стратегия первого будет состоять в том, чтобы загадывать «белое», то второй, конечно, будет говорить «белое» и выигрывать. А если загадывающий знает, что второй собирается сказать «белое», то он лучше загадает «черное» и окажется в выигрыше. Получается, что на каждый выбор загадывающего имеется такой ответ, что ему захочется поменять свой выбор. И наоборот: если бы тот, кто загадывает, знал, какую стратегию применяет второй, он бы поменял цвет. Так что чистые стратегии в этой игре не дают равновесия.

Зато если загадывающий «смешает» стратегии — подкинет тайком монетку и, если выпадет решка, напишет «белое», а если орел — «черное», то у второго есть такой ответ, что первому все равно будет выгодно придерживаться этой смешанной стратегии. А именно: второй игрок тоже будет подкидывать тайком монетку и называть цвет в зависимости от того, какой стороной она выпала. Таким образом и будет достигнуто равновесие.

Нечто похожее происходит и при исполнении одиннадцатиметрового. Грубо говоря, у бьющего пенальти есть три стратегии — ударить в правый угол, в левый или, сделав вид, что бьет в угол, ударить по центру. И у вратаря возможностей тоже три — прыгнуть вправо, прыгнуть влево и остаться на месте. Точно так же, как и в игре с загадыванием цветов, равновесие здесь возможно только «смешанное». В голове у вратаря должен быть небольшой датчик случайных чисел — только тогда его действия окажутся оптимальными.
ЭМПИРИЧЕСКИЙ ВОПРОС

Игра в «черное» и «белое» показывает, что без смешанных стратегий часто не обойтись. Это теоретически. Три американских экономиста — Стивен Левитт, знаменитый автор популярной книги «Фрикономика», Пьер-Андре Кьяппори и Тимоти Гроузклоуз — решили посмотреть, насколько точно следуют предписаниям экономической теории профессиональные футболисты20. И оказалось, что и вратари, и «пенальтисты» довольно устойчиво следуют оптимальным стратегиям — прыгают и бьют по углам случайным образом.

Как проводилось исследование? Чтобы определить, в какой угол прыгал вратарь и куда бил игрок, исполняющий одиннадцатиметровый, экономисты просмотрели фрагменты матчей французской и итальянской профессиональных лиг за три года. За это время было пробито 459 пенальти 162 игроками, в воротах стояло 88 вратарей. Из пенальтистов 58 процентов пробило не менее чем по 4 раза. Ни один не пробил все удары в один угол.

Для статистического анализа было бы совсем хорошо, если бы были сведения о конкретных парах «вратарь-пенальтист», которые бы встретились в одиннадцатиметровом раз двадцать за несколько лет. К сожалению, один и тот же пенальтист с одним и тем же вратарем встречается, как правило, не чаще чем два-три раза за карьеру.

Важнейшее предположение, которое необходимо было сделать авторам, состояло в том, что вратарь и игрок, бьющий пенальти, делают свой выбор — куда прыгать и куда бить — одновременно. Несмотря на то что может показаться, что исполнитель пенальти часто ждет, пока вратарь начнет движение в угол, предположение о том, что решения принимаются независимо, вполне согласуется с данными. Авторам не удалось обнаружить корреляцию — то есть статистическую зависимость — между направлениями броска вратаря и удара. Кстати, в точном соответствии с наблюдениями футбольных знатоков, выбор игрока не зависит оттого, как прыгал вратарь в предыдущих случаях, а вот вратари, по-видимому, знают о приемах бьющих пенальти игроков. На чемпионате мира 2006 года у вратаря сборной Германии Йенса Леманна даже была шпаргалка со сведениями о том, как били пенальти игроки команды соперников, в которую он подглядывал между ударами. Впрочем, даже здесь теоретическое соображение о том, что прыгать нужно «случайно», сработало. Когда аргентинец Роберто Айяла готовился к удару, Леманн посмотрел на шпаргалку и, увидев, что там написано «правый угол», прыгнул влево и отбил удар. Есть и некоторые тонкости — например, игроки-правши (то есть примерно 85 процентов от всех игроков) бьют, как правило, в левый от себя угол. При статистических вычислениях это нужно учитывать. Вероятность гола, если вратарь выбрал «неправильный» угол, — от 82 до 95 процентов (результат варьируется в зависимости от того, насколько точно произведено измерение), а если «правильный» — то от 43 до 64 процентов. Доказательством того, что футболисты используют именно смешанные стратегии, является отсутствие закономерности в последовательности ударов одного игрока и направлений прыжков одного вратаря. Работа трех экономистов в основном состояла в очистке исходных данных, чтобы никакие статистические помехи не помешали уловить то, что профессиональные футболисты действительно «смешивают» стратегии — прыгают и бьют случайным образом.

Конечно, было бы странно предполагать, что профессиональные голкиперы, у подавляющего большинства которых нет высшего образования, что-нибудь слышали о смешанных стратегиях. Или чтобы они, тайком от телекамер, подкидывали монетку, обеспечивая «случайность» своих действий. Однако вполне может так быть, что вратари, играющие в лучших профессиональных лигах, прошли, среди прочего, «естественный отбор» по врожденной способности смешивать стратегии.

Это касается не только футбола. В статье экономистов Уокера и Вудерса, опубликованной в American Economic Review в 2001 году21, рассматривались стратегии, применяемые сильнейшими теннисистами мира. Оказывается, их действия вполне соответствовали теории, причем взрослые, сложившиеся игроки «смешивали» гораздо лучше, чем юные.
УМНАЯ ИГРА В ДУРАКА

Недавно я слышал, как один лектор в серьезном экономическом вузе бросил ассистенту по курсу теории игр: «Поставьте в экзамен задачи на чистые стратегии. Смешанные — это теоретики выдумали». Интересно, приходилось ли этому лектору когда-нибудь играть в преферанс, бридж или хотя бы в дурака? Если он не использовал смешанные стратегии, то, наверное, часто проигрывал.

Что такое чистая, то есть не смешанная стратегия в преферансе? Это значит, что, если даже вам все равно, какую карту сбрасывать на козырь оппонента или с какой делать заход, вы в одной и той же ситуации всегда делаете одно и то же. Вспоминается — внимание, неправильный! — совет бабушки пирата из шуточной песенки Эдуарда Успенского «И всегда ходи с бубей, если хода нету!». Если вы последуете этому совету, то оппонентам будет гораздо легче играть против вас, потому что ваши ходы будут нести больше информации о тех картах, которые у вас на руках. Даже при игре в дурака — если вы будете придерживаться какой-то заранее заданной чистой стратегии (иными словами, у вас будет листочек, в котором будет описан ваш ход в каждой возможной ситуации) — это значительно упростит игру вашим оппонентам. А вы останетесь в дураках.

СПЕЦИАЛИСТЫ ПО ШАНТАЖУ И БЛЕФУ
Нобелевский урок: Мало сжечь мосты: надо, чтобы противник это видел!

Томас Шеллинг — «запоздалый» нобелевский лауреат. Он получил свою премию в 2005 году за книгу, написанную за 45 лет до этого и уже тогда принесшую ему мировую славу, «Стратегия конфликта». Едва выйдя в свет, она стала не только настольной книгой лидеров мировых держав — для них она и была написана, — но и стандартным учебником по разным дисциплинам, от международных отношений до корпоративного менеджмента.

Книга вышла настоящим бестселлером. Абстрактные рассуждения о структурных вопросах внешней политики перемежались цитатами из действующих глав государств, а изящные теоретические концепции иллюстрировались занимательными примерами. Чего стоит пример с двумя грузовиками, груженными динамитом, пытающимися разъехаться на узкой дороге. Одновременно эта книга, совершенно практическая по сути, дала старт огромному числу экономических теорий.

До Шеллинга экономисты, которые занимались теорией конфликтов и кооперации, в основном работали над нормативными вопросами. Например, как можно определить «справедливую долю» каждого участника в дележке какого-нибудь приза? Шеллинг задался вопросом о том, как торг и переговоры происходят в реальном мире.

Выяснилось, что такие, казалось бы, понятные всем стратегии, как «шантаж» и «блеф», на практике требуют очень тонкого анализа. Помните, Рональд Коуз, другой нобелевский лауреат, тоже интересовался проблемами «шантажа» Его тогда интересовала «точка отсчета». Кто имеет право на что: жертва имеет право на всю информацию о себе, и шантажист должен быть наказан или шантажист имеет право публиковать все, что ему вздумается, а жертва должна платить, если хочет, чтобы какая-то информация осталась тайной?

Шеллинг занялся совсем другими вопросами: что такое «шантаж» и что такое «блеф» как стратегическое взаимодействие? Ясно, например, что генерал, приказывающий сжечь мосты позади своей армии, не просто поднимает боевой дух солдат. Он показывает противнику готовность идти в бою до конца. То есть, вопреки примитивному «здравому смыслу», можно получить стратегическое преимущество, сократив количество доступных действий. В данном случае генерал отказывается от возможности отступить, если бой будет складываться неудачно.

В книге 1966 года, которая развивала заложенные в «Стратегии конфликта» идеи22, Шеллинг приводит в пример ситуацию из переговоров Хрущева с американским посланником Гарриманом. Речь идет о возможном использовании американских танков в конфликте вокруг Западного Берлина. Хрущев говорит: «Если вы хотите войны, вы ее получите — но это будет ваша война. Наши ракеты полетят автоматически». Казалось бы, советский лидер сужает свой собственный арсенал ответов, но, в точном соответствии с теорией Шеллинга, он получает стратегическое преимущество в результате этого сужения. Раз ракеты полетят автоматически, у американских генералов нет возможности строить свой расчет на том, что после их хода — в изменившейся ситуации — противнику может оказаться выгодно отступить. Вся идеология ядерного сдерживания была построена именно на этой идее, а сколько отдельных эпизодов шантажа и блефа произошло во время одного только Карибского кризиса — и не перечесть.

Примеры с генералом и мостами, с Хрущевым и ракетами позволили Шеллингу показать, что информированность сторон играет ключевую роль в стратегическом взаимодействии. Если противник не узнает о том, что генерал сжег мосты, то этот поступок резко теряет в силе, потому что противник может начать наступление, думая, что мосты целы и войска генерала могут отступить. Значит, даже если враг узнает об этом, ему будет выгодно притвориться, что он об этом не знает. В свою очередь, генералу выгодно вести себя так, как будто он уверен, что противник знает о его поступке, и т. д.

Шеллинг — один из тех нобелевских лауреатов, чья сила была вовсе не в умении строить сложные формальные модели или проводить хитроумные статистические вычисления. После окончания Беркли и аспирантуры в Гарварде он работал в государственных учреждениях, консультировал бизнесменов и правительство. На такой работе требуются прежде всего ясность идей и прозрачность аргументации. Сама мысль о том, что правительства и корпорации вовлечены в стратегическое взаимодействие — «большую игру», в которой результат зависит не только от сделанных ходов, но и от тех, которые только могли бы быть сделаны, была революционной. Но Томас Шеллинг создал больше чем полноценную теорию стратегического взаимодействия (в математике ее чаще называют «теорией игр») — он создал теорию без математического аппарата.

Часть этого аппарата появилась только через десять лет в работах Рихарда Зелтена и Джона Харшаньи, а получили они Нобелевскую премию на десять лет раньше, чем Шеллинг. Третьим лауреатом в 1994 году стал создатель формальной концепции стратегического равновесия Джон Нэш, выдающийся математик и экономист, главный герой фильма «Игры разума». Однако самый большой вклад в формализацию идей Шеллинга внес Роберт Ауманн.
ПОЧЕМУ АННА НЕ СМЕЕТСЯ

В аспирантуре Массачусетского технологического института, где Роберт Ауманн занимался не экономикой, а чистой математикой, он познакомился с Джоном Нэшем, который и заинтересовал его теорией игр — в то время лишь зарождающейся дисциплиной. Тогда никто не мог представить, что через несколько десятилетий теория игр станет обязательным инструментом в арсенале любого экономиста, а соответствующий курс будет читаться на всех экономических факультетах мира.

Работы Шеллинга в начале 1960-х позволили взглянуть на стратегии мировых держав свежим взглядом, но к 1970-м появились новые вопросы. Ни одна из сторон не была заинтересована в ядерном конфликте, но в то же время каждая хотела добиться максимума уступок от другой. Напряженность держалась десятилетиями, а любая неосторожность могла привести к ядерной катастрофе. Неудивительно, что американские политики консультировались у специалистов по теории игр. Именно в тот период возникла теория повторяющихся взаимодействий, решающий вклад в которую внес Роберт Ауманн. Основной результат этой теории, известный в экономической науке как «народная теорема», состоит в том, что при повторяющихся взаимодействиях стороны могут воздерживаться от действий, сулящих им краткосрочную выгоду.

Народная теорема, после того как она была сформулирована, перестала производить впечатление на профессиональных математиков — им результат кажется тривиальным. Но придумать эту теорему, предложить формальное описание конфликта, которое можно использовать и в научной дискуссии, и на практике, построить модель, которая позволит отсечь несущественное и выделить движущие механизмы конфликта, было отнюдь не просто.

То же относится и к другой фундаментальной идее, предложенной Ауманном, — концепции общего знания. Эту концепцию можно проиллюстрировать на примере истории о трех барышнях — назовем их Анна, Бетти и Вероника, — едущих в поезде по викторианской Англии. У всех трех лица вымазаны сажей из паровозной трубы, но зеркала поблизости нет, и каждая видит лишь двух других и смеется. Ведь каждая считает, что она-то — чистая!

В купе заходит проводник и, между прочим, сообщает им следующую новость: «Среди вас есть девушка, у которой нос в саже». Проходит пара минут, и вдруг самая умная из них — скажем, Анна — перестает смеяться, понимая, что и у нее лицо перепачкано. Разве не удивительно? На первый взгляд кажется, что проводник не сообщил девушкам никакой новой информации. Каждая из них и так знает, что в купе есть девушка с испачканным носом, — она же видит перед собой даже не один, а два испачканных носа!

Оказывается, новая информация к девушкам поступает. Теперь каждая из них знает не только то, что в купе есть девушка с испачканным носом, но и то, что две другие девушки знают, что она знает. Услышав слова проводника, Анна рассуждает так: «Если бы у меня не было испачкано лицо, то Бетти, видя смеющуюся Веронику, догадалась бы, что смеется она над ней, потому что, видя мое чистое лицо и лицо Бетти, Вероника считает, что ее лицо чисто. Тогда Бетти сама перестала бы смеяться, но она не перестает, а значит, у меня тоже лицо в саже». То есть все-таки проводник сообщил Анне новую информацию. После его слов Анна знает, что две ее подружки тоже слышали те же самые слова, и рассуждает, опираясь на эту, ставшую «общей», информацию.

В жизни каждый из участников взаимодействия, как правило, обладает неполной информацией о возможностях других участников. Фирма может не знать точно параметры технологии, доступной конкуренту, а государства обладают лишь приблизительными сведениями о численности и вооружении иностранных армий. Вместе с тем некоторые параметры взаимодействия известны всем сторонам, а также известно, что эти параметры всем известны, и так далее. При принятии решения каждая из сторон должна учитывать не только имеющуюся у нее самой информацию, но и то, доступна ли эта информация другим сторонам, насколько другие стороны осведомлены о доступности этой информации друг для друга, и так далее.

Помните пример с генералом и его противником у Шеллинга? Общим знанием называется информация, про которую все участники знают, что она доступна всем. В примере с барышнями Анна в своих рассуждениях опиралась не только на то, что Вероника смеется, но и на то, что Бетти знает, что Вероника смеется. Казалось бы, ничего сложного, однако разработка такого подхода, который позволял бы анализировать конфликты и кооперацию в самых разных ситуациях, была когда-то настоящим прорывом.