Стратегические игры fb2. Авинаш Диксит, Дэвид Рейли и Сьюзан Скит. Стратегические игры. В. «Мы не можем сдавать экзамен, потому что у нас спустила шина»
Название: Теория игр. Искусство стратегического мышления в бизнесе и жизни
Писатель: Барри Дж. Нейлбафф, Авинаш Диксит
Год: 2008
Издательство: Манн, Иванов и Фербер (МИФ)
Жанры: Личностный рост, Зарубежная психология, Зарубежная образовательная литература, О бизнесе популярно
О книге «Теория игр. Искусство стратегического мышления в бизнесе и жизни» Барри Дж. Нейлбафф, Авинаш Диксит
То, что наша жизнь — игра, знают многие. Но знакомы ли вы с правилами этой игры, с некоторыми хитростями, которые помогают выигрывать и предугадывать ходы соперника? Барри Дж. Нейлбафф и Авинаш Каламакар Диксит поделились секретами успешной игровой деятельности, которую можно применять как в работе, как и в повседневной жизни.
Книга “Теория игр. Искусство стратегического мышления” — это настоящий самоучитель по выживанию в нелегкой современной жизни со всевозможными хитросплетениями и подвохами. Авторы доступными словами излагают сущность современного общества — все в нем играют. И хоть жизненные игры отличаются большей разветвленностью ходов, их природа такая же, как и в простых детских забавах. Барри Дж. Нейлбафф и Авинаш Каламакар Диксит приводят множество примеров из различных сфер жизни — шоу-бизнеса, спорта, политики, быта, семейной жизни, предпринимательской деятельности и т.д. — показывая вовлеченность людей в стратегические игры.
Главная идея книги гласит: чтобы успешно играть, необходимо правильно мыслить и четко все планировать. Без наличия базовых знаний в теории игр это невозможно. Также следует вспомнить школьные знания по алгебре, усвоить законы логики и некоторые экономические основы. В этом фундаментальном труде все проанализировано очень тщательно, поэтому поверхностно “проглотить” книгу не удастся — каждую главу нужно обдумывать и систематизировать. Однако, несмотря на академичность произведения, Барри Дж. Нейлбафф и Авинаш Каламакар Диксит написали его доступным языком с соблюдением четкой логики изложения теоретических аспектов и примеров к ним, поэтому материал будет понятен даже людям, далеким от математических расчетов. Читать этот труд, в первую очередь, следует тем, чья работа связана с коммуникацией: ведением переговоров, крупными продажами, консультированием по различного рода услугам и т.д.
Ценностью этого самоучителя является наличие небольшого практикума на последних страницах — здесь помещено несколько задач, направленных на тренировку мышления. Издание завершается впечатляющим списком литературы, который будет полезен для всех желающих продолжить изучение теории игр.
Читать работу “Теория игр. Искусство стратегического мышления” приятно не только с точки зрения познавательного материала, но и с целью развлечения — игра проникла даже в манеру написания. Авторы призывают читателя к размышлениям и поиску правильных вариантов среди всех возможных, а это — необходимое условие для успешного игрока.
На нашем литературном сайте books2you.ru вы можете скачать книгу Барри Дж. Нейлбафф, Авинаш Диксит «Теория игр. Искусство стратегического мышления в бизнесе и жизни» бесплатно в подходящих для разных устройств форматах — epub, fb2, txt, rtf. Вы любите читать книги и всегда следите за выходом новинок? У нас большой выбор книг самых разных жанров: классика, современная фантастика, литература по психологии и детские издания. К тому же мы предлагаем интересные и познавательные статьи для начинающих писателей и всех тех, кто хочет научиться красиво писать. Каждый наш посетитель сможет найти для себя что-то полезное и увлекательное.
Авинаш Диксит, Сьюзан Скит и Дэвид Рейли-младший
Стратегические игры. Доступный учебник по теории игр
В память о моем отце, Камалакаре Рамачандре Диксите
Авинаш Диксит
В память о моем отце, Джеймсе Эдварде Ските
Сьюзан Скит
Моей матери, Рони Рейли
Дэвид Рейли
Эту книгу хорошо дополняют:
Авинаш Диксит и Барри Нейлбафф
Чарльз Уилан
Стивен Строгац
Грейди Клейн и Алан Дебни
Алекс Беллос
Информация от издательства
Научный редактор Александр Минько
Издано с разрешения W.W.Norton&Company, Inc. и литературного агентства Andrew Nurnberg
На русском языке публикуется впервые
Диксит, Авинаш
Стратегические игры. Доступный учебник по теории игр / Авинаш Диксит, Сьюзан Скит и Дэвид Рейли-младший; пер. с англ. Н. Яцюк; [науч. ред. А. Минько]. - М.: Манн, Иванов и Фербер, 2017.
ISBN 978-5-00100-813-2
Доступный учебник по теории игр, который завоевал заслуженную популярность благодаря наглядным примерам и упражнениям, а также доступному изложению, не требующему от читателей серьезной математической подготовки.
Книга будет полезна как интересующимся математикой и ее применением в бизнесе и в жизни, так и тем, кто хочет развить стратегическое мышление и научиться принимать обоснованные решения.
Все права защищены. Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.
© W. W. Norton & Company, Inc., 2015, 2009, 2004, 1999
© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2017
Предисловие партнера издания
Перед вами логическое продолжение книги «Теория игр» Авинаша Диксита и Барри Нейлбаффа. В новой книге нас вновь вовлекают в разбор множества ситуаций, на основе которых мы учимся понимать виды различных стратегий и прогнозировать поведение участников игр.
В России теория игр стала уже не просто модной темой, но и обязательным знанием для людей, решающих сложные стратегические задачи. Спрос на литературу по этой теме растет, и вот перед вами одна из немногих достойных книг, в которой авторам удалось доступно раскрыть концепции и методики стратегической игры.
Интересный момент: стратегические игры не ограничиваются одним лишь математическим анализом ситуации. Одно из главных условий игры - наличие игроков, каждый из которых имеет свои желания, задачи и цели. И именно объединение методов психологии и математики дает возможность выстроить наиболее успешную стратегию игры.
Несмотря на то что все люди так или иначе сталкиваются с играми в повседневной жизни, есть те, кому эти знания необходимы в первую очередь. Я говорю о руководителях. Их роль заключается в том, чтобы достигать целей подразделения или организации, учитывая множество вовлеченных в процесс людей. Управление проектом, ведение переговоров, внедрение изменений - каждое из этих направлений бизнеса является стратегической игрой.
Как это выглядит на практике? Не так давно консультанты Samolov Group вели проект по сопровождению переговоров для руководителя крупной строительной компании. Задачей нашего заказчика было приобретение большого участка земли для строительства. Ему было затруднительно вести переговоры с партнером на своих условиях. Вместе с заказчиком мы проанализировали интересы и возможности оппонента. После сбора обнаружилось, что у партнера близится срок погашения большого кредита. Наш клиент предложил новые условия сделки, при которых оппонент имел возможность погасить этот самый кредит. Таким образом, контракт был подписан на ту сумму, на какую рассчитывал наш клиент. Пример иллюстрирует важность анализа игроков, поскольку это позволяет определить наиболее выигрышную стратегию.
Чем выше уровень руководителя, тем важнее для него развивать стратегическое мышление и умение применять методы теории игр на практике. В реальности же российские менеджеры привыкли решать ситуации «здесь и сейчас», не думая о долгосрочных сценариях. Поэтому обучение навыкам планирования, постановки целей, разработки стратегий дается довольно тяжело даже опытным руководителям. Необходимо признаться самому себе в том, что, если не развивать эти компетенции и не уделять должного внимания планированию, будет сложнее добиваться серьезных целей.
Стратегические игры – классический учебник по теории игр: четкие определения, вопросы, упражнения, глоссарий, доступное изложение. Стратегическое мышление – это способность анализировать взаимодействие с другими людьми, тогда как они точно так же анализируют ту же ситуацию. Теория игр – это наука о таком интерактивном принятии решений. Другими словами, – это наука о рациональном поведении в интерактивных ситуациях (то есть при наличии других игроков). После изучения книги вы будете понимать общие принципы анализа стратегических взаимодействий, что поможет вам принимать взвешенные и рациональные решения в бизнесе и жизни.
Авинаш Диксит, Дэвид Рейли и Сьюзан Скит. Стратегические игры. – М.: Манн, Иванов и Фербер, 2017. – 880 с.
Скачать конспект (краткое содержание) в формате или (конспект составляет около 4% от объема книги)
Часть I. Общие принципы
Глава 1. Основные концепции и примеры
Стратегическое мышление - это способность анализировать взаимодействие с другими людьми, тогда как они, в свою очередь, делают то же самое. Вы должны учитывать планы соперника, точно так же, как и он учитывает ваши. Теория игр - это анализ или, если хотите, наука о таком интерактивном процессе принятия решений. Когда вы выбираете свои действия, чтобы добиться максимального успеха исходя из собственных критериев, считается, что вы ведете себя рационально. Теория игр привносит еще один аспект в понятие рационального поведения, а именно: взаимодействие с другими, в равной степени рациональными людьми, принимающими решения. Иными словами, теория игр - это наука о рациональном поведении в интерактивных ситуациях.
Хорошие стратеги используют теорию игр в сочетании со своим опытом; можно сказать, что ведение стратегических игр - в не меньшей степени искусство, чем наука.
Глава 2. Подход к анализу стратегических игр
Мы проводим различие, обозначая термином стратегические игры взаимодействие между взаимно осведомленными игроками и термином решения ситуации, в которых каждый человек волен делать выбор, не заботясь о реакции или ответных действиях окружающих. В действительности у теории игр гораздо более широкая область действий. Многие ситуации, которые начинаются как обезличенный рынок с тысячами участников, превращаются в стратегическое взаимодействие между двумя или несколькими участниками. Это происходит по одной из двух причин: взаимные обязательства или личная информация.
Классификация игр основана на ответах на следующие вопросы:
- Ходы в игре выполняются последовательно или одновременно?
- Означает ли выигрыш одного игрока проигрыш другого? Если да, ситуацию называют игрой с нулевой суммой. Торговля или экономическая деятельность предлагает широкие возможности для сделок, приносящих пользу всем.
- Игра проводится разово или многократно, с одним и тем же или с меняющимися соперниками?
- Присуща ли игре неопределенность во внешних условиях и/или стратегии соперника? Сложные стратегические ситуации складываются в случаях, когда одному игроку известно больше, чем другому, и называются играми с асимметричной информацией .
- Являются ли правила игры фиксированными или ими можно манипулировать?
- Можно ли обеспечить выполнение соглашений о сотрудничестве? Если да, то игры называются кооперативными.
Термины. Стратегии - это имеющиеся в распоряжении игроков варианты выбора. Стратегия должна включать исчерпывающий план действий. Стратегия – плана выполнения последовательности действий в ответ на меняющиеся обстоятельства, возникающие в результате действий, предпринятых другими целеустремленными игроками.
Выигрышем называется число, соответствующее каждому возможному исходу игры. Если игрок сталкивается со случайным множеством исходов игры, то говорят об ожидаемом выигрыше равном среднему от выигрышей по каждому отдельному исходу, взвешенных по их вероятности. Если включить в концептуальную модель теории игр отношение игроков к риску, можно говорить о методе ожидаемой полезности.
Рациональность. В большинстве случаев теория игр исходит из предположения о рациональном поведении, имеющем две составляющие: понимание собственных интересов и расчет действий, наилучшим образом им соответствующий. Рациональность не означает, что игроки эгоистичны, или, что игроки мыслят в краткосрочной перспективе. Быть рациональным не значит иметь такую же систему ценностей, как другие игроки. Как правило, игроки даже не знают о системах ценностей других игроков; это одна из причин того, почему многие игры относятся к категории игр с неполной или асимметричной информацией.
Общее знание правил. Мы полагаем, что на определенном уровне у игроков есть общее понимание правил игры, которые состоят: 1) из списка игроков; 2) стратегии, имеющейся в распоряжении каждого игрока; 3) выигрышей каждого игрока по всем возможным комбинациям стратегий, которых придерживаются все игроки; 4) предположения о том, что каждый игрок - это рациональный максимизатор.
Концепция равновесия подразумевает, что каждый игрок использует стратегию, которая является лучшим откликом на стратегии других игроков. Мы сформулируем теоретико-игровые концепции равновесия в главах 37, а затем используем их в последующих главах.
Наблюдение и эксперимент. Любая теория должна соотноситься с реальностью двумя способами. Реальность должна помогать структурировать теорию и обеспечивать проверку ее результатов. Определить реальные характеристики стратегических взаимодействий позволяют два метода: 1) наблюдение за ними в естественных условиях и 2) проведение специальных экспериментов.
Мы предлагаем вашему вниманию три функции теории игр . Объяснение . Многие события и их последствия заставляют нас задаваться вопросом: почему это произошло? Прогнозирование . Консультации или рекомендации.
Часть II. Концепции и методы
Глава 3. Игры с последовательными ходами
Участникам игр с последовательными ходами необходимо проанализировать последствия своих текущих ходов, прежде чем выбирать действия. Как правило, анализ чистых игр с последовательными ходами требует построения дерева игры. Такое дерево состоит из узлов и ветвей, отображающих все вероятные действия каждого игрока при каждой возможности сделать ход, а также выигрыши для всех предполагаемых исходов игры (рис. 1). Стратегия каждого игрока представляет собой исчерпывающий план, описывающий его действия в каждом узле принятия решений в зависимости от всех возможных комбинаций действий, предпринятых другими игроками в предыдущих узлах. В концевых узлах выигрыши наших четырех героев перечислены в таком порядке: Энн, Боб, Крис, Деб.
Рис. 1. Пример дерева игры
Обратите ваше внимание на узел «Природа». В нем происходит случайное событие, например, подбрасывание монеты, и исход игры будет зависеть от того, выпадет орел или решка. Использование игрока под названием «Природа» позволяет ввести в игру фактор внешней неопределенности и предоставляет в наше распоряжение механизм, который делает возможным наступление событий, находящихся вне контроля реальных участников игры.
Размышления на дереве игры вы всегда должны начать с рассмотрения узлов действий, ведущих непосредственно к концевым узлам. Использование вариантов выбора в конце игры для прогнозирования последствий более ранних действий позволяет рассчитать выбор в узлах, предшествующих узлам окончательного принятия решений. Затем то же самое можно сделать с предыдущими узлами и т.д. Передвигаясь таким образом по дереву игры в обратном направлении, вы можете решить всю игру. Это метод обратных рассуждений .
Когда все участники игры для выбора оптимальных стратегий применяют метод обратных рассуждений, такая совокупность стратегий называется равновесием обратных рассуждений . В большинстве игр присутствует в точности одно такое равновесие.
Большинство людей, не имеющих опыта ведения стратегических игр, придерживаются мнения, будто преимущество первого хода должно присутствовать во всех играх. Однако это не так. Преимущество первого хода зависит от способности игрока взять на себя обязательство в связи с выгодной позицией и вынудить других игроков приспосабливаться к нему; преимущество второго хода обусловлено гибкостью адаптации игрока, делающего ход вторым, к выбору других игроков. Когда в игре есть преимущество первого или второго хода, каждый игрок может попытаться манипулировать порядком игры, чтобы обеспечить себе выгодную позицию.
Игра сороконожка. Экспериментатор кладет на стол монету в 10 центов. Игрок А может ее взять или пропустить ход. Если игрок А берет монету, игра закончена; при этом А получает 10 центов, а Б - ничего. Если игрок А пропускает ход, экспериментатор кладет на стол еще одну монету в 10 центов, и теперь игроку Б предстоит выбирать, взять ли ему обе монеты или пропустить ход. Игроки действуют по очереди, а стопка монет растет до тех пор, пока не достигнет одного доллара (рис. 2).
Рис. 2. Дерево игры Сороконожка
Проанализируем игру методом обратных рассуждений. Очевидно, что игрок Б возьмет один доллар на последнем этапе, поэтому игроку А следует взять 90 центов на предпоследнем этапе и т.д. Следовательно, игрок А должен взять монету в 10 центов в самом начале и закончить игру. Однако во время экспериментов такие игры длятся, как правило, несколько раундов. Благодаря иррациональному поведению игроки как группа получают больше денег, чем в случае, если бы они придерживались логики обратных рассуждений. В ходе аудиторного эксперимента, который проводил один из нас (Диксит), одна такая игра дошла до самого конца. Игрок Б забрал свой доллар и совершенно добровольно отдал 50 центов игроку А. Диксит спросил: «Вы сговорились? Вы с Б друзья?» На что игрок А ответил: «Нет, мы даже не были знакомы раньше. Но теперь он мой друг».
Игра указывает на возможную проблему с логикой обратных рассуждений в играх с ненулевой суммой. Обратите внимание, что, пропуская ход в первом раунде, игрок А уже показывает, что не опирается на метод обратных рассуждений. Так чего следует ожидать от него игроку Б в третьем раунде? Пропустив ход однажды, игрок А может снова это сделать, а значит, игроку Б было бы целесообразно пропустить ход во втором раунде. Игрок может сознательно пропустить ход в одном из начальных раундов игры, чтобы сигнализировать о готовности пропускать ходы в будущих раундах. Такая проблема не возникает в играх с нулевой суммой, в которых отсутствует стимул к сотрудничеству посредством ожидания.
Глава 4. Игры с одновременными ходами: дискретные стратегии
Игры с одновременными ходами и дискретными стратегиями удобно описывать с помощью таблицы игры (рис. 3). В случае игры с двумя участниками таблица имеет два измерения, а заголовки строк и столбцов в ней - это стратегии, находящиеся в распоряжении первого и второго игроков. В ячейках указываются выигрыши, которые получат игроки при подобающей конфигурации стратегий. Игры с тремя участниками требуют трехмерной таблицы. Принято считать, что из двух чисел, отображающих выигрыши, первое число отвечает выигрышу Строки, а второе - выигрышу Столбца.
Рис. 3. Представление игры с одновременными ходами в виде таблицы
Равновесие Нэша на рис. 3 соответствует строке Низко и столбцу Посредине. Строка не может увеличить свой выигрыш, двигаясь вверх или вниз по таблице. Аналогично Столбец не может увеличить свой выигрыш, двигаясь влево или вправо. Равновесие Нэша в игре представляет собой перечень стратегий (по одной на каждого участника), при котором ни один игрок не может увеличить выигрыш, выбрав другую стратегию из имеющихся в его распоряжении, если другие игроки придерживаются стратегий, оговоренных в этом перечне.
Равновесие Нэша не всегда оптимально для обоих игроков. На рис. 3 пара стратегий Внизу, Справа обеспечивает выигрыши 9, 7. Тем не менее, играя независимо друг от друга, игроки не смогут придерживаться именно этих стратегий. Получение выигрышей 9, 7 потребует кооперативного действия.
Если лучший выбор каждого игрока не зависит от правильности его убеждений в отношении другого игрока, говорят о доминирующих стратегиях у обоих игроков.
Некоторые стратегии игрока могут быть доминируемыми , даже если при этом ни одна стратегия не доминирует над остальными. Последовательное, или итеративное, исключение доминируемых стратегий сводится к их удалению и сокращению размера игры до тех пор, пока дальнейшее сокращение не станет невозможным. Например, на рис. 3 у Строки есть доминируемая стратегия Высоко, над которой доминирует стратегия Внизу (по всем столбцам). Это позволяет удалить строку Высоко.
Аналогично стратегия Столбца Слева доминируется стратегией Справа. Обратите внимание, что мы не могли сделать такой вывод раньше, до удаления стратегии Строки Высоко. В контексте оставшегося набора стратегий (Вверху, Низко и Внизу у Строки и Посредине и Справа у Столбца) стратегии Строки Вверху и Внизу доминируемы стратегией Низко. Когда у Строки остается только стратегия Низко, Столбец выберет свой наилучший ответ Посредине. Следовательно, эта игра разрешима по доминированию, а ее исход - Низко/Посредине с выигрышами 5, 4. Мы определили его как равновесие Нэша.
Другие игры могут быть не разрешимы по доминированию, а последовательное исключение доминируемых стратегий может не обеспечить уникальный исход игры.
Если исключение доминируемых стратегий не позволяет найти равновесие Нэша, можно применить анализ наилучших ответов . Какой лучший ответ данного игрока на каждый вариант выбора, который может сделать другой игрок? На рис. 4 мы обвели наилучшие ответы. В ячейке «низко» / «посредине» - два выделения. Следовательно, стратегии «низко» у Строки и «посредине» у Столбца будут лучшими ответами друг на друга. Мы нашли равновесие Нэша в этой игре еще раз.
Рис. 4. Анализ наилучших ответов
Когда анализ наилучших ответов в игре с дискретными стратегиями не обнаруживает равновесия Нэша, это означает, что в этой игре нет равновесия в чистых стратегиях.
В играх необязательно должно быть единственное равновесие Нэша. Существует класса игр, который можно обозначить как координационные игры . У их участников есть общие интересы, но поскольку игроки действуют независимо друг от друга, координация действий, необходимых для достижения общего предпочтительного исхода, проблематична. Для успешной координации действий необходимо, чтобы требуемый исход был фокальной точкой. Ожидания игроков должны сходиться в этой точке: все должны знать, что каждый знает, что … каждый делает этот выбор. Именно эту функцию выполняют многие общественные институты и договоренности.
В некоторых играх отсутствие равновесие Нэша в чистых стратегиях.
Глава 5. Игры с одновременными ходами: непрерывные стратегии, анализ и обсуждения
Рассмотрим пример ценовой конкуренция. Владельцы двух ресторанов должны установить цены на блюда так, чтобы максимизировать прибыль. Поскольку цены могут принимать любое значение в пределах (почти) бесконечного диапазона, найдем правила наилучших ответов и используем их для решения игры и определения равновесных цен. Обозначим цену ресторана 1 как P x , а 2, как P у. Допустим, обслуживание одного клиента обходится каждому ресторатору в 8 долларов. Предположим, что опыт или исследования рынка показывают, что количество клиентов, Q x и Q y (в сотнях клиентов в месяц) задается уравнениями
Q x = 44 – 2P x + P у
Q у = 44 – 2P у + P x
Основная идея этих уравнений состоит в том, что, если один ресторан повысит цену на 1 доллар (скажем, P y вырастает на один доллар), его объем продаж сократится на 200 в месяц (Q y уменьшится на 2), а объем продаж другого ресторана увеличится на 100 в месяц (Q x увеличится на 1). Можно предположить, что 100 клиентов перейдут в другой ресторана, а еще 100 останутся дома.
Прибыль рассчитывается как произведение чистого дохода на одного клиента (цена за вычетом затрат на обслуживание, или Р х – 8) и количества обслуженных клиентов:
π х = (P x – 8)Q x = (P x – 8)(44 – 2P x + P y) = –8(44 + Р у) + (16 + 44 + Р у)Р х – 2(Р х) 2 = –8(44 + Р у) + (60 + Р у)Р х – 2(Р х) 2
Если взять первую производную, то мы найдем значение Р х, при котором π х достигает максимума. π х → max при 60 + Р у – 4Р х = 0. Или Р х = 15 + 0,25Р у. Аналогично Р у = 15 + 0,25Р х. На рис. 5 приведены графики этих двух правил наилучшего ответа.
Рис. 5. Графики наилучших ответов и равновесия в игре «ценообразование в ресторанах»
Точка пересечения двух графиков наилучшего ответа - это равновесие Нэша в игре в ценообразование между двумя ресторанами: Р х = Р у = 20. В равновесном состоянии каждый ресторан назначит цену 20 долларов на блюда в своем меню и получит 12 долларов прибыли на каждых 2400 клиентов (2400 = (44 – 2 х 20 +20) х 100), которых обслуживает за месяц, что обеспечит общий объем прибыли 28 800 долларов в месяц.
В рамках олигополии (малого количества продавцов) компании могут договориться о ценах. В этом случае Р х = Р у и
π х = π у = (P – 8) (44 – 2P + P) = (P – 8) (44 – P) = –352 + 52P – P 2
Прибыль достигает максимума при Р = 26 (точка наилучшего выбора на рис. 5). При этом π х = π у = 32 400 долларов в месяц. На языке экономики соглашение о повышении цен до уровня, оптимального для обеих сторон, называется картелем. Высокие цены наносят ущерб потребителям, поэтому органы государственного регулирования обычно пытаются предотвратить образование картелей и заставить компании конкурировать друг с другом.
Кроме доминируемых можно исключить стратегии, которые не могут быть наилучшим ответом. Стратегии, оставшиеся после такой процедуры исключения, называются рационализируемыми, а сама концепция - рационализацией . В подобных случаях мы имеем более веское обоснование равновесия Нэша, опирающееся исключительно на рациональность, без предположений о правильности ожиданий. Рассмотрим игру на рис. 6.
Рис. 6. Рационализируемые стратегии
Может ли Строка исходить из убеждения, что Столбец выберет стратегию C4? В его основе должны лежать убеждения Столбца в отношении выбора Строки. Могут ли они сделать стратегию С4 наилучшим ответом Столбца? Нет. Если Столбец полагает, что Строка сыграет R1, его наилучший ответ С1. Если Столбец полагает, что Строка сыграет R2, его наилучший ответ С2. Если Столбец считает, что Строка предпочтет R3, то его наилучший ответ С3. А если Столбец убежден, что Строка выберет R4, тогда его наилучший ответ либо С1, либо С3.
Следовательно, С4 не может быть наилучшим ответом Столбца. Это означает, что Строка, зная о рациональности Столбца, ни в коем случае не припишет ему выбор стратегии С4. Стало быть, Строка не должна исходить из убеждения, что Столбец сыграет С4. Обратите внимание, что, хотя стратегия С4 не может быть наилучшим ответом, она не является доминируемой по отношению к стратегиям С1, С2 и С3. Таким образом, «стратегия, которая не может быть наилучшим ответом», - более общая концепция, чем «доминируемая стратегия».
Равновесие Нэша в этой игре сводится к выбору каждым игроком числа 0. В действительности игра разрешима по доминированию. Даже если каждый ее участник укажет 100, половина от среднего значения не может превысить 67, поэтому для каждого игрока выбор числа больше 67 доминируемый по отношению к выбору числа 67. Однако это должно быть понятно всем рационально рассуждающим игрокам, а значит, среднее значение не может превышать 67, а две трети от него - 44, поэтому любой выбор числа больше 44 будет доминируемым по отношению к выбору числа 44. Данный процесс итеративного удаления доминируемых стратегий продолжается до тех пор, пока не останется только число 0.
Тем не менее, когда группа играет в такую игру впервые, побеждает не тот, кто выбрал число 0. Как правило, выигрышное число попадает в диапазон от 15 до 20. Чаще всего игроки указывают числа 33 и 22, из чего можно сделать вывод, что многие из них выполняют всего один-два цикла итеративного доминирования, не продолжая этот процесс дальше. Иначе говоря, игроки «уровня 1» считают, что все остальные участники игры будут выбирать числа случайным образом, со средним значением 50, поэтому в качестве наилучшего ответа указывают две трети от этого числа, то есть 33. Точно так же игроки «уровня 2» предполагают, что все остальные игроки рассуждают на «уровне 1», поэтому в качестве наилучшего ответа выбирают две трети от 33, или 22.
Одной из первых областей применения концепции равновесия Нэша по отношению к поведению субъектов реального мира стала сфера международных отношений. Томас Шеллинг первым использовал теорию игр для объяснения таких феноменов, как эскалация гонки вооружений (см. ). Теоретико-игровые модели, построенные на концепции равновесия Нэша позволяют лучше понять основные факторы конкуренции по сравнению с более старыми моделями, исходящими из совершенной конкуренции и оценочных кривых спроса и предложения.
Представьте, что вы фермер и ваша работа зависит от прихотей погоды. Если погода способствует хорошему урожаю, вы получите доход 160 000 долларов. Если сложатся неблагоприятные метеорологические условия, ваш доход составит всего 40 000 долларов. Вы могли бы попытаться снизить риск, предложив кому-то принять на себя его часть. Безусловно, в обмен вам придется что-то этому человеку дать. Такой равноценный обмен обычно принимает две формы: денежный платеж или взаимный обмен либо разделение риска.
Идея о существовании цены за риск и рынка риска лежит в основе почти всех финансовых механизмов в современной экономике. Например, деривативы, - лишь способ распределения риска среди тех, кто готов его нести за минимальную цену (см. ). Финансовые рынки стимулируют предпринимательство, содействуя торговле рисками.
Асимметричная информация. Манипулирование информацией о ваших способностях и предпочтениях, известной другим игрокам, позволяет влиять на равновесный исход игры. В результате такое манипулирование асимметричной информацией само по себе становится стратегической игрой. Более информированный игрок может предпринять следующие действия: скрыть или дать ложную информацию, раскрыть часть правдивой информации. Менее информированный игрок может: получить необходимую информацию или отделить правду от лжи; оставаться в неведении (незнание о стратегическом ходе соперника может оградить вас от его обязательств и угроз).
Вы знаете, что окружающие составят о вас мнение на основании ваших действий, и в связи с этим попытаетесь придумать и предпринять шаги, которые заставят их решить, что ваша информация заслуживает доверия. Такие действия называются сигналами, а стратегия их использования - сигнализированием .
Если другие игроки знают больше вас или совершают действия, которые нельзя непосредственно наблюдать, вы можете использовать стратегии, которые сократят такое информационное отставание. Стратегия, вынуждающая другого игрока раскрыть свою информацию, называется скринингом .
Во многих играх один из участников знает об исходе игры нечто такое, что неизвестно другим. Например, продавец подержанного автомобиля многое о нем знает благодаря длительной эксплуатации, а потенциальный покупатель может в лучшем случае получить минимум информации в ходе осмотра авто. В таких ситуациях непосредственная коммуникация не обеспечивает достоверной передачи информации.
Если страховая компания предлагает страховой полис, который обходится в 5 центов за каждый доллар страхового покрытия, он будет особенно привлекателен для людей, которые знают, что их собственный риск (болезни или автомобильной аварии) превышает 5%. Безусловно, некоторые люди, знающие о том, что их риск ниже 5%, все равно купят такой страховой полис ввиду нерасположенности к риску. Однако в общей совокупности лиц, претендующих на оформление этого страхового полиса, доля лиц с более высокой степенью риска превысит долю лиц с аналогичным риском в общей численности населения. Таким образом, страховая компания выборочно привлекает невыгодную, или неблагоприятную, группу клиентов. Данный феномен известен как неблагоприятный отбор и характерен для сделок с асимметричной информацией.
Потенциальные последствия неблагоприятного отбора для рыночных сделок весьма наглядно продемонстрировал Джордж Акерлоф в статье, которая положила начало экономическому анализу ситуаций с асимметричной информацией и обеспечила ему Нобелевскую премию в 2001 году (см. ). Преодолеть асимметричность информации позволяют стратегии сигнализирования и скрининга.
Страховая компания может предложить два полиса страхования. Первый предусматривает более низкий страховой взнос, но обеспечивает покрытие меньшего процента от понесенных клиентом убытков. Второй полис предусматривает более высокий страховой взнос, но обеспечивает и более высокий процент страхового покрытия убытков. Клиенты более высокой категории риска выбирают полисы с высокими взносами и высоким покрытием, а клиенты более низкой категории риска - полисы с более низкими взносами и низким страховым покрытием.
Компания, которая знает, что ее продукт отличается высоким качеством, может подать об этом потенциальным покупателям достоверный сигнал - дать гарантию. Например, Hyundai на рынке США в середине 1990-х предложила гарантию на свои автомобили, рассчитанную на 10 лет и 100 000 миль пробега.
Компании могут успешно устанавливать разные цены для разных групп потребителей с помощью инструментов скрининга. Такие стратегии известны в экономической литературе как ценовая дискриминация. Например, авиаперевозчики устанавливают разные цены на билеты, подлежащие и не подлежащие возврату, и предоставляют путешественникам самим выбирать тип тарифа. Такая стратегия ценообразования представляет собой пример скрининга посредством самоотбора.
Когда простой постановки вопросов для получения правдивой информации недостаточно, может понадобиться схема скрининга . Скрининг обеспечивает требуемые результаты, только когда инструмент скрининга стимулирует других игроков раскрыть правдивую информацию о своем типе; разделение типов возможно лишь при наличии совместимости стимулов. Иногда достоверное сигнализирование или скрининг могут оказаться невозможны; в таком случае равновесие может повлечь за собой объединение типов или вероятен полный крах рынка или сделки для одного из типов.
В равновесии игры с асимметричной информацией игроки должны не только использовать свои наилучшие действия с учетом имеющейся информации, но и делать правильные выводы (обновлять информацию) в процессе наблюдения за действиями других игроков. Этот тип равновесия известен как байесовское равновесие Нэша .
Глава 9. Стратегические ходы
Если правила игры не зафиксированы извне, у каждого игрока есть стимул манипулировать ими, с тем чтобы обеспечить более выгодный для себя результат. Инструменты, позволяющие манипулировать игрой таким способом, называются стратегическими ходами .
Стратегический ход меняет правила исходной игры в целях создания новой двухэтапной игры. Различные действия, выполняемые на первом этапе, соответствуют разным стратегическим ходам; мы их разделим на три категории: обязательства, угрозы и обещания . Цель всех трех - изменить исход второго этапа игры в свою пользу.
Обязательство - это простое использование преимущества первого хода в случае, если таковое существует. Конечно, для этого обязательство должно быть достоверным. Для того чтобы ваш стратегический ход оказался эффективным, вы еще на первом этапе игры должны что-то предпринять для обеспечения достоверности - то, что покажет сопернику: вы ни при каких обстоятельствах не отступите от оговоренного действия.
Обратите внимание, что угрозы и обещания - это правила ответа: ваше будущее фактическое действие зависит от того, что сделают другие игроки, но ваша свобода действий в дальнейшем ограничена обязательным соблюдением установленного правила. Цель - изменить ожидания (а значит, и действия) других игроков с выгодой для себя. Угроза - это правило ответа, приводящее к негативным последствиям для других игроков, если они действуют вопреки вашим интересам. Обещание - правило ответа, в соответствии с которым вы предлагаете обеспечить другим игрокам положительный исход, если их действия согласуются с вашими интересами.
Пример угрозы: торговые отношения между США и Японией. Каждая страна может держать свои рынки либо открытыми, либо закрытыми для товаров другой страны. Но предпочтения двух стран относительно исходов этой игры несколько разнятся (рис. 10).
Рис. 10. Таблица выигрышей в торговой игре между США и Японией
Равновесный исход - «открытый американский рынок» / «закрытый японский рынок», а выигрыши 3, 4. Но допустим, США выберут следующее условное правило ответа: «Мы закроем свой рынок, если вы закроете свой». В результате мы получим двухэтапную игру (рис. 11). Она приведет к открытию Японией рынка, а США получат самый лучший исход.
Рис. 11. Дерево торговой игры между США и Японией с применением угрозы; выделено равновесие Нэша
Выполнение угрозы в истинном стратегическом смысле обязательно должно дорого обходиться тому, кто ее выдвигает, а действие, составляющее суть угрозы, наносить взаимный вред.
Мы выделяем два подхода к обеспечению достоверности стратегических ходов: 1) ограничить вашу собственную свободу действий в будущем таким образом, чтобы у вас не было иного выбора, кроме выполнения действий, предписываемых вашим стратегическим ходом; 2) изменить ваши собственные выигрыши в будущем таким образом, чтобы выполнение действий, предписываемых стратегическим ходом, было для вас оптимальным. Например, в сфере торговой политики широко распространены автоматические процедуры введения ответных пошлин на импорт в случае попыток другой страны субсидировать свой экспорт в вашу страну.
Вы можете создать себе репутацию человека (компании, страны), который всегда выполняет угрозы и обещания. Репутация объясняется тот факт, что, находясь вдалеке от дома, вы предпочитаете питаться в известной вам сети ресторанов, вместо того чтобы рисковать и идти в незнакомый местный ресторан. На практике достоверность - это не ситуация «все или ничего», а вопрос степени.
Тактика салями - это инструмент, позволяющий уменьшить размер угрозы соперника так же, как нарезается салями: по одному ломтику за раз. Вы не выполняете пожеланий другого игрока в настолько малой степени (будь то в случае сдерживания или принуждения), что предпринимать в ответ какие-то радикальные действия для него не имеет никакого смысла. Если ваш шаг оказывается эффективным, вы совершаете еще одно небольшое нарушение, затем еще одно и т.д.
Глава 10. Дилемма заключенных и повторяющиеся игры
Супругов подозревают в убийстве. Их допрашивают отдельно, при этом каждый из них может либо признаться в совершении преступления, либо полностью отрицать свою причастность к нему (рис. 12). Выигрыши исчисляются в годах тюремного заключения; следовательно, низкие значения более выгодны обоим игрокам.
Рис. 12. Таблица выигрышей в стандартной игре «дилемма заключенных»
Дилемма заключенных относится к числу некооперативных игр; игроки принимают решения и реализуют их отдельно друг от друга. При этом, существуют механизмы, позволяющие поддерживать сотрудничество. Наиболее часто последнего можно добиться в повторяющаяся игра. Каждый игрок может опасаться, что один случай отказа от сотрудничества приведет к его прекращению в будущем. Если ценность будущего сотрудничества достаточно велика и превышает выгоду, получаемую от отказа от него в краткосрочной перспективе, то долгосрочные личные интересы игроков могут автоматически удержать их от обмана без какой-либо необходимости в дополнительных мерах наказания или давления со стороны третьих лиц.
В повторяющихся играх игроки могут выбирать стратегии в зависимости от поведения в предыдущих раундах игры. Такие стратегии известны как условные стратегии . Большинство последних относятся к категории триггерных стратегий, в которых игрок поддерживает сотрудничество до тех пор, пока соперник тоже это делает, но любой обман со стороны последнего «запускает» наказание. Например, в стратегии «око за око» игрок выбирает сотрудничество в первом раунде игры, а затем в каждом очередном раунде выбирает действия, выбранные соперником в предыдущем раунде.
Триггерные стратегии определяются числом раундов игры: конечное оно или бесконечное, и известно ли это число заранее. Например, в плохие времена, когда целая отрасль оказывается на грани краха и компании чувствуют, что у них нет будущего, конкурентная борьба может существенно ожесточиться (реже может наблюдаться кооперативное поведение). С другой стороны, когда меняется мода на продукты, выпускаемые неизменной группой компаний, поддерживающих долгосрочные отношения, партнерство сохраняется.
Кроме повторения существуют и иные инструменты решения дилеммы заключенных. Можно наложить на игроков прямое взыскание в случае отказа от сотрудничества. В этом случае вариант «сдать подельника» теряет свою привлекательность. Еще один метод решения дилеммы заключенных относится к ситуациям, в которых один игрок берет на себя роль лидера во взаимодействии. В реальных стратегических ситуациях один игрок может быть относительно «крупным» (лидером). Например, Саудовская Аравия много лет играла в ОПЕК стабилизирующую роль: для поддержания высокой цены на нефть она сокращала ее добычу, в то время как один из более мелких производителей (таких как Ливия) увеличивал.
В ходе лабораторных экспериментов выяснилось, что стратегия равноценных ответных действий, обладающая такими свойствами, как предсказуемость, доброжелательность, возмездие и прощение, в среднем обеспечивает очень хорошие результаты в повторяющейся дилемме заключенных.
Глава 11. Коллективные игры
Игры с участием множества игроков касаются проблем коллективного действия . Их три типа: дилемма заключенных, игра в труса и игра в доверие. Выигрыши в таких играх относятся к категории неисключаемых благ : человеку, который не внес вклад в его реализацию, нельзя помешать извлекать из него выгоду. Часто игры со многими участниками правильнее было бы назвать играми с коллективным бездействием .
Общая характеристика всех этих игр состоит в том, что их участники должны решить, пользоваться ли им тем или иным общим ресурсом, будь то автомагистраль, высокодоходный инвестиционный фонд или водоем с большим количеством рыбы. Такие коллективные игры с «бездействием» больше известны как игры с распределением общих ресурсов: суммарный выигрыш всех участников достигает максимума, когда они воздерживаются от чрезмерного использования общих ресурсов. Проблема, связанная с неспособностью достичь социального оптимума в таких играх, известна как трагедия общин .
Опишем воздействие решений каждого человека на других людей и группу в целом. 8000 жителей пригорода ежедневно ездят в город на работу. Вы можете выбрать для поездки либо скоростную магистраль (действие P), либо сеть местных дорог (действие S). Поездка по местным дорогам неизменно занимает 45 минут, сколько бы автомобилей по ним ни перемещалось. На поездку по скоростной автомагистрали уходит всего 15 минут при условии отсутствия заторов. Однако каждый водитель, выбирающий скоростную магистраль, увеличивает время в пути любого другого водителя, который поедет по этому маршруту, на 0,005 минуты.
Выигрыши в игре исчисляются в минутах сэкономленного времени - например, на сколько минут время поездки меньше одного часа. Следовательно, выигрыш водителей, обозначаемый как S(n), выбравших маршрут по местным дорогам, - постоянная величина: 60 – 45 = 15, независимо от значения n. Выигрыш водителей, выбравших скоростную автомагистраль, P(n) = 45 – 0,005n (рис. 13).
Рис. 13. Игра в выбор маршрута
Предположим на автомагистрали находится 4000 автомобилей. При таком количестве машин на дороге каждому водителю требуется 15 + 4000 х 0,005 = 15 + 20 = 35 минут, чтобы добраться на работу; при этом каждый из них получает выигрыш P(n) = 25. Вы можете принять решение переключиться с поездки по местным дорогам на поездку по скоростной автомагистрали. Выбор нового маршрута увеличит значение n на 1. Теперь количество водителей, выбравших автомагистраль, составляет 4001 (в том числе и вы), а время поездки каждого равно 35 + 5 / 200, или 35,005 минуты. При этом каждый водитель получит выигрыш P(n + 1) = P(4001) = 24,995, по-прежнему превышающий выигрыш от поездки по местным дорогам. Следовательно, у вас есть личный стимул изменить маршрут, поскольку P(n + 1) > S(n) (24,995 > 15).
Выбор другого маршрута приносит вам личную выгоду (которую получаете только вы), эквивалентную разности между вашими выигрышами до и после такого перехода; она составляет P(n + 1) – S(n) = 9,995 минуты. Мы называем ее маржинальной (дополнительной) личной выгодой . Однако теперь из-за вашего решения изменить маршрут каждому из 4000 других водителей, выбравших автомагистраль, придется тратить на поездку на 0,005 минуты больше. Суммарное воздействие вашего решения на всех остальных водителей составляет 4000 х (0,005) = 20. Ваше действие, то есть переход с местных дорог на скоростную автомагистраль, повлияло на выигрыши других игроков. Всякий раз, когда действие одного человека оказывает подобное влияние на других людей, наблюдается сопутствующий эффект, или внешний эффект, или экстерналия.
Совокупность маржинальной личной выгоды и экстерналии мы называем маржинальной социальной выгодой . Последняя в нашем примере составляет 9,995 – 20 = –10,005 минуты. Следовательно, общий социальный эффект вашего перехода на другой маршрут носит негативный характер. Однако человек, меняющий маршрут поездки на работу, не учитывает сопутствующий эффект (экстерналию); его мотивируют только собственные выигрыши.
Как обеспечить оптимальное распределение водителей с точки зрения общества в целом? В разных культурах и политических группах используются различные системы, каждая со своими преимуществами и недостатками. Общество может просто запретить 3000 водителям доступ на скоростную автомагистраль. Но по каким критериям их отбирать? Бюрократическое общество могло бы установить критерии, основанные на выполненных чиновниками сложных расчетах потребностей и заслуг, и тогда каждый водитель стал бы предпринимать затратные действия, чтобы удовлетворять этим критериям. Политизированное общество может отдать предпочтение важным «независимым избирателям», или организованным группам активистов, или лицам, делающим пожертвования. В коррумпированном обществе привилегии могли бы получить те, кто дает взятки чиновникам или политикам.
Можно привести схему, согласно которой вы получаете право ездить по автомагистрали только в определенные дни, в зависимости от последней цифры на номерном знаке вашего автомобиля. Однако такая схема не столь демократична, как может показаться поначалу, поскольку богатые люди могут купить два автомобиля и выбирать номерные знаки так, чтобы это позволяло им пользоваться автомагистралью ежедневно.
Многие экономисты предпочитают вводить плату за проезд. Это наглядно демонстрирует каждому водителю дополнительные издержки, которые влекут за собой его действия, что, в свою очередь, побуждает его выбрать социально оптимальное действие. Экономисты в таком случае говорят, что отдельный человек вынужден перенять экстерналию .
Существуют также положительные сопутствующие эффекты. Например, вакцинация. Каждый человек, сделавший прививку, снижает как собственный риск подхватить болезнь (маржинальная личная выгода), так и риск окружающих заразиться ею от него (сопутствующий эффект).
В играх, проходящих в крупных группах, имеет место диффузия ответственности, которая может обусловить поведение, когда отдельно взятый человек ждет, чтобы другие выполнили необходимое действие, а он взял на себя роль «безбилетника», то есть извлек выгоду из этого действия. Когда кому-то требуется помощь, вероятность ее предоставления снижается по мере увеличения размера группы людей, которые могут ее оказать.
Глава 12. Эволюционные игры
До сих пор мы исходили из предположения, что каждый игрок делает осознанный и продуманный выбор из имеющихся в его распоряжении стратегий. Однако появившиеся в последнее время теории ставят это предположение под сомнение. Наиболее обоснованная и убедительная критика исходит от психолога и лауреата Нобелевской премии по экономике 2002 года Даниэля Канемана (см. ). По его мнению, у людей есть две различные системы принятия решений. Система 1 - инстинктивная и быстрая, система 2 - расчетливая и медленная.
Это подразумевает совершенно иной способ ведения и анализа игр. Игроки вступают в игру с инстинктивной системой 1 и разыгрывают стратегию, которую она им подсказывает, хотя эта стратегия может и не быть оптимальной. Положительный результат подкрепляет инстинкт, тогда как отрицательный способствует его постепенному изменению. Куда ведет такой процесс интерактивной динамики инстинктов?
Биологическая теория эволюции основана на трех фундаментальных принципах: гетерогенность (неоднородность), приспособленность и отбор. Поведение животных генетически предопределено: комплекс из одного или более генов (генотип ) обусловливает схему поведения (поведенческий фенотип ). Естественное разнообразие генофонда обеспечивает гетерогенность фенотипов в популяции. Одни модели поведения в большей степени соответствуют сложившимся условиям, чем другие; успех фенотипа выражается в виде количественного показателя под названием приспособленность .
Репродуктивный успех позволяет животному передавать свои гены следующему поколению и сохранять свой фенотип. Затем более приспособленные фенотипы становятся относительно более многочисленными в следующем поколении, чем менее приспособленные. Именно этот динамический процесс отбора меняет комбинацию генотипов и фенотипов.
Время от времени спонтанно возникают новые генетические мутации. Многие из них создают модели поведения (фенотипы), которые плохо сочетаются с окружающей средой и поэтому вымирают. Однако иногда мутация приводит к образованию нового фенотипа, более приспособленного к окружающей среде. Такой мутантный ген может захватить популяцию, то есть образовать значительную ее долю. Биологи называют конфигурацию популяции и ее текущих фенотипов эволюционно устойчивой , если ни один мутантный фенотип не может успешно ее захватить.
Во взаимодействии между людьми стратегия может быть заложена в разуме человека по разным причинам, среди которых не только генетика, но и социализация, культурное воспитание, образование или эмпирический опыт, основанный на прошлых событиях. Все это может охватывать инстинктивная, быстрая система 1 Канемана. Популяция может состоять из совокупности разных людей с разным происхождением или опытом, под влиянием которого они придерживаются различных стратегий системы 1.
Постепенный процесс изменений с учетом исходов, опыта, наблюдений и экспериментов образует динамику расчетливой, медленной системы 2. Существует два типа эволюционно устойчивых конфигураций биологических игр. Во-первых, один фенотип может оказаться более приспособленным, чем другие, и популяция может состоять только из него. Такой эволюционно устойчивый результат обозначается термином мономорфизм . В этом случае одна преобладающая стратегия называется эволюционно устойчивой стратегией .
Во-вторых, у двух или более фенотипов может быть одинаковый уровень приспособленности, поэтому они могут сосуществовать в определенных пропорциях. Тогда говорят, что популяция демонстрирует полиморфизм . Полиморфизм очень близок к такому понятию теории игр, как смешанная стратегия. Однако есть одно важное отличие. При полиморфизме различные игроки придерживаются различных чистых стратегий, но популяция в целом демонстрирует смешивание стратегий. Если в игре есть строго доминирующая стратегия, она обязательно будет эволюционно устойчивой.
Эволюционно устойчивая стратегия должна быть равновесием Нэша в игре, которую ведут осознанно рациональные игроки, с такой же структурой выигрышей. Таким образом, эволюционный подход обеспечивает косвенное обоснование рационального подхода.
Глава 13. Разработка механизмов для задачи «принципал-агент»
Обычно менее информированного игрока называют принципалом , а более информированного - агентом . Процесс, используемый принципалом для создания правильного набора стимулов для агента, известен как разработка механизмов .
Многие рестораны предлагают меню из трех блюд по фиксированной цене и недорогие комплексные блюда наряду с обычными блюдами на выбор. Такая стратегия позволяет ресторану выделить различные типы клиентов, отдающих предпочтение разным супам, салатам, основным блюдам, десертам и т. д. Книжные издательства, как правило, сначала продают новые книги в твердых переплетах, а версию в мягкой обложке издают только через год. Зачастую разница в цене между двумя версиями гораздо больше, чем разница между себестоимостью двух видов книг. Такая схема ценообразования рассчитана на два типа покупателей: тех, кто хочет прочитать книгу как можно быстрее и готов заплатить за это больше, и тех, кто согласен ждать более выгодной цены. Примеров подобных скрининговых механизмов ценовой дискриминации множество.
Второй тип проблем разработки механизмов связан с моральным риском. Предположим, вы владелец компании, начинающей новый проект, и должны нанять менеджера, который будет контролировать его выполнение. Если у вас нет возможности отслеживать усилия менеджера, вам необходимо заинтересовать его в успешном выполнении проекта, например, посредством выплаты премии по его завершении.
Моральному риску подвержены также рынки страховых услуг. Страховым компаниям необходимо решить, как составить приемлемые договоры страхования, стимулирующие клиентов предпринимать действия, снижающие вероятность подачи ими иска о страховом возмещении. Например, страховые компании хотели бы, чтобы люди, которым они продают полисы медицинского страхования, регулярно проходили профилактические медицинские осмотры, а люди, которым они продают полисы автострахования, продолжали практиковать безопасный стиль вождения. Большинство страховых полисов оставляют часть риска держателя полиса незастрахованным в целях снижения морального риска.
Может ли оптимальная система стимулирования усилий менеджера всегда определяться базовой заработной платой и участием в прибылях? Нет. При наличии трех возможных исходов (провал проекта, умеренный успех и большой успех) выраженная в процентах премия за переход от провала к умеренному успеху может не совпадать с премией за переход от умеренного к большому успеху. Следовательно, оптимальная система стимулирования может быть нелинейной. Но и такая система стимулирования не лишена недостатков.
Например, управляющие взаимных фондов часто получают вознаграждение за высокую эффективность на протяжении календарного года. Оно выплачивается за счет компании в виде премий, а также за счет инвесторов, вкладывающих деньги в соответствующий фонд. Если эти схемы вознаграждения нелинейные, управляющие повысят уровень риска инвестиционного портфеля своего фонда.
Когда заработок одного работника зависит от прибыли всей компании, каждый отдельно взятый сотрудник видит только слабую связь между своими усилиями и совокупной прибылью, при этом каждый получает в ней лишь небольшую долю. А эта доля - весьма слабый стимул прилагать повышенные усилия к выполнению своих обязанностей. Даже в небольших командах у каждого члена может возникнуть соблазн увильнуть от работы и воспользоваться плодами труда своих коллег.
Исход каждой задачи агента отчасти зависит от его усилий и отчасти от случая. Именно поэтому схема стимулирования, основанная на полученных результатах, зачастую подвергает риску выигрыш агента.
Еще один способ обеспечить мотивацию работников – компания платит работнику заработную плату, превышающую общепринятый уровень, а разница между двумя ставками представляет собой излишек, или экономическую ренту работника. Работник получает ее при условии добросовестного выполнения обязанностей, но, если он начнет филонить, это может быть обнаружено и его уволят. В итоге ему придется вернуться на общий рынок труда, где он сможет получать только общепринятую заработную плату.
Часть IV. Применение теории игр в конкретных стратегических ситуациях
Глава 14. Балансирование на грани: Карибский кризис
Балансирование на грани – вид стратегического хода. Вам необходимо заранее предпринять действие, создающее вероятность (но не неизбежность) того, что, если соперник проигнорирует вашу угрозу, это повлечет за собой последствия, пагубные для обеих сторон. Формальное описание Карибского кризиса можно получить посредством построения дерева игры (рис. 14).
Рис. 14. Модель преодоления Карибского кризиса с использованием простой угрозы
Мы можем найти совершенное равновесие. Столкнувшись с угрозой США, СССР получит выигрыш –4 в случае вывода ракет и –8 в случае отказа это сделать, поэтому СССР выберет первое. Заранее проанализировав такой исход, Соединенные Штаты рассчитывают получить выигрыш 1, если угроза будет выдвинута, и –2, если нет; следовательно, США выгоднее выдвинуть угрозу, поскольку данный исход обеспечивает им выигрыш 1, а Советскому Союзу –4. Однако подобная интерпретация кризиса неудовлетворительна: зачем тогда Советскому Союзу вообще нужно было размещать ракеты на Кубе, если он мог предвидеть такое развитие игры и понять, чем она закончится?
Почти всем играм присущ элемент неопределенности. Вы не можете знать наверняка систему ценностей соперника и не можете быть полностью уверены, что он точно выполнит требуемые действия. Следовательно, угроза содержит в себе двойной риск. Ваш оппонент может проигнорировать ее, и вам придется выполнить действие, составляющее суть угрозы; или он может подчиниться, но угроза все равно будет приведена в исполнение по ошибке. При наличии таких рисков последствия угрозы для игрока, который ее выдвигает, становятся важным фактором.
Карибский кризис изобилует подобными неопределенностями. Грэм Аллисон раскрывает все эти трудности и неопределенности в своей замечательной книге «Сущность решения». Проанализировав их, Аллисон приходит к выводу, что Кубинский ракетный кризис нельзя объяснить с точки зрения теории игр, и предлагает два альтернативных варианта толкования: один основан на том, что у бюрократии есть свои устоявшиеся правила и процедуры, а другой строится на внутренней политике США и советском государственном и военном аппарате. По мнению Аллисона, политическое объяснение наиболее приемлемо.
Балансирование на грани - это стратегия, посредством которой вы подвергаете соперника и себя постепенно возрастающему риску обоюдного ущерба. Фактическое наступление пагубного исхода не полностью контролируется тем, кто выдвигает угрозу. В большинстве противостояний (например, между компанией и профсоюзом, мужем и женой, родителем и ребенком, президентом и Конгрессом и т.д.) одна сторона не может быть уверена в целях и возможностях другой. Следовательно, большинство угроз сопряжены с риском ошибки, и каждая угроза должна содержать элемент балансирования на грани.
Глава 15. Стратегии и голосование
Методы агрегирования голосов можно разделить на категории по числу вариантов, или кандидатов, рассматриваемых избирателями в любой момент времени. Бинарные методы подразумевают выбор одной из двух альтернатив за один раз. Во время выборов с участием ровно двух кандидатов побеждает кандидат, получивший большинство голосов. При наличии более двух альтернатив можно применить парное голосование - голосование по парам альтернатив в ходе нескольких туров по принципу относительного большинства для определения наиболее предпочтительной альтернативы (см. ).
Множественные методы позволяют избирателям рассматривать три и более альтернативы одновременно. Одна группа множественных методов голосования подразумевает использование информации о позиции альтернатив в бюллетене для определения количества баллов, учитываемых при подсчете результатов голосования; такие методы голосования известны как позиционные методы . Принцип относительного большинства голосов - особый случай позиционного метода, когда каждый участник голосования отдает один голос за самую предпочтительную для него альтернативу. При подсчете голосов ей присваивается одно очко; победителем становится альтернатива, получившая наибольшее количество голосов (баллов).
Парадокс Кондорсе - один из самых известных и важных парадоксов голосования. Как уже отмечалось ранее, согласно методу Кондорсе, победителем становится кандидат, получающий большинство голосов в каждом раунде парных сравнений. Парадокс Кондорсе возникает, когда этот процесс не позволяет определить победителя.
Анализ парадоксов голосования позволяет предположить, что методам голосования присущ ряд недостатков. Существует ли система голосования, удовлетворяющая определенным условиям регулярности, в том числе условию транзитивности, которая является самой «справедливой», то есть наиболее точно учитывает предпочтения электората? Теорема о невозможности Кеннета Эрроу говорит нам, что ответ на этот вопрос - нет.
Многие избиратели считают выборы по принципу относительного большинства самыми справедливыми, тем не менее такие выборы открывают немало возможностей для стратегического поведения. Например, на президентских выборах, как правило, есть только два реальных кандидата на победу, и когда между ними относительно небольшой разрыв, третий кандидат может включиться в предвыборную гонку, чтобы лишить части голосов избирателей ведущего кандидата; если третий кандидат действительно снижает шансы лидера на победу, его называют спойлером .
В политике спойлером называют кандидата или партию на выборах, который не имеет шансов победить, но оттягивает на себя часть голосов за другого кандидата со сходной программой, повышая тем самым шансы на победу кандидата или партии с противоположной позицией по главным вопросам. Росс Перо сыграл такую роль во время выборов президента США в 1992 году.
Стратегический анализ поведения двух кандидатов, участвующих в выборах, гласит, что оба кандидата будут позиционировать себя в политическом спектре там же, где и медианный избиратель . Можно отметить три характеристики равновесия в игре с позиционированием кандидатов. Во-первых, они оба располагаются в равновесии в одной и той же позиции. Это иллюстрирует принцип минимальной дифференциации - общий результат всех игр с двумя участниками, которые сводятся к соперничеству за местоположение, будь то выбор кандидатами в президенты политической платформы, или выбор уличными торговцами местоположения тележки для продажи хот-догов, или выбор характеристик продукта производителями электронных устройств.
Во-вторых, оба кандидата находятся в позиции медианного избирателя. В-третьих, положение медианного избирателя не всегда совпадает с геометрическим центром политического спектра. Эти две позиции совпадают, если распределение избирателей симметрично, но медианный избиратель может располагаться слева от геометрического центра, если распределение смещено влево, и справа, если распределение смещено вправо.
Еще один парадоксальный результат состоит в том, что итоги любых отдельно взятых выборов при заданной совокупности предпочтений избирателей могут меняться в зависимости от используемой процедуры голосования.
Избиратели могут использовать стратегическое поведение в игре, которая обеспечивает выбор процедуры голосования, или в самих выборах посредством искажения своих предпочтений. Избиратели могут стратегически искажать свои предпочтения ради получения наиболее желаемого или предотвращения нежелательного результата. При наличии несовершенной информации избиратели могут принимать решение о целесообразности стратегического голосования исходя из своих убеждений в отношении поведения других избирателей и знания о распределении их предпочтений.
Глава 16. Стратегия участия в торгах и структура аукционов
Термином «аукцион» обозначается любая операция, в ходе которой окончательная цена выставленного на продажу объекта определяется посредством конкурентных торгов. Для аукционов характерно наличие асимметричности информации между продавцом и покупателем, а также между покупателями, участвующими в торгах. В связи с этим сигнализирование и скрининг могут стать важными элементами стратегии как покупателей, так и продавцов.
Аукционы разнятся по методам подачи заявок и определения окончательной цены, которую платит победитель. Эти аспекты аукциона, заранее устанавливаемые продавцом, называются правилами аукциона. Кроме того, аукционы можно классифицировать по типу выставленного на продажу объекта, а также по способу его оценки; это определяет среду аукциона.
В большинстве случаев правила проведения аукциона определяет продавец, причем ему приходится это делать при наличии ограниченной информации о готовности покупателя платить. Таким образом, при выборе правил аукциона продавец разрабатывает его механизм (см. главу 13). Аукционы можно разделить на открытые и закрытые.
Аукционы открытого торга включают аукцион на повышение, или английский аукцион и аукцион на понижение, или голландский аукцион. В случае закрытого аукциона первой цены выставленный на продажу объект достается участнику торгов, предложившему самую высокую цену, и он выплачивает цену, указанную в заявке. В случае закрытого аукциона второй цены выставленный на продажу объект получает участник торгов, предложивший самую высокую цену, но при этом он выплачивает цену, указанную в заявке участника торгов, предложившего вторую самую высокую цену.
Второй аукцион часто называют «аукционом Викри», по имени лауреата Нобелевской премии по экономике. Викри показал, что при таких правилах предложение истинной цены - доминирующая стратегия каждого участника торгов. В связи с этим мы в шутку называем такой аукцион сывороткой правды Викри.
Закрытые аукционы первой цены подобны голландским аукционам, а закрытые аукционы второй цены напоминают английские.
Отличительная особенность среды аукционов основана на различиях между объектами с общей и личной ценностью . В первом случае выставленный на продажу объект имеет одну и ту же ценность для всех участников торгов, но каждый из них знает только его приблизительную стоимость.
Проклятие победителя - это предостережение участникам торгов, что, выиграв аукцион и получив искомый объект, они, скорее всего, заплатили за него больше, чем он на самом деле стоит. Этот случай не сильно отличается от покупки подержанного автомобиля («лимона»). Теория неблагоприятного отбора на рынках с асимметричной информацией непосредственно применима и к описанному аукциону с общей ценностью.
Простейший эксперимент по проверке проклятия победителя сводится к проведению аукциона по продаже банки с монетами. Выигрыш в этой игре носит объективный характер, но каждый ее участник формирует субъективную оценку относительно количества монет в банке, а значит, и размера выигрыша (это пример аукциона с общей ценностью в чистом виде). Большинство преподавателей, проводивших такие эксперименты со студентами, неизменно обнаруживали существенное завышение предложенной цены.
Тем не менее, за использование механизма извлечения информации приходится расплачиваться. На аукционе, проходящем по схеме Викри, покупатели раскрывают правду о своих оценках только потому, что это приносит им определенную прибыль. Закрытый аукцион второй цены снижает прибыль продавца.
При наличии нейтрального отношения к риску и независимых друг от друга оценок покупателями ценности выставленного на продажу объекта продавцы могут рассчитывать на одинаковый средний уровень дохода при использовании любого из четырех основных типов аукционов: английский, голландский и закрытый аукцион первой и второй цены.
Глава 17. Переговоры
У всех переговорных ситуаций есть две общие черты. Во-первых, суммарный выигрыш, который стороны переговоров могут обеспечить в результате достижения консенсуса, должен быть больше индивидуальных выигрышей, которые они могли бы получить по отдельности, то есть целое должно превышать сумму составляющих. Во-вторых, переговоры не игра с нулевой суммой. При наличии излишка они сводятся к его разделению.
До появления теории игр теоретики не могли на системном уровне понять, почему одна сторона переговоров получает больше другой, и относили это на счет расплывчатых и необъяснимых различий в так называемой силе переговорной позиции.
Один подход теории игр рассматривает переговоры как кооперативную игру, в которой переговорщики вместе находят и реализуют решение. Другой подход рассматривает переговоры как некооперативную игру, в которой переговорщики выбирают стратегии по отдельности и ищут равновесие.
Научный редактор Александр Минько
Издано с разрешения W.W.Norton&Company, Inc. и литературного агентства Andrew Nurnberg
Все права защищены. Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав.
© W. W. Norton & Company, Inc., 2015, 2009, 2004, 1999
© Перевод на русский язык, издание на русском языке, оформление. ООО «Манн, Иванов и Фербер», 2017
* * *
В память о моем отце, Камалакаре Рамачандре Диксите
Авинаш Диксит
В память о моем отце, Джеймсе Эдварде Ските
Сьюзан Скит
Моей матери, Рони Рейли
Дэвид Рейли
Предисловие партнера издания
Перед вами логическое продолжение книги «Теория игр» Авинаша Диксита и Барри Нейлбаффа. В новой книге нас вновь вовлекают в разбор множества ситуаций, на основе которых мы учимся понимать виды различных стратегий и прогнозировать поведение участников игр.
В России теория игр стала уже не просто модной темой, но и обязательным знанием для людей, решающих сложные стратегические задачи. Спрос на литературу по этой теме растет, и вот перед вами одна из немногих достойных книг, в которой авторам удалось доступно раскрыть концепции и методики стратегической игры.
Интересный момент: стратегические игры не ограничиваются одним лишь математическим анализом ситуации. Одно из главных условий игры – наличие игроков, каждый из которых имеет свои желания, задачи и цели. И именно объединение методов психологии и математики дает возможность выстроить наиболее успешную стратегию игры.
Несмотря на то что все люди так или иначе сталкиваются с играми в повседневной жизни, есть те, кому эти знания необходимы в первую очередь. Я говорю о руководителях. Их роль заключается в том, чтобы достигать целей подразделения или организации, учитывая множество вовлеченных в процесс людей. Управление проектом, ведение переговоров, внедрение изменений – каждое из этих направлений бизнеса является стратегической игрой.
Как это выглядит на практике? Не так давно консультанты Samolov Group вели проект по сопровождению переговоров для руководителя крупной строительной компании. Задачей нашего заказчика было приобретение большого участка земли для строительства. Ему было затруднительно вести переговоры с партнером на своих условиях. Вместе с заказчиком мы проанализировали интересы и возможности оппонента. После сбора обнаружилось, что у партнера близится срок погашения большого кредита. Наш клиент предложил новые условия сделки, при которых оппонент имел возможность погасить этот самый кредит. Таким образом, контракт был подписан на ту сумму, на какую рассчитывал наш клиент. Пример иллюстрирует важность анализа игроков, поскольку это позволяет определить наиболее выигрышную стратегию.
Чем выше уровень руководителя, тем важнее для него развивать стратегическое мышление и умение применять методы теории игр на практике. В реальности же российские менеджеры привыкли решать ситуации «здесь и сейчас», не думая о долгосрочных сценариях. Поэтому обучение навыкам планирования, постановки целей, разработки стратегий дается довольно тяжело даже опытным руководителям. Необходимо признаться самому себе в том, что, если не развивать эти компетенции и не уделять должного внимания планированию, будет сложнее добиваться серьезных целей.
В книге «Стратегические игры» методика преподносится через кейсы. Этот формат может быть несколько непривычным для российского читателя. В России обучение предполагает сначала описание методики, а после уже – ее применения. В этой же книге вначале даются кейсы, а уже по ним делается разбор и вывод методики. Возможно, текст книги будет казаться сложным для восприятия, но информация, содержащаяся в нем, имеет большую ценность, поэтому рекомендую заинтересованному читателю выделить время на чтение и получить от этого интеллектуальное удовольствие.
Иван Самолов,коммерческий директор Samolov Group
Предисловие
Мы написали этот учебник для преподавателей и студентов первого или второго курса колледжа, чтобы помочь последним освоить основы теории игр. Он не требует предварительных знаний в областях, в которых применяется эта наука (таких как экономика, политология, эволюционная биология и т. д.); достаточно школьного уровня математики. Должны сказать, что полученный результат превзошел все наши ожидания. Сегодня немало учебных курсов по этой дисциплине читаются там, где 20 лет назад о них и не слышали, к тому же некоторые из них разработаны под влиянием нашего учебника. А появление на рынке конкурентов и подражателей – еще один убедительный признак успеха.
Тем не менее успех не повод для самоуспокоения. В каждом последующем издании учебника мы продолжали совершенствовать изложенный в нем материал с учетом замечаний и предложений преподавателей и студентов, а также собственного опыта его использования.
Основные нововведения в четвертом издании связаны со смешанными стратегиями. В третьем издании мы рассматривали этот вопрос в двух главах исходя из различий между простыми и сложными темами. Простые темы включали решение и интерпретацию равновесий в смешанных стратегиях в играх 2 × 2, а главной сложной темой была общая теория смешивания в играх с более чем двумя чистыми стратегиями, когда некоторые из них могут остаться неиспользованными в равновесии. Однако мы обнаружили, что мало кто из преподавателей обращается ко второй из этих глав. Поэтому мы решили свести простые темы и ряд базовых концепций более сложных тем в одну главу, посвященную смешанным стратегиям (глава 7). Некоторые материалы, не попавшие в эту главу, будут доступны читателям, намеревающимся более глубоко изучить темы повышенного уровня сложности, в виде онлайн-приложений .
Мы улучшили и упростили материал об информации в играх (глава 8). В частности, дали расширенное описание и больше примеров предварительного обмена ею с тем, чтобы разъяснить взаимосвязь между согласованием интересов и возможностью достоверной коммуникации. Кроме того, мы проанализировали примеры сигнализирования и скрининга в начале, а не в конце главы, как это было в третьем изданием, чтобы убедить студентов в важности этой темы и подготовить почву для более сухой теории, представленной в следующих разделах.
Игры в некоторых областях применения теории игр, о которых рассказывается в следующих главах, были достаточно просты, и их можно было анализировать без развернутого дерева игры или таблицы выигрышей. Но это ослабляло связь между предыдущими главами, в которых излагались методические принципы теории игр, и примерами практического применения этих принципов. Поэтому теперь мы показываем больше инструментов логического вывода в контексте их практического использования.
Мы расширили и усовершенствовали набор упражнений. Они, как и в третьем издании, в каждой главе разделены на две группы – с решениями и без – и в большинстве случаев представлены параллельно: на каждое упражнение с решением приходится соответствующее упражнение без решения, но с незначительными изменениями, что позволяет студентам дополнительно попрактиковаться. Доступ к решениям упражнений первой группы читатели могут получить на сайте books.wwnorton.com/studyspace/disciplines/economics.aspx?DiscId=6 . Решения упражнений второй группы будут предоставляться преподавателям, использующим этот учебник в работе: им необходимо связаться с издателем для получения доступа к сайту для преподавателей. В каждой группе упражнений с решениями и без них есть упражнения двух типов. Одни дают возможность повторить и отработать изучаемые методы, в других мы шаг за шагом проводим студента через процесс создания модели анализа того или иного вопроса или проблемы с позиции теории игр (на наш взгляд, именно эти упражнения имеют самую большую образовательную ценность). Такой опыт, полученный в ходе анализа упражнений с решениями и закрепленный с помощью соответствующих упражнений без решений, способствует развитию навыков стратегического мышления у студентов.
Бо льшая часть других глав тоже обновлена, улучшена, систематизирована и упрощена. Самым существенным изменениям подверглись главы, посвященные таким темам, как дилемма заключенных (глава 10), коллективные действия (глава 11), эволюционные игры (глава 12) и голосование (глава 15). Мы исключили последнюю главу третьего издания («Рынки и конкуренция»), поскольку, как показывают данные, ее почти никто не использовал. В случае необходимости преподаватели могут ее найти в третьем издании учебника.
Мы признательны многочисленным читателям предыдущих изданий за высказанные замечания и предложения. Благодаря им, а также проницательным и конструктивным советам преподавателей, использующих учебник на лекциях, содержание и изложение материала было существенно улучшено. В ходе работы над четвертым изданием мы учли комментарии Кристофера Максвела (Бостонский колледж), Алекса Брауна (Техасский университет A&M), Джонатана Вуна (Питтсбургский университет), Клауса Бекера (Техасский технологический университет), Хуансиня Янга (Университет штата Огайо), Мэтью Рулофса (Университет Западного Вашингтона) и Дебашис Пал (Университет Цинциннати). Спасибо всем вам.
Авинаш ДикситСьюзан СкитДэвид Рейли-младший
Часть I. Общие принципы
Глава 1. Основные концепции и примеры
Все вводные учебники начинаются с попытки убедить студентов, что рассматриваемая дисциплина крайне важна в нашем мире и поэтому заслуживает их внимания. Естественные и прикладные науки претендуют на роль основы современных технологий, а значит, и современной жизни; общественные науки исследуют серьезные вопросы управления, такие как демократия и налогообложение; гуманитарные утверждают, что возродят вашу душу после того, как она омертвеет под воздействием естественных, прикладных и общественных наук. Как вписывается в эту картину теория стратегических игр, часто называемая теорией игр, и почему ее следует изучать?
Мы предлагаем практическую мотивацию, которая носит более индивидуальный характер и ближе к вашим личным проблемам, чем большинство других предметов. Вы играете в стратегические игры постоянно: с родителями, братьями и сестрами, друзьями и врагами и даже с преподавателями. По всей вероятности, вы накопили достаточно приличный объем интуитивных знаний и навыков ведения таких игр, и мы надеемся, что вам удастся связать эти знания с изложенным в учебнике материалом. Мы будем опираться на ваш опыт, систематизируем его и разовьем до уровня, на котором вы сможете улучшить свои стратегические навыки и более методично их применять. Возможности для этого у вас будут появляться на протяжении всей жизни: вы продолжите играть в подобные игры с работодателями, подчиненными, супругами, детьми и даже незнакомыми людьми.
Этот предмет имеет существенное значение и в более широком контексте. Такие игры ведутся в бизнесе, политике, дипломатии и войнах – на самом деле в любой ситуации, в которой люди вступают во взаимодействие друг с другом с целью заключить взаимовыгодную сделку или разрешить конфликт. Способность распознавать эти игры углубит ваше понимание окружающего мира и позволит более эффективно участвовать в происходящих в нем событиях. Кроме того, понимание стратегических игр принесет непосредственную пользу при изучении ряда других предметов. На курсах по экономике и бизнесу уже применяются многие элементы теоретико-игрового мышления. Теория игр также используется в политологии, психологии и философии для анализа взаимоотношений между людьми. То же самое можно сказать и о биологии, на которую существенно повлияли концепции эволюционных игр и которая, в свою очередь, привнесла эти идеи в экономику. Психология и философия тоже не обходятся без стратегических игр. Теория игр предоставляет концепции и методы анализа в распоряжение многих, можно сказать, практически всех дисциплин, разве что за исключением изучающих полностью неодушевленные объекты.
1. Что такое стратегическая игра
При слове игра у вас может создаваться впечатление, что речь идет о поверхностном, малозначащем предмете в масштабной картине мира, изучающем такие тривиальные занятия, как азартные игры и спорт, тогда как в мире масса более важных вопросов – война, бизнес, образование, карьера и отношения. На самом деле стратегическая игра не просто игра; все вышеперечисленные вопросы и есть примеры игр, и теория игр помогает нам понять их суть. Тем не менее нет ничего плохого в том, чтобы начать изучение теории игр применительно к азартным играм или видам спорта.
Составляющие большинства игр – удача, мастерство и стратегии в различных пропорциях. Ставить все на подбрасывание монеты – это игра чистого везения, если, конечно, вы не спец в области подтасовок или подбрасывания монет. Забег на сто метров – игра, требующая исключительно физических навыков, хотя в ней тоже может присутствовать некий элемент случайности – например, у бегуна без видимых причин выдался не очень удачный день.
Стратегия – набор навыков иного рода. В контексте спорта это ментальные навыки, необходимые для того, чтобы хорошо играть, а еще умение рассчитать, как лучше всего использовать свои физические способности. Например, в теннисе вы их развиваете, отрабатывая подачи (сначала жесткие и плоские, затем подачи с подкруткой и кик-подачи) и обводящие удары (жесткие, низкие и точные). Стратегические навыки – это понимание того, куда следует отправить подачу (по косой к боковой линии или по центру, в крестовину между полями подачи) и целесообразно ли выполнять обводящий удар (по диагонали или по линии поля). В футболе вы развиваете умение ловить и бросать мяч, блокировать соперника, отбирать у него мяч и т. д. Тренер, зная физические возможности членов своей команды и команды противника, организует игру так, чтобы по максимуму использовать навыки своих игроков и слабые стороны соперника. Именно расчеты тренера определяют стратегию. Физическую игру в футбол ведут сами спортсмены, а стратегическую – тренеры и их помощники в кабинетах и на боковой линии.
Ваша задача в забеге на сто метров – как можно выгоднее применить свои физические навыки. На этой дистанции нет возможности наблюдать за соперниками и реагировать на их действия, а значит, нет места и для стратегии. А вот более длинные забеги уже подразумевают ее наличие: следует ли вам возглавлять забег и задавать темп бега, за какое время до финиша делать попытку вырваться вперед и т. д.
По сути, стратегическое мышление – это способность анализировать взаимодействие с другими людьми, тогда как они, в свою очередь, делают то же самое. Во время марафона ваши соперники могут срывать или поддерживать ваши попытки возглавить забег в зависимости от того, что больше отвечает их интересам. В теннисе противник старается угадать, куда вы направите свою подачу или обводящий удар; в футболе тренер команды противника строит игру так, чтобы она наилучшим образом, по его мнению, противостояла вашей стратегии игры. Безусловно, вы должны учитывать планы соперника, точно так же, как и он учитывает ваши. Теория игр – это анализ или, если хотите, наука о таком интерактивном процессе принятия решений.
Когда вы тщательно все взвешиваете, прежде чем что-либо предпринять, то есть осознаете свои цели или предпочтения, а также любые ограничения или требования к вашим действиям, и обдуманно выбираете свои действия, чтобы добиться максимального успеха исходя из собственных критериев, считается, что вы ведете себя рационально. Теория игр привносит еще один аспект в понятие рационального поведения, а именно: взаимодействие с другими, в равной степени рациональными людьми, принимающими решения. Иными словами, теория игр – это наука о рациональном поведении в интерактивных ситуациях.
Мы не утверждаем, что теория игр научит вас секретам идеальной игры или поможет никогда не проигрывать. Во-первых, ваш соперник может прочитать те же книги; кроме того, вы оба не можете постоянно выигрывать. Еще важнее то, что многие игры содержат немало сложных и тонких нюансов, а большинство реальных ситуаций включают в себя достаточно своеобразных или случайных факторов. Теория игр не может предложить безошибочный рецепт действий; что она действительно делает, так это предоставляет ряд общих принципов анализа стратегических взаимодействий. Вам предстоит дополнить их и некоторые методы вычислений множеством деталей, характерных для вашей ситуации, прежде чем разработать успешную стратегию выхода из нее. Хорошие стратеги используют теорию игр в сочетании со своим опытом; можно сказать, что ведение стратегических игр – в не меньшей степени искусство, чем наука. Мы объясним вам общие концепции науки стратегических игр, а также расскажем о ее ограничениях и о том, когда на первый план выходит искусство стратегических игр.
Хотя вы можете полагать, что уже освоили искусство стратегических игр благодаря своему опыту или интуиции, тем не менее изучение науки стратегических игр покажется вам весьма полезным. Она систематизирует множество общих принципов, действующих в разных контекстах или областях применения. Без этих принципов вам пришлось бы заново анализировать каждую новую ситуацию, требующую стратегического мышления, что было бы особенно сложно в новых областях применения теории игр – например, если вы овладели искусством стратегии в играх со своими родителями, братьями или сестрами, а теперь должны использовать стратегические навыки против бизнес-конкурентов. Общие принципы теории игр дают вам точку отсчета. Отталкиваясь от нее, вы сможете гораздо быстрее и увереннее отыскивать характерные для вашей ситуации признаки или элементы искусства стратегии, а также дополнять ими свои размышления и действия.
2. Примеры и истории о стратегических играх
С учетом целей, поставленных в разделе 1, мы сначала предложим вам ряд простых примеров, многие из которых позаимствованы из ситуаций, с которыми вы наверняка сталкивались в своей жизни. В каждом примере мы указываем важный стратегический принцип. Все эти принципы более детально рассматриваются в следующих главах; кроме того, после каждого примера мы сообщим, где найти более подробную информацию. Однако не торопитесь сразу же переходить к соответствующим главам, сначала просто прочитайте все примеры, чтобы получить предварительное представление обо всех аспектах стратегии и стратегических игр.
А. Как выполнить обводящий удар
Теннис высокого уровня состоит из незабываемых поединков между лучшими игроками: Джон Макинрой против Ивана Лендла, Пит Сампрас против Андре Агасси, Мартина Навратилова против Крис Эверт. Возьмем в качестве примера финальный матч Открытого чемпионата США по теннису между Эверт и Навратиловой . Навратилова у сетки только что ударила по мячу с лета, отправив его в сторону Эверт на заднюю линию. Эверт вот-вот выполнит обводящий удар. Какой удар ей лучше сделать – по линии поля или по диагонали? И следует ли Навратиловой ожидать удара по линии и сделать наклон в соответствующую сторону или удара по диагонали и наклониться в другую сторону?
Здравый смысл говорит в пользу удара по линии. При таком ударе мячу предстоит преодолеть меньшее расстояние до сетки, а значит, у другого игрока останется меньше времени на то, чтобы правильно среагировать. Однако это не означает, что Эверт следует постоянно использовать этот удар. Если бы она поступала именно так, Навратилова ожидала бы этого и подготовилась, поэтому удар не был бы результативным. Для того чтобы повысить шансы на успех в случае обводящего удара по линии поля, Эверт необходимо использовать удар по диагонали достаточно часто, чтобы Навратиловой каждый раз приходилось угадывать его направление.
То же самое происходит и в футболе: когда на третьем дауне остается продвинуть мяч еще на один ярд, бег с мячом на середину поля – это процентная игра (то есть наиболее часто применяемая тактика игры), но время от времени нападающие должны делать в таких ситуациях пас, чтобы держать команду защиты в напряжении.
Таким образом, самый важный общий принцип действий в подобных ситуациях состоит не в том, что Эверт следует делать, а в том, чего ей делать не следует : она не должна выполнять одно и то же действие постоянно или систематически. В противном случае Навратилова будет знать, как реагировать на ее действия, и шансы на успех у Эверт снизятся.
Отсутствие систематичности в действиях означает нечто большее, чем попытки не делать один и тот же удар в подобных ситуациях. Эверт также не должна сугубо механически переключаться между двумя ударами – Навратилова заметит и использует эту закономерность или любую другую систему, поддающуюся обнаружению. Эверт необходимо делать выбор в каждом конкретном случае в произвольном порядке, чтобы помешать такому угадыванию.
Общая идея о смешивании приемов игры хорошо известна даже спортивным комментаторам на телевидении. Но у нее есть и другие аспекты, требующие углубленного анализа. Почему удар вдоль линии поля – процентная игра? Должен ли теннисист вести ее в 80, 90 или 99 процентах случаев? Насколько важен масштаб соревнований – например, следует ли делать пас на третьей попытке во время регулярного сезона, но не делать во время Суперкубка? Как игроки смешивают приемы игры в реальных условиях? Что происходит, когда появляется третья возможность (например, свеча в теннисе)? Мы проанализируем эти вопросы и ответим на них в главе 7.
Фильм The Princess Bride («Принцесса-невеста», 1987) иллюстрирует эту идею на примере «состязания на смекалку» между героем (Уэстли) и злодеем (Виззини). Уэстли должен отравить вино в одном из двух кубков, а Виззини предстоит решить, кто из какого кубка будет пить. Виззини анализирует ряд запутанных доводов в пользу того, почему Уэстли должен отравить вино в определенном кубке. Однако все они внутренне противоречивы, поскольку Уэстли может разгадать логику Виззини и добавить яд в другой кубок. И наоборот, если Уэстли выберет определенный кубок с помощью какой-то конкретной логики или системы, Виззини может предвидеть это и выпить вино из другого кубка, оставив Уэстли кубок с отравленным вином. Стало быть, стратегия Уэстли должна быть случайной и бессистемной.
Эта сцена иллюстрирует еще один момент. В фильме Виззини проигрывает и расплачивается за это жизнью. Как оказалось, Уэстли отравил вино в обоих кубках: на протяжении последних нескольких лет он вырабатывал иммунитет к этому яду. Следовательно, Виззини вел игру в крайне неблагоприятных условиях с точки зрения наличия информации, что и привело к фатальному исходу. Иногда игроки могут преодолеть проблему асимметричности информации; в главе 8 и главе 13 рассматривается вопрос о том, когда и как они могут это сделать.
Б. Мышиная возня со средним баллом
Вы записались на курс, который оценивается по средней успеваемости. Независимо от того, каких успехов вы добьетесь в абсолютном выражении, всего 40 процентов студентов получат оценки А и всего 40 процентов – оценки B. Следовательно, вы должны упорно трудиться, причем не только в абсолютном выражении, но и относительно того, насколько старательно трудятся ваши товарищи по учебе (на самом деле «враги по учебе» кажется в данном контексте более подходящим выражением) . Это понимают все студенты, поэтому после первой же лекции они собираются на импровизированное совещание и договариваются не проявлять чрезмерного усердия. Спустя несколько недель искушение получить преимущество перед остальными, приложив чуть больше усилий, становится непреодолимым. В конце концов, ваши сокурсники не могут видеть все, что вы делаете, и не имеют реального влияния на вас, а выгода от повышения среднего балла весьма существенна. В итоге вы начинаете чаще заходить в библиотеку и оставаться там подольше.
Проблема в том, что остальные делают то же самое. Следовательно, вы получите такую же оценку, как и в случае, если бы придерживались договоренности. Единственное отличие – все вы потратили на учебу больше времени, чем вам хотелось бы.
Это пример дилеммы заключенных . В ее оригинальной версии двух подозреваемых допрашивают по отдельности и предлагают каждому признать свою вину. Одному из них, скажем, подозреваемому А, говорят следующее: «Если другой подозреваемый (Б) не сознается, то вы можете заключить выгодную сделку и смягчить наказание, признав свою вину. Но если Б сознается, тогда вам тоже лучше это сделать, иначе суд будет особенно суровым по отношению к вам. Так что вам следует сознаться в любом случае». Подозреваемого Б убеждают с помощью аналогичных доводов. Столкнувшись с таким выбором, А и Б сознаются, хотя для обоих было бы лучше, если бы они молчали, поскольку у полиции нет против них никаких веских доказательств.
В случае с оцениванием знаний складывается похожая ситуация. Если другие студенты будут работать меньше, то вы получите гораздо более высокий средний балл благодаря усердной учебе; если же другие будут усердно трудиться, тогда вам лучше делать то же самое, иначе вы получите низкий балл. Вы даже можете подумать, что слово «заключенный» очень уместно для обозначения группы студентов, попавших в ловушку обязательного учебного курса.
У преподавателей и учебных заведений собственная дилемма заключенных. Каждый преподаватель может сделать так, чтобы его курс выглядел привлекательно, оценивая знания студентов менее строго, а каждое учебное заведение может подыскать своим выпускникам более достойную работу или привлечь более перспективных абитуриентов, менее взыскательно оценивая знания студентов по всем курсам. Безусловно, если все так и поступят, ни у кого не будет преимущества перед остальными; единственное, что произойдет, – это стремительное повышение оценок, которое приводит к сжатию их диапазона, а значит, затрудняет возможность разграничивать способности студентов.
Люди часто думают, что в любой игре должны быть победитель и побежденный. Дилемма заключенных – это нечто иное: оба игрока (или все игроки) могут проиграть. Люди играют в такие игры (и проигрывают) каждый день, и проигрыши могут быть самыми разными, от небольших неудобств до потенциальных катастроф. Во время спортивных соревнований зрители поднимаются со своих мест, чтобы лучше все видеть, но когда все стоят, зона обзора, наоборот, сужается. Сверхдержавы накапливают больше оружия, чтобы получить преимущество перед противниками, но когда это делают обе стороны, соотношение сил не меняется, зато это приводит к нерациональному использованию экономических ресурсов, которые можно было бы направить на более достойные цели, чем вооружение, и повышению риска случайного развязывания войны. Учитывая величину возможных потерь всех участников таких игр, важно знать способы налаживания взаимовыгодного сотрудничества. Изучению подобной игры посвящена глава 10.
В противоположность дилемме заключенных – игре, в которой могут проиграть все, – существуют и беспроигрышные игры, когда выигрывают все участники. Один из примеров такой игры – международная торговля: если та или иная страна производит больше продукта, который она может делать лучше всех, то плодами такого международного разделения труда могут воспользоваться все страны. Однако, чтобы реализовать весь потенциал международной торговли, необходимы успешные переговоры относительно разделения этого «пирога». То же касается и многих других переговорных ситуаций. Эта тема подробно рассматривается в главе 17.
В. «Мы не можем сдавать экзамен, потому что у нас спустила шина»
Вот история (возможно, вымышленная), которая обычно распространяется по электронной почте старшекурсников; каждый из нас независимо друг от друга тоже получил ее от студентов.
Два друга изучали химию в Университете Дьюка. Оба достаточно хорошо сдали тесты, лабораторные работы и промежуточные экзамены, поэтому рассчитывали получить на итоговом экзамене твердую оценку А. Во время выходных накануне экзамена друзья были так уверены в успехе, что решили пойти на вечеринку в Университете штата Вирджиния. Вечеринка настолько удалась, что они проспали все воскресенье, поскольку вернулись слишком поздно и уже не могли готовиться к итоговому экзамену, который был назначен на утро понедельника. Вместо того чтобы сдавать экзамен без подготовки, друзья подошли к профессору и рассказали душещипательную историю о том, как ездили в Университет штата Вирджиния и планировали вернуться пораньше, но на обратном пути у них спустила шина, а так как запасной не оказалось, им пришлось всю ночь искать помощь. Так нельзя ли им сдать экзамен завтра, потому что сейчас они еле держатся на ногах от усталости? Профессор подумал и согласился.
Ребята занимались весь вечер понедельника и во вторник пришли на экзамен хорошо подготовленными. Профессор усадил их в разных аудиториях и выдал каждому задание. Первый вопрос на первой странице оценивался в 10 баллов и был очень простым. Оба студента написали правильные ответы и с огромным облегчением перевернули страницу. Там был всего один вопрос на 90 баллов: «Так какая шина спустила?»
В этой истории есть два важных стратегических урока для будущих завсегдатаев вечеринок. Первый состоит в признании того факта, что профессор – весьма искусный игрок. Он может заподозрить студентов в обмане и использовать какой-то прием, чтобы вывести их на чистую воду. Учитывая объяснения студентов, поставленный профессором вопрос был самым верным способом узнать правду. Друзьям следовало бы это предвидеть и заранее договориться. Второй – в том, что в игре необходимо просчитывать будущие ходы, а затем анализировать ее в обратном порядке с тем, чтобы определить оптимальное текущее действие, – общий принцип стратегии, на котором мы остановимся более подробно в главе 3 и, что особенно важно, главе 9.
Однако предвидеть все профессорские уловки такого рода можно не всегда, ведь у преподавателей опыт распознавания отговорок студентов гораздо богаче, чем у студентов в их придумывании. Если герои этой истории не подготовились заранее, есть ли у них шанс независимо друг от друга назвать одинаковые вымышленные причины? Если каждый из них выберет шину случайным образом, вероятность того, что их выбор совпадет, составляет всего 25 процентов. (Почему?) Есть ли вариант повысить процент?
Вы можете подумать, что прежде всего в зоне риска находится шина переднего правого колеса, поскольку гвозди или осколки стекла чаще всего лежат ближе к этой стороне дороги, чем к середине, и переднее правое колесо наедет на них первым. Такая логика рассуждений кажется вполне обоснованной, но этого недостаточно, чтобы сделать правильный выбор, поскольку тут важна не логика выбора, а то, чтобы так же мыслил и ваш друг. Следовательно, вам нужно поразмышлять о том, воспользуется ли он той же логикой и посчитает ли ее очевидной. Но и это не конец цепочки рассуждений. Придет ли ваш друг к выводу, что такой выбор очевиден для вас? И так далее. Дело не в очевидности или логичности вашего выбора, а в том, очевидно ли для другого игрока то, что очевидно для вас, что очевидно для него… Иными словами, в данном случае необходима сходимость ожиданий в отношении того, что следует выбрать в подобных обстоятельствах. Ожидаемая стратегия, посредством которой игроки могут успешно координировать свои действия, называется «фокальной точкой».
1 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72
Жанр:
Описание книги: Данная книга обязательно придется по душе читателям, которым нравится математическая наука. Она будет полезна и тем, кому она просто интересна ради увлечения, и тем, кто собирается поступать на математические факультеты. Книга является занимательной и увлекательной. В ней представлены многочисленные теории, а также практические занятия. Читатели смогут каждый раз узнавать что-то для себя новое и применять это на практике, решая самые разные математические упражнения. С такой книгой никогда не придется больше скучать. Цифры, формулы, теоретические знания – все это собрано именно здесь.
В теперешние времена активной борьбы с пиратством, большинство книг в нашей библиотеки имеют только краткие фрагменты для ознакомления, в том числе и книга Стратегические игры. Доступный учебник по теории игр. Благодаря чему, вы можете понять, нравится ли вам данная книга и стоит ли вам её вам в дальнейшем приобретать. Таким образом, вы поддерживаете труд писателя Авинаш Диксит путем легальной покупки книги в случае если вам понравилось её краткое содержание.