Игры в альтруизм. Как ученые искали наиболее эффективную стратегию сотрудничества

Как эффективно сотрудничать с человеком, который не всегда готов к сотрудничеству? В начале 1960-х этим вопросом задались специалисты по теории игр. О том, к каким выводам они пришли и как их критикуют сегодня, рассказывает Екатерина Бурак.

Человек подражающий

День рождения социума — это не день первого обмена товарами, как предполагал Маркс, а день, когда человек впервые повторил за себе подобным. Подражание играет ведущую роль в психической и социальной жизни человека. Так начали думать психологи и социологи в XIX веке и продолжают по сей день. Описано немало теорий, сводящихся к утверждению, что склонность копировать ближнего взрастила в нас способность к эмпатии и открытию нового.

Теоретики утверждают, что дети учатся мысли и воображению именно через подражание. То есть подражание — это не только строгое копирование, но и благоприятная среда для экспериментов и открытий.

Дети часто подражают действиям, подсмотренным у окружающих за день. Причем они делают это без какой-либо иной видимой причины, кроме осмысления пережитого. Это любопытное поведение не характерно для других животных, даже для обезьян.

Способность к имитации лежит в основе того, что отличает человека от других животных, — философы и психологи повторяют это в унисон.

Более века назад социолог Габриэль де Ларде подчеркнул центральную роль подражания в динамике групповой жизни. Когда подражание одного человека другому выходит на макроуровень социума, то оно формирует мейнстримное поведение толпы. Подражание — это механизм распространения, будь то обычаи или новые идеи.

То есть склонность к подражанию создает тот самый «воздушно-капельный» путь, по которому передаются тенденции. Позже Дэн Спербер проведет аналогию между этим путем и эпидемиологическими моделями в биологии, чтобы объяснить «заражения идеями» в культурной эволюции.

Габриель Тард и вовсе рассматривал подражание как матрицу всех социологических принципов, как механизм, который отражает индивида в группе и группу в индивиде.

Да, подражание — это повторение, но его побочное действие — это распространение нового. Новые навыки можно усвоить через подражание, не так ли? В Японии, например, ученик повара месяцами наблюдает за тем, как мастер суши разделывает рыбу, прежде чем ему дадут в руки нож. Ученик не корпит над конспектами со схематическими изображениями рыб и обозначенными на них линиями разреза — он просто наблюдает и режет.

Дети учатся в основном путем наблюдения и подражания. Но подражательное обучение не может случиться рандомно: за каждым таким пополнением знаний стоит выбор, сосредоточенное внимание и сила воли.

Не подражание, а взаимность

Процесс подражания необходим, но недостаточен. Наша социальность подразумевает нечто большее, чем зацикленное воспроизведение эквивалентного опыта.

Мы начинаем с повторения, но повторение, поглощенное в себе, — бесплодно. Нам нужно обменяться своим повторением с кем-нибудь, и желательно, если этот кто-то его оценит. Ученику японского повара важно, что скажет мастер, когда он наконец возьмет в руки нож и сам разделает рыбу: одобрит или раскритикует?

В обществе мы скорее не повторяем, а обмениваемся повторениями. Обмен подразумевает открытость системы. То есть повторение начинает задействовать свою социальную магию, когда превращается во взаимность.

Мы уже со второго месяца от роду начинаем переходить от зеркальных повторений к базовым, первичным формам взаимности. Позже мы обращаем совместное внимание к объектам — это вторичная интерсубъективность. Потом мы начинаем обсуждать ценности — это третичная субъективность. А развитие этической позиции начинается к четвертому году жизни.

В русском языке слово «взаимность» подразумевает обмен, потому что его корень есть и в глаголе «взять». По-латыни «взаимность» — это reciprocus. От этого слова взяли свое начало многие эквиваленты из романо-германских языков. Оно означает «движение назад и вперед». Дословно: префикс re- (назад) и pro- (вперед).

Взаимность в мире животных

И человек, и другие животные ведут между собой партии взаимодействий, своего рода игры. А первое правило любого игрока — это наблюдать за другими игроками. Лучшая стратегия часто зависит от стратегий противников.

Стремясь к выживанию, животные противостоят собратьям так же, как игроки соревнуются друг с другом в стремлении выиграть. Ссылаясь на это сравнение, Мейнард Смит взял теорию игр Джона фон Неймана и Оскара Моргенштерна и перенес ее из экономического контекста в биологический.

Как у игроков, так и у живущих вместе животных есть два варианта взаимного поведения: избегание вражды и вражда. Теперь представим две крайности этих двух стратегий: постоянно атакующий воинственный ястреб и кроткая голубка, предпочитающая избегать конфликта. Давайте сыграем этими персонажами в эволюцию.

Раунд 1. Представим, каким успехом пользовался бы ястреб, если бы большинство применяло стратегию голубки. Ястреб бы всех порвал. Популяция голубей была бы нестабильна только из-за риска его появления.

Раунд 2. Теперь представим группу ястребов и то, как они неустанно убивают друг друга. Голубь имел бы преимущество, потому что он, не влезая в драки, может остаться одним из немногих выживших и распространить свои гены.

Мы только что проиграли два противоположных варианта эволюционно нестабильного состояния.

Равновесие приходит, когда противоположные стратегии оказывают друг на друга взаимное давление, делая выгоды и неудобства каждой из них равнозначными.

Для интереса добавим во взаимодействие не просто избегание вражды, а возможность сотрудничества. Совместное использование ресурса иногда может принести пользу обоим соперникам. Те же львы и многие приматы делят территорию и даже самок. Компромисс — трезвый выбор, когда цена опасной эскалации высока.

В таком сотрудничестве главное — вычислять обманщиков, которые не воздают услугой за услугу и злоупотребляют компромиссом, не предлагая ничего взамен. Этот вопрос подтолкнул Роберта Триверса вывести теорию взаимного альтруизма. Ее суть в том, что плодотворное сотрудничество может развиться только у видов, которые способны вычислять обманщиков: никакого одностороннего альтруизма, только взаимный. Если ты почешешь мне спину, то я почешу твою, а если не почешешь, то и я не почешу — таков девиз взаимного альтруизма. Проблема в том, что невозможно заранее точно предугадать, почешет ли нам спину оппонент: его выбор мы ощущаем на себе только тогда, когда он уже сделан. Как быть?

Дилемма заключенного

Принимать решения в условиях социального взаимодействия очень сложно, и на помощь приходит дилемма заключенного. Это алгоритм взаимодействий, обернутый в воображаемую ситуацию. Дилемма заключенного — классическая концепция теории игр, изучающая стратегическое взаимодействие между рациональными лицами, принимающими решения.

В ней два человека обвиняются в совместном совершении преступления. Заключенные содержатся раздельно. Каждого из них хотят расколоть, чтобы он сдал пособника. Если никто никого не предаст, обоих освободят. Чтобы соблазнить их, за предательство предлагают вознаграждение. Но если оба предадут друг друга, то оба получат сроки. Если же только один человек предаст другого, он получит и вознаграждение, и свободу, а другой отправится отбывать заключение ни с чем.

Дилемма возникает из-за противоречия между индивидуальными и коллективными интересами. Каждый заключенный решает, доверять ли другому и молчать — или совершить предательство ради личной выгоды.

Оптимальная стратегия для каждого зависит от того, какие действия ожидаются от другого человека. Решения игроков еще зависят от вероятности их будущих встреч: если увидеть друг друга больше не суждено, то предательство — самый рациональный выбор, с точки зрения отдельного игрока. Но если оба человека пойдут на обман, то оба окажутся в относительно невыгодном положении.

Если раунды повторяются, то будет выгодно сотрудничать, по крайней мере на первых ходах. Предательство же удобнее использовать к концу игры. Когда заранее известно общее количество раундов, люди действительно чаще жульничают на последних этапах.

Роберт Аксельрод искал самую выигрышную стратегию для повторяющихся игр с дилеммой заключенного. Для этого он организовал компьютерный турнир, в котором участвовали теоретики из разных дисциплин, предлагая свои стратегии. Некоторые из них были очень сложными, но на выходе высший балл набрала самая простая.

Эта стратегия, названная автором Анатолем Рапопортом TIT FOR TAT, имела всего два правила:

  1. На первом ходу сотрудничай.
  2. На каждом последующем ходу делай то же самое, что сделал твой оппонент на предыдущем ходу.

Знакомьтесь, Tit for Tat — стратегия сотрудничества, основанная на взаимности, эхо теории взаимного альтруизма, нашедшее свое место за пределами биологии.

Как только результаты турнира Аксельрода были опубликованы, тут же был организован второй. По форме он был идентичен первому, за исключением того, что матчи состояли не ровно из 200 партий, а имели случайную длину со средним значением 200, чтобы избежать удобного читерства на последних партиях. 62 человека из шести стран пустили в ход свои стратегии. Но Tit for Tat вытеснила их всех снова!

В результате анализа трех миллионов вариантов, использованных во втором конкурсе, были выявлены четыре особенности Tit for Tat:

  1. Никогда не будь первым предателем.
  2. Наноси ответный удар только после того, как твой партнер перешагнул черту.
  3. Будь готов простить после первого акта возмездия.
  4. Применяй эту стратегию только в том случае, если вероятность повторной встречи с тем же игроком превышает соотношение 2:3.

С момента публикации значение этой стратегии выросло настолько, что теперь она доминирует в наших представлениях об эволюции кооперативного поведения в группах животных и людей. Исследования Аксельрода были процитированы тысячи раз в области экономики, политики, психологии, философии и эволюционной биологии.

Tit for Tat — зеркальная стратегия

Прежде чем эта фраза стала названием стратегии в теории игр, она была английским выражением, которое дословно переводится так: «ударить легонько того, кто ударил тебя легонько». Русский эквивалент — пресловутое «око за око». В некоторых языках нет аналогичных устойчивых выражений, поэтому, например, во французском эта стратегия зовется «сотрудничество — взаимность — прощение».

Око за око — это стратегия зеркального отражения действий другого игрока в условиях сотрудничества или конкуренции. Отражая действия другого игрока, мы создаем ощущение доверия и предсказуемости.

Слабости зеркальной стратегии

В победе этой стратегии в турнирах Аксельрода есть некоторые оговорки. К примеру, если бы в игре участвовали только те правила, которые действительно заняли первые места, то TFT заняла бы только четвертое место.

В книге «Эволюция кооперации» Аксельрод утверждает, что «успех Tit for Tat объясняется сочетанием таких качеств, как вежливость, возмездие, прощение и ясность».

Все это делает TFT очень прочной стратегией со временем, но есть одно критическое ограничение, которое часто игнорируется: она никогда не позволяет выигрывать игроку, который ее применяет.

При сотрудничестве оба оппонента получают одинаковое количество очков, а противник получает преимущество при первом же отступлении. А использующий TFT уже не сможет обогнать оппонента по количеству очков.

Поэтому в каждом отдельном взаимодействии использующий TFT обречен либо на ничью при вечном взаимном сотрудничестве, либо на проигрыш. Спустя примерно полвека после блестящего выхода TFT Эндрю Колман и другие критики высказали мнение, что TFT не имела бы успеха, если бы не стиль «кругового турнира» Аксельрода. Если бы Аксельрод выбрал стиль «нокаут-турнира», в котором участники выбывали из игры каждый раз, когда проигрывали сопернику, у TFT не было бы шансов.

В реальности люди могут предавать по ошибке. Например, друг игнорирует наш звонок. Мы можем посчитать это предательством, даже если у друга просто села батарейка. Применение к нему стратегии TFT было бы ошибочной реакцией.

В реальном мире, наполненном шумом и дезинформацией, стратегия TFT рискует вызвать порочный круг недоверия, а не сотрудничества.

За неимением лучших альтернатив «око за око», или TFT, по-прежнему проповедуется как лучшая стратегия взаимодействия с другими людьми и поддержания мира. Ее относительные успехи демонстрируют на конкретной модели хрупкость людских взаимоотношений. Единственное, что нам остается, — это возвращаться к истокам и подражать действиям и людям, которые в наших глазах заслуживают подражания.