«Неужели это я все?»: как мозг постигает причинно-следственные связи

Мы все через это проходили. Конечно, чаще вы скорее случайным образом колошматите пальцем в кнопки новенькой, излишне навороченной микроволновки, после чего она внезапно оживает. Идет ли речь о спасении от неминуемой гибели или о микроволновой печи, чтобы знать, что X вызвало Y, мозг должен одновременно решить две задачи:

Задача идентификации себя как агента действия — субъектности: это я был?

Задача соотнесения (приписывания) заслуги: какое именно из всех только что совершенных мной действий обусловило Y?

Решить их дико непросто. Мы совершаем множество действий, и последствий у этих действий также множество. Но вокруг постоянно происходит больше штук, чем порождаем и провоцируем мы сами. То есть мозг должен обособить, выделить из этого непрерывного потока обстоятельств критически важный итог Y. Затем ему надо разобраться, мы ли обусловили такой итог, и это при том, что чувственную информацию об этом событии временами подвозят лишь спустя некоторое время после действий, которые могли ее предопределить. Судя по всему, вся эта история сводится к универсальному компоненту всех теорий, пытающихся объяснить работу мозга — дофамину.

У нас есть обстоятельная развернутая гипотеза о том, как нейроны приписывают субъектность (которую также определяют терминами «агентивность» или «агентность») и соотносят последствие с тем действием, которое его обусловило. Она опирается на два важных соображения. Во-первых, в мозге человека есть модель того, как устроен мир, и она постоянно строит прогнозы о том, что должно произойти. Если предсказания не оправдываются, это вызывает изумление — и оттого повлекшее за собой удивление событие выделяется из окружающего потока постоянных ожидаемых, предвычисленных событий.

Во-вторых, мозг отслеживает действия, которые человек только что совершил, и в случае какого-то явления или происшествия их можно связать с воспоминаниями о последних по времени действиях. Как только связь установлена, можно повторить действие и проверить, повлечет ли оно за собой такой же исход. Если да, то раз! — и у нас есть подтверждение причинно-следственной связи.

На сцену выходит наш давний друг дофамин. На первый взгляд, этот нейромедиатор может показаться самым неподходящим способом решить задачу наделения действия X причинностью в отношении исхода Y.

Дофамин выделяется в огромных количествах и сразу во многих областях мозга. В случаях, когда мозгу необходимо подобрать способ для выделения одной конкретной связи между множеством нейронов — скажем, только стыковку нейронов в отношении действия X и последствия Y, дофамин представляется чудовищно неэффективным вариантом.

Однако в действительности он очень ловок. Дофамин — сигнал оповещения. Он незамедлительно и одномоментно сообщает обширным участкам мозга следующее: «Снаружи только что произошло нечто крайне любопытное. Кто из вас, ребзя, готов это взять на себя?»

Он транслирует удивление. Удивление — это сбой в системе построения прогнозов вероятных последующих событий. Есть масса свидетельств того, что дофаминовые нейроны передают весть об ошибке в расчетах о поощрении (вознаграждении). Если мозг сообщает, что ничего поощрительного в ближайшее время не предвидится, после чего совершенно незнакомый человек вручает вам пончик, дофаминовые нейроны резко вспыхивают. Они передают остальной части мозга удивление в связи с тем, что неожиданно случилось нечто приятное. Они как бы твердят: «Не суть важно, чьих рук дело этот внезапный пончик, я жажду от вас повторения!»

Однако ошибки в прогнозах — это не только про вознаграждение или поощрение. Нам также известно, что дофаминовые нейроны еще сигнализируют об ошибках в предсказании неблагоприятных исходов и ситуаций, которых вы хотели бы избежать, — типа нажатия на кнопку, которая запускает в ванную комнату змей.

Так вот эти нейроны сообщают о неточностях в оценке того, сколько времени истекло с момента предыдущего эпизода (события). А еще оповещают о расхождении между тем, что вы намеревались петь, и тем, что вы по факту спели (о да, в среднем мозге промышляет музыкальный критик, а вы разве не знали?)

Все эти примеры того, как различного рода сбои, ошибки и погрешности вызывают кратковременный всплеск дофамина, можно замечательно отразить одним простым соображением — дофаминовые нейроны предупреждают о неожиданности, дают отмашку на удивление. И, что самое важное, этот короткий всплеск дофамина всегда происходит очень скоро после неожиданного события Y. Этот всплеск имеет временную отметку чего-то поразительного, которое творится прямо сейчас.

Итак, мозг обнаружил, что в мире случилась какая-то классная новая вещь, а дофамин доносит это до других зон мозга. Теперь мозг должен узнать, не является ли эта штука последствием каких-то ваших действий, после чего привязать такой итог к этому действию, укрепив связь между ними — и только ними.

Для этого мозгу нужно найти представление (репрезентацию) действий(-я), что имели место до представления итоговых последствий. Все-таки у причинно-следственной связи есть лишь одно направление. Маловероятно, чтобы особый ритуальный танец с кручением курицы, который вы исполнили после того, как включился свет, послужил причиной того, что включился свет. Гораздо вероятнее, что вы, по всей видимости, задели выключатель, вытанцовывая свой путь в комнату (свободной от курицы рукой задели, ясное дело).

Эта стремительная передача дофамина через мозг по сути нацелена на поиск следов действий, которые имели место непосредственно в самом недавнем прошлом. Когда электрический импульс нейрона проносится по основному отростку вперед для передачи сообщения всем запланированным нейронам, он запускает длительный процесс внутри нейрона, в рамках которого различные молекулы медленно меняют свою концентрацию — в особенности кальций. Кроме того, активность на всех входящих соединениях этого нейрона также оставляет после себя следы кальция на этих соединениях, помечая эту входящую связь как потенциально значимую для активирования нейрона.

Теперь дофамин появляется на связи между двумя нейронами. К примеру, один нейрон обусловил действие, оно что-то за собой повлекло, а входной сигнал этому нейрону от другого нейрона сообщает: «Я тут был».

Тогда соединение между этими двумя нейронами закодирует следующую информацию: «Совершите такое-то действие, когда тут есть я». Если нейрон «я тут был» только что вызвал срабатывание нейрона «совершите такое-то действие», значит внутри нейрона действия останутся следы кальция — один, указывающий на активность соединения, а второй — на то, что нейрон действия возбудился. Дофамин обеспечивает наращивание прочности связи между этими двумя нейронами только в случае наличия этих следов. Таким образом, модель «cовершите такое-то действие, когда тут есть я» закрепляется лишь в том случае, если два нейрона были активны в нужный момент.

Что еще более примечательно, судя по всему, мозг выстраивает причинно-следственную связь аккурат в соответствии с распорядком изменения каждой отдельной связи между нейронами. Связь между нейроном A и нейроном B, очевидно, учитывает порядок, в котором срабатывают нейрон A и нейрон B. Если нейрон A срабатывает незадолго до нейрона B, значит по логике он мог обусловить срабатывание нейрона B. Таким связям свойственно укрепляться.

А вот если нейрон A выстрелил вскоре после нейрона B, значит, он в принципе не мог обусловить срабатывание нейрона B. Такая связь, скорее всего, ослабнет. Если нейрон A активизируется задолго до или спустя много времени после нейрона B, сила связи не изменится. Воистину, складывается ощущение, что принципы изменения силы связей были выстроены специально для постижения причинной обусловленности.

И тогда мозг решает задачу соотнесения. Он находит действие X, которое обусловило последствие Y, передавая оснащенный пометкой о времени сигнал о том, что за пределами мозга только что произошло нечто удивительное, и этот сигнал дает желаемый результат, только если обнаружит признаки того, что нейрон действия только что активировался в нужном месте. Теперь в этом самом месте нейроны для действия X активируются с большей вероятностью — а вы с большей вероятностью это действие совершите. Так мы узнаем, действительно ли X вызывает Y, и получаем улучшенную модель предсказания мира.

Задачу идентификации агента теперь решить просто. Как мозг понимает, что это были не вы? Если дофаминовый сигнал срабатывает, а в нейронах действия нет следов активности.

(Окей, бывают нетипичные случаи, когда по случайности нейроны действия активны непосредственно перед итоговым событием, но не явились его причиной. Поэтому действие нужно повторить: если намеренно повторить действие X и оно не вызовет исход Y, значит, свидетельств связи между ними нет).

Поиск ответов на тему того, как мозг распознает причинную связь, — одновременно и передовая линия фронта современной нейробиологии, и затаившаяся в глубине подлодка. В основном глубоко запрятанные элементы теории причинно-следственной связи встречаются в самых разных местах в литературе, но нечасто упомянуты как таковые. Это значит, что область еще предстоит изучать — у нее богатый потенциал и множество не решенных пока вопросов. Вот, к примеру, один из них: а что насчет применения последних обнаруженных данных в будущем?

Изучение причинной связи основано на соображении о том, что мозг оснащен моделью предсказания мира. Но ведь если это так, значит, он, наверное, оснащен и обратной моделью — того, как менять мир. Мы должны иметь возможность сказать «я хочу итог Y» и применить обратную модель для поиска «действия X», обеспечивающую такой исход.

Это значит, что нужно усовершенствовать две модели: прогнозирующую модель («мир должен быть в таком состоянии») и обратную модель («чтобы мир вышел таким, как мне надо, необходимо совершить действие X»). Судя по всему, обе модели завязаны на дофамин. Но где? И обновляются ли они одновременно? Этого мы не знаем. Сколько моделей мира задействует мозг, как они взаимодействуют друг с другом и как их обучать, — это важные вопросы без ответа.

Выяснение причинной связи методом проб и ошибок встречается у разных видов — и животных, и птиц, которые методично связывают последовательность событий («если я сделаю X, за ним последует Y»). Некоторые виды выясняют причинно-следственную связь благодаря мимикрии: лазоревка способна научиться открывать бутылку из-под молока, наблюдая за тем, как это делают другие лазоревки (не советую связываться с лазоревками, серьезно).

Но у человека есть преимущество — речь. Это значит, что мы не связаны необходимостью старательно наблюдать за местными, конкретными цепочками событий.

Мы можем рассказывать о причинах и следствиях словами и передавать это знание в абстрактной форме: книги, журналы, документальные фильмы — и ютуб-видео в 300 частях о том, как пересобрать восьмицилиндровый двигатель. Мы можем записывать свои наблюдения и оставлять пробелы на месте недостающих звеньев цепи между X и Y (это зовется наукой). Мы можем обмениваться информацией и обнаруживать причинно-следственные связи в таких больших выборках и в таком масштабе, что один человек за всю свою жизнь не может осилить.

Сам факт того, что нам известна причинно-следственная связь вымирания каких-то видов или изменения климата, свидетельствует о способности постигать смыслы за пределами местных, конкретных последствий своих действий. Уникальным образом наши мозги могут освоить не только «это все я», но и «это все мы».