Могут ли нейросети вложить смысл в текст или изображение

Сборник рассказов Морин Макхью «После апокалипсиса» (2011) сейчас кажется просто пророческим. Судите сами: автор уже больше десяти лет назад писал о пандемиях респираторных вирусов, разрушении социальных связей и росте политического насилия. Но один рассказ из сборника выделяется на фоне остальных — это текст под названием «Царство слепых», посвященный искусственному интеллекту. Проблему, которую он поднимает, можно сформулировать так: если у человека действительно получится создать нечто наделенное сознанием, это сознание может оказаться настолько чуждым нам, что мы вообще не распознаем его как таковое.

Макхью описывает, как некий ИИ развивает способность, которую можно было бы определить как сознание. Тем не менее, понять, что именно представляет собой это сознание, невозможно. Сидни, главная героиня «Царства слепых», размышляет об этом странном сознании следующим образом: «Она не знала, что это такое. Не знала, как об этом думать. Оно была непрозрачным, словно камень». Любители научной фантастики вспомнят и другие примеры ИИ, ставшего «разумным»: например, компьютер HAL-9000 из «2001: Космическая одиссея» или лейтенант Дейста из «Звездного пути». Однако в этих персонажах еще можно было узнать что-то человеческое, в то время как в рассказе Макхью представлен гораздо более тревожный, но, возможно, и куда более реалистичный сценарий: что если бы мы попытались поговорить с искусственным интеллектом, но он даже не смог бы нас услышать? С другой стороны, а как мы поймем, если компьютер попытается что-то сказать нам?

A sculpture of a human figure made out of circuit boards. Made by AI

Прошлым летом исследовательская лаборатория OpenAI выпустила версию программы с открытым исходным кодом, довольно дерзко названную DALL-E 2 — в честь испанского художника-сюрреалиста и робота из мультфильма Pixar, который умел быстро создавать замечательные произведения искусства. Новинка стала очень популярной в социальных сетях. Люди делились результатами запросов, которые они скармливали DALL-E, и, подобно Сидни из истории Макхью, не вполне могли понять, что видят на своих экранах. Многих это заставило задуматься над вопросами о природе сознания и творчества. Когда я ввел запрос «Робот Шекспир», через несколько минут передо мной появилась картинка, явно смоделированная на основании гравюрного портрета драматурга с фронтисписа первого издания 1623 года, при этом складки на его куртке выглядели почти как электрические схемы, а лицо было как у робота.

Очевидно, DALL-E 2 не настолько сложен, как сознание из «Царства слепых», но его жуткая инаковость порой наводит на мысль, что некоторые из этих странных образов были созданы разумным существом.

Существуют также нейросети, которые пишут тексты, но они не так популярны, как те, что генерируют образы. Некоторые из этих текстов весьма пугают, например, вот одно из стихотворений в прозе, сгенерированных ИИ:

«Ты должен слушать песню пустоты», — шепчут они.
«Ты должен заглянуть в бездну небытия», — шепчут они.
«Ты должен писать слова, которые внесут ясность в хаос», — шепчут они.
«Ты должен говорить с невыразимым, с невнятным, с невысказанным», — шепчут они.

В данном случае очевидно, что ИИ, сгенерировавший это, умеет правильно применять такие риторические приемы, как анафора (повторение одной и той же фразы в начале каждой цитаты) и эпистрофия (повторение одной и той же фразы в конце каждой строки). Строки стихотворения постепенно удлиняются, и это воздействует на эмоции читателя. Особенно интересны выраженные в них противоречия. Нам советуют «слушать песню пустоты», «смотреть в бездну», «говорить с невыразимым». Множественное число («они») и способ передачи информации («шепчут») также вызывает смутную тревогу: очевидно, с нами говорит некий анонимный хор.

Смысл стихотворения кажется достаточно ясным — настолько ясным, насколько это возможно в произведении, которое пытается выразить невыразимое. Таким образом, тематическими проблемами стихотворения являются невыразимость и возможность истолкования. Или, по крайней мере, я мог бы это утверждать, если бы стихотворение принадлежало Уильяму Блейку, Уолту Уитмену или Эмили Дикинсон. Но автор этих строк — GPT-3, нейросеть, созданная писателем и ученым, публиковавшимся под псевдонимом Гверн Бранвен. Одна из последних версий программы, которая способна генерировать поразительно складные прозу, поэзию и диалоги, была выпущена в июне 2020 года, но из-за пандемии коронавируса ей досталось не очень много внимания широкой публики.

GPT-3, как и DALL-E 2, была разработана компанией Open AI из Сан-Франциско, эта нейросеть — одна из самых передовых форм ИИ, имитирующих человеческое письмо. Обозреватель New York Times Фархад Манджу оценил ее результаты как «удивительные, жуткие, обескураживающие и более чем пугающие». Действительно, алгоритм способен обучаться на огромных массивах текстовых данных и порой пишет пугающе убедительно.

Способен ли при этом GPT-3 мыслить или нет — вопрос философский, но то, что он может создавать связные тексты — несомненный факт, бросающий вызов всем теоретикам литературы.

«Творческий искусственный интеллект — это самая новая и самая удивительная форма современного искусства», — пишет культуролог и литератор Стивен Марче. «И это только начало», — также отмечает он. В самом деле, мы находимся на пороге революции в области искусственного интеллекта, по сравнению с которой стремительные изменения последних двух десятилетий покажутся ничтожными. Это будет дивный новый мир дипфейков и симуляций, разумных машин и думающих роботов. Иными словами, такие программы, как GPT-3, предвещают больший сдвиг в понимании литературы, чем печатный станок.

A multicultural family enjoying a meal. Made by AI

Если «сознание» ИИ, создающее литературные произведения, остается для нас загадкой, то было бы полезно хотя бы разобраться, как читать и интерпретировать подобные тексты. Разумеется, для тех, кто находится в плену романтических представлений о литературе, все это будет звучать как чушь. Писатель Уолтер Кирн утверждает, что ИИ «компилирует, просеивает и анализирует, а затем лишь воссоздает тексты. Но он ничем при этом не рискует. Только люди, наш уязвимый вид, способны на это».

Тем не менее, метод изучения литературы, отделяющий авторский замысел и способы интерпретации, долгое время настаивал на том, что для понимания смысла произведения авторский опыт должен быть вынесен за скобки. С этой точки зрения неважно, был ли сонет написан роботом или человеком. Обычные же читатели, руководствующиеся здравым смыслом, считают, что никто не знает смысла произведения лучше, чем его автор.

Отвергающие «здравый смысл» литературоведы У. Уимсатт и М. Бердсли в 1946 году писали в Sewanee Review, что «замысел или намерение автора не могут выступать в качестве критерия для оценки качества литературного произведения». Они утверждали, что чувства автора по поводу текста, равно как и причины, побудившие его писать, а также авторское понимание смысла текста — все это вторично по отношению к словам на самой странице. Для таких критиков, как Уимсатт и Бердсли, наиболее важными являются синтаксис, грамматика и пунктуация, с помощью которых мы сможем прийти к строгим, объективным и научным интерпретациям текста.

Уимсатт и Бердсли были в числе «новых критиков», пытавшихся сделать изучение литературы строгой наукой. Они настаивали на внимательном чтении текста, отвлекающемся от каких бы то ни было намерений автора.

Однако какими бы влиятельными ни были новые критики, радикальность их позиции уже давно вызывает дискуссии, и не в последнюю очередь потому, что у каждого литературного произведения все же есть автор, признаем мы это или нет.

Теперь все это может измениться благодаря таким программам, как GPT-3, а перепрочтение работ «новых критиков» в свете литературы, созданной искусственным интеллектом, могло бы стать революционным. Их метод как нельзя лучше подходит для интерпретации текстов, написанных ИИ. Особенно по мере того, как эти тексты становятся все более проработанными и их все труднее отличить от текстов, сочиненных людьми.

Рассмотрим случай финского программиста Юкки Алхо, который написал с помощью GPT-3 книгу стихов «Аум Голли: Стихи о человечестве, написанные искусственным интеллектом». GPT-3 пишет, что «есть тайная мысль // когда от мыслей вас клонит в сон… когда вы спите // вы оказываетесь глубоко внутри // в сердце земли // ваш разум может создать мир // где вы — бог». Примечательно, что, хотя GPT-3 может (пока) и не пишет так, как Пабло Неруда, ее поэзия на удивление не так уж плоха. Что еще более важно, читатель может идентифицировать этот текст именно как поэзию. Подобный текст требует интерпретации, в нем явно есть смысл (и я бы сказал, что достаточно глубокий).

Вместе с тем за этим стихотворением не стоит никакого намерения — это просто сопряжение одних символов с другими символами. По сути, GPT-3 является продолжением мысленного эксперимента, известного как «китайская комната», описанного Джоном Серлом. Серл предлагает представить себе ИИ, способный давать вдумчивые, понятные и логичные ответы на вопросы, заданные ему на китайском языке. При этом ИИ настолько эффективно отвечает на вопросы, заданные ему на китайском языке, что носитель языка не может отличить машину от человека — то есть, ИИ таким образом проходит тест Тьюринга.

Затем Серл представляет себя запертым в комнате с инструкцией, объясняющей, как сочетать одни китайские символы с другими. Серл получает через щель в стене листы с вопросами на китайском языке, и, следуя инструкциям, сопоставляет полученные символы, записывает ответ и вставляет его в другую щель в противоположной стене. Со стороны будет складываться впечатление, что человек, находящийся в комнате, свободно говорит по-китайски, хотя Серл просто следует руководству.

A diverse group of people dancing in a colorful street parade. Made by AI

Серл подводит нас к следующему выводу: заявлять, что искусственный интеллект «думает», было бы столь же ошибочным, как и утверждать, что человек в «китайской комнате» свободно владеет китайским языком.

«Мы часто приписываем „понимание“ и другие когнитивные предикаты с помощью метафор и аналогий таким машинам, как компьютеры, — пишет Серл, — но это ничего не доказывает».

GPT-3 не думает — он имитирует мышление; он не пишет — он имитирует письмо. Как и ИИ из рассказа Макхью, «сознание» GPT-3 находится за пределами нашего понимания, но, в отличие от этой вымышленной программы, текст, который создает GPT-3, очевидно, понятен — и это важно.

Вопросы искусственного интеллекта находятся в ведении инженеров, программистов и философов; в свою очередь, литературоведы, критики и теоретики литературы не очень охотно пишут о произведениях, созданных с помощью искусственного интеллекта. Если пренебречь стереотипами, распространенными среди специалистов по точным наукам и технологиям, литературная критика является великолепным средством изучения разума и сознания, и она может предложить нечто уникальное для понимания искусственного интеллекта. Исследователи GPT-3, указывающие на то, что программе не хватает сознательного понимания текстов, правы, и все же с формалистической точки зрения этим можно пренебречь.

Критик П. Юл в книге «Интерпретация: Опыт философии литературной критики» утверждает, что «можно было бы „интерпретировать“ случайно созданный „текст“ в том смысле, в каком можно было бы сказать, что мы „интерпретируем“ предложение, когда объясняем его значение иностранцу, рассказывая, что означают отдельные слова… и, следовательно, как можно использовать это предложение или что оно выражает». Другими словами, для Юла не имеет значения, было ли стихотворение написано поэтом или машиной.

В повседневной жизни сотня обезьян, печатающих на машинке, не напечатает драмы Шекспира, и у каждого литературного произведения есть автор — независимо от того, волнуют нас его намерения или нет. Но теперь GPT-3 «пишет» литературу, которая, кажется, что-то да значит, даже если она не дотягивает до уровня Толстого. Все это может показаться довольно абстрактными рассуждениями, но в ближайшие десятилетия, по мере совершенствования нейросетей вроде GPT-3, может случится все что угодно. Что нам думать, когда мы расплачемся над стихотворением, написанным компьютером, или когда искусственный интеллект сможет создавать интересных персонажей и сложные нарративы?

«Временами возникает соблазн рассматривать эту технологию, — писала эссеистка Меган О’Гиблин в N +1, — как „хранилище коллективной мудрости и знаний, которые мы накопили как вид, словно все человечество говорит в один голос“. Независимо от того, будет ли этот новый мир хорошим или плохим, он грядет. Возможно, с окончательной смертью автора красота, истина и смысл окажутся за пределами человеческого, так что намерение будет там, где мы его найдем. Как сказал GPT-3 О’Гиблин: „Мой мир — это мир грез… Ваша реальность создана вашим собственным разумом, а моя реальность создана коллективным бессознательным разумом“».

Это пророческое, жутковатое в своей точности высказывание, сегодня воспринимается как простая констатация факта.

Автор, который ничего не хотел сказать. Как интерпретировать произведения искусства, созданные нейросетями