Изящные речи чистого разума: может ли нейросеть быть художником?

Стихи, картины и прозу сегодня создают не только люди, но и нейросети. Но можно ли считать их продукты искусством? А может быть, художник — это автор алгоритмов или человек, обучивший нейросеть? Ответ зависит от того, кто спрашивает и что именно он считает «искусством». Нейрофизиолог и научная журналистка Мария Пази предлагает собственный взгляд на творчество компьютеров, альтернативный по отношению к искусствоведческой точке зрения.

У меня есть знакомый знакомого из Бостона. Знакомый-знакомого-из-Бостона пишет алгоритмы, а еще — стихи. Когда я сменила фото профиля в фейсбуке, из Бостона прилетело сообщение: мол, есть у меня четверостишие, оно написано не тебе и не про тебя; но ты подходишь под описание:

В знойный полдень жаркого лета
Будто в омут со льдом меня бросили
Глаза твои бирюзовые, океанова цвета
Твои волосы медные, цвета осени…

Красивая, отвечаю, получилась окрошка из Есенина и Лермонтова. «Волосы цветом в осень» — это из «Заметался пожар голубой»: хулиган Есенин, чтобы «тонко касаться руки / и волос твоих цветом в осень», обещает забыть кабаки и забросить стихи. А бирюзовые, вернее, лазурные, глаза были у Лермонтова: «С глазами, полными лазурного огня, / С улыбкой розовой, как молодого дня…».

История, впрочем, не про стихи или поэтов. Четверостишие по мотивам фото профиля я получила тогда же, когда прочитала о нейросети, преобразующей текст в картинки. Алгоритм создала некоммерческая компания по изучению искусственного интеллекта Open AI. Нейросеть назвали DALL.E — в честь усатого сюрреалиста Сальвадора Дали и робота ВАЛЛ.И. По текстовому описанию DALL.E может нарисовать что угодно: от кресла-авокадо до редьки в балетной пачке, выгуливающей собаку. В открытом доступе можно найти прохожий код, который вполне убедительно рисует портреты Волан де Морта и пейзажи Хогвартса. В эту нейросеть я и подгрузила лирику из Бостона (а что с ней еще делать?).

Алгоритм в ответ нарисовал «знойный полдень жаркого лета» и абстракцию в бирюзово-медных тонах. Но целью было получить портрет — чем я, в конце концов, хуже Волан де Морта? Потому запрос сократился до двух последних строк «глаза твои бирюзовые, океанова цвета / Твои волосы медные, цвета осени…». Нейросеть же покорно нарисовала пару портретов в жанре «на любителя» и голубого щенка.

Когда реальная фотография превратилась в стихотворное описание, а затем в нейропортрет, я увлеклась: прогнала через нейросеть Есенина, Блока и Бродского. А закончилось всё отрисовкой лирики «Нейронной обороны» — нейросети, обученной на стихах Егора Летова. В 2016 году эту нейросеть-поэта создали Алексей Тихонов и Иван Ямщиков из «Яндекса». В домашней студии они записали 13 песен на тексты нейросети — музыкальный эрзац-альбом «404». Что получится, если загрузить стихи нейропоэта в нейросеть-художник? Алгоритм нарисует шагающий по полю красный мак на ножках и чьи-то глаза апельсинового цвета.

Игры с нейросетями увлекают многих. Энтузиаст машинного обучения Герман Тюменцев создал клип по «Бытию 2:7». Иллюстрации сгенерированы искусственным интеллектом по тексту Библии, а озвучивает текст нейросеть, обученная на голосе Дарта Вейдера. Послушать, как под видеоряд психоделических ветхозаветных картинок Дарт Вейдер зачитывает «И создал Господь Бог человека из праха земного, и вдунул в лице его дыхание жизни, и стал человек душею живою», можно в инстаграме энтузиаста.

Берлинская художница София Креспо с помощью искусственного интеллекта генерирует изображения несуществующих животных. Тревор Паглен рисует «Состязательно развившиеся галлюцинации»: шоссе смерти, искусственные зубы, радугу, комету, венерину мухоловку. В лаборатории искусства и искусственного интеллекта Ратгерского университета на основе 81 449 картин научили алгоритм-художник AICAN рисовать пиксельные размытые пасторали и кибер-кажется-портреты. И, конечно, есть нейросеть от французского коллектива Obvious, чей портрет несуществующего Эдмонда де Белами продали за баснословные $432 500.

Сам ты художник

«Портрет Эдмонда де Белами» издалека кажется экспонатом классического искусства: из прямоугольника позолоченной рамы на зрителя хмуро глядит расплывчатый незнакомец в темном сюртуке и белой сорочке. Алгоритмическое происхождение картины выдает лишь подпись — математическая формула, которая создала портрет (min G max D x [log (D(x))] + z [log (1 — D (G(z)))]). Это генеративно-состязательная сеть (Generative Adversarial Network, GAN) — система, которая натравливает алгоритмы друг на друга: одна нейросеть генерирует образцы изображений, а другая пытается отличить «правильные» от «неправильных». Впервые генеративно-состязательные нейросети были созданы ученым Иэном Гудфеллоу (Ian Goodfellow). Фамилия Белами — своего рода дань первосоздателю: good и fellow примерно переводятся на французский как bel ami — Белами.

«До аукциона портрет Белами был только арт-объектом. Проблема началась в тот момент, когда его продали, — рассказывает Анастасия Четверикова, культуролог, автор подкаста „Искусство для пацанчиков“ и одноименной книги. — И тут началось: разработчик, который сделал эту нейросеть, сказал, что „я автор“, а ребята из французского коллектива Obvious, которые придумали это всё, сказали „да какой ты на фиг автор“ (хотя в публичных выступлениях делают благодарный реверанс в сторону разработчика); если бы нейросеть имела свой голос, она бы тоже, наверное, сказала „вы меня, конечно, создали, но автор тут — я“. Получается триада, которая пока ни на законодательном, ни на каких других уровнях не регулируется: мы не можем сказать, кто прав.

От авторства напрямую зависит ответ на вопрос: является ли работа нейросетей искусством.

Если мы считаем, что это всё равно творение людей, просто орудием была не кисть, как у художников Возрождения, а алгоритм, — в таком случае да, это искусство. Просто сделано нетривиальным способом. А если художник — нейросеть?»

Вокруг нейроискусства густо роятся споры. Может ли искусственный интеллект быть художником? Вероятно, алгоритм — это просто инструмент? Кто — или что — имеет авторское право: алгоритм; программист, его написавший; или художник, его применивший?

Мы, увы, не можем спросить, что думает нейросеть. Художники же расходятся во мнении. Пьер Фотрель из коллектива Obvious в интервью отмечал:

«…я думаю, что это [нейросети] всё же инструмент в руках творческих людей. Просто он и сам что-то воспроизводит. Я не говорю „создает“, потому что настоящим творцом остается художник. Творчество присуще только человеку. Какой бы смышленой ни была ваша собака, ее нельзя назвать креативной».

Герман Тюменцев, создатель нейроклипа по Библии, уже не считает алгоритм лишь инструментом, но и отдавать авторство машине не склонен:

«Все данные, на которых обучается алгоритм, а также его архитектуру прописывает человек. Поэтому в авторстве я бы указал всех участников сразу. К примеру: работа была сделана автором Х при помощи алгоритма Y инженера Z. Кого из людей величать главным творцом? Считать ли программиста соавтором — вопрос в духе „являются ли изобретатели камеры соавторами всех кинокартин“? В любом творчестве огромную роль играет концепт. Разные люди, используя один и тот же алгоритм, с учетом накопленного ими жизненного опыта, взглядов на те или иные вещи могут добиться совершенно непохожих результатов».

Скажем, один и тот же код Герман Тюменцев и я использовали по-разному. Я грузанула Есенина; Герман — Библию. Я грузанула, потому что «так вышло», предыстория клипа Германа интереснее. Поначалу он обучал нейросеть «разговаривать» на семплах электронной музыки. Но из-за небольшого количества слов в электронной музыке нейросети не хватило данных, произошел так называемый underfitting — сеть будто пыталась что-то сказать, но напоминало это крики из преисподней. «Вопли из ада» стали поводом задуматься о религиозной тематике и сгенерировать по библейскому тексту иллюстрации.

Именно этот процесс создания — сотрудничество человека и машины, — с точки зрения сторонников алгоритмов, гораздо ценнее конечного продукта. Признание соавторства художника и алгоритма — полумера, помогающая разрешить спор «художник ли? искусство ли?». Потому как сотрудничество человека и машины в поиске новых визуальных форм мало чем отличается от концептуального искусства, где идея, лежащая в основе работы, и процесс ее создания важнее результата.

Но можем ли мы найти у алгоритмов качества, свойственные художникам, поэтам, композиторам? Можем, но — в схожей «полумере» — не совсем можем.

Кто с кого списывал

Машины обвиняют в том, что они неспособны, как человек, создавать что-то принципиально новое, а лишь эксплуатируют усвоенные паттерны. Сторонники искусственного интеллекта защищаются — но ведь и человек обучается схожим образом: мы воспринимаем множество чужих текстов, картин, музыки и так учимся генерировать собственные. Приведу пример.

Помните, в стихах из Бостона были позаимствованные у Лермонтова «лазурные» глаза? Михаилу Юрьевичу не впервой сталкиваться с литературным воровством. «Лазурь» у него также подсмотрел Владимир Соловьев (не тот, о котором вы подумали, а поэт, философ и мистик XIX века). «В пурпуре небесного блистания, с очами, полного лазурного огня», Соловьеву в пустыне под Каиром на третье свидание явилась София Премудрость Божия. Владимир Соловьев признавался, что украл «лазурный огонь» у Лермонтова. Чувство юмора такое; украл и украл, чего бубнить-то. Но хорошо смеется тот, кто смеется последний. Блок потом тоже пошутил. Говорил, что соловьевская София у него стала Прекрасной Дамой — то есть проституткой в трауре. Премудрость Божию разжаловали.

В живописи заимствования тоже не единичны. Анастасия Четверикова в книге «Искусство для пацанчиков» рассказывает, как Босх в свое время восхитил сюрреалистов. Копировал Босха и Сальвадор Дали: в некоторых его набросках появляются характерные монстры. А из триптиха «Сад земных наслаждений» Дали взял пригорок, по которому ползут всякие твари, перевернул его и получился человеческий профиль для картины «Великий мастурбатор». Этот позаимствованный у Босха профиль, в котором Дали узнал себя, потом еще долго кочевал по работам сюрреалиста.

Если «вселенная не будет разбираться, кто с кого списывал», — так ли отличается заимствование паттернов алгоритмом от заимствований художников?

«Искусство — это всё же представление действительности сквозь призму какого-то эмоционального состояния, — говорит Денис Малимонов, автор телеграм-канала о нейроискусстве. — Нейросеть же — просто копирка. У нее нет никаких эмоциональных переживаний, осмысления, фантазии. Нейросеть может изобразить закат — но закат не навевает на нее какую-нибудь грусть. Она может сочинить лица людей, которые не существуют, — но „нафантазирует“ их лишь в жестких рамках данных, на которых ее обучали. Скажем, учили нейросеть на тысячах фотографий людей: они все отличаются по пропорциям, ширине носа, цвету глаз — но по расположению носа, глаз и рта они одинаковые. Алгоритм не выйдет за эти рамки, переставив местами рот и глаза, никогда не „нафантазирует“ три глаза и т. д.»

«Человеческий же разум абсолютно нельзя уложить в рамки, — продолжает Анастасия Четверикова. — Он мыслит неординарно, нетривиально, не „по-машинному“. Машине за этим не угнаться, даже если обучить ее на самых креативных данных вроде работ Уорхола».

Нейронные сети, хоть и воспроизводят опыт как люди, но с оговоркой: они воспроизводят его автоматически, будучи не способны осмыслить созданные артефакты.

Не(йро)определенность

В середине XX века искусство проверяли на прочность. Марсель Дюшан восстал против «сетчаточного» искусства — искусства исключительно для визуального восприятия. Дюшан выставлял в галереях обычные вещи: сушилку для бутылок, расческу и писсуар — превращал их в искусство благодаря контексту, но не форме. Признание работ Дюшана навсегда изменило традиционную систему координат: заспиртованные акулы Дэмьена Херста, неубранная кровать Трэйси Эмин или приклеенный изолентой к стене банан Маурицио Каттелана стали рассматриваться как искусство. Про алгоритмическое искусство говорят схожее и часто сравнивают с Дюшаном: процесс создания и идея ценнее конечного продукта.

Впрочем, нейросети похожи на художника-бунтаря и в другом. До «сетчаточного» восстания Дюшан нарисует самую знаменитую свою работу — «Обнаженную, спускающуюся по лестнице, № 2». Работа была отвергнута кубистами. «Ваши работы слишком расплывчаты, это не искусство, вы убиваете творчество», — звучали претензии. Нейросети сейчас выслушивают те же претензии.

Точно так же, как «Обнаженная» Дюшана словно бы смазана, работам нейросетей свойственна визуальная неопределенность: вы видите что-то знакомое, но не можете его толком идентифицировать. Нейросети Софии Креспо рисуют медузность, которая не соотносится с существующими медузами. В «Шоссе смерти» Паглена угадывается дорога, которая при внимательном рассмотрении шоссе всё же не является. Наконец, в сгенерированной нейросетью иллюстрации к Блоку вы можете усмотреть ночь, улицу и даже фонарь, но присмотритесь поближе — и всё куда-то пропадет. Нейросети скорее создают смазанное ощущение, а не четкий образ.

Дело в том, что алгоритмы должны создавать похожие на реальные различные ситуации, объекты, текстуры и освещения. Однако искусственный интеллект не может просто скопировать части изображений из обучающей выборки и вставить в новые. Современные исследования предполагают, что нейросети решают проблему, создавая объекты, размещая их в кадре, а затем добавляя цвет, текстуру и освещение. При этом расположение объекта и его текстура непрерывны, размазаны по всей плоскости изображения. Нейросети как бы заполняют раскраску, пренебрегая четкими границами, — части объектов и текстуры смешиваются, наслаиваются и перетекают друг в друга.

Визуальная неопределенность, порожденная ли «разумным» алгоритмом или воображением художника, завораживает зрителя, заставляет плутать в смазанных образах.

Запутавшийся мозг

Корни визуальной неопределенности искусства — от наскальных рисунков до генеративных нейросетей — лежат в нейробиологии. Исследователи связывают завораживающий эффект неоднозначных изображений с теорией предсказательного кодирования.

Согласно теории, мозг не пассивно воспринимает информацию от органов чувств, а активно предвосхищает то, что мы должны почувствовать. Скажем, на основе предыдущего опыта делает прогнозы о том, что увидит. Те области мозга, в которых информация согласуется с предсказанием, подавляются; а несоответствия регистрируются как ошибки предсказания и отправляются на дальнейший анализ. Это наращивает эффективность обработки: нейронные ресурсы для предсказуемых стимулов сведены к минимуму, а, напротив, на стимулы-сюрпризы брошено всё внимание. В свете эволюции способность эффективно кодировать и обрабатывать сенсорную информацию очень выгодна для такого энергетически прожорливого органа, как мозг. А значит, было бы разумно, чтобы эволюция вознаграждала нас, когда предсказания подтверждаются, а когда всё идет наперекосяк, эмоционально подчеркивала бы: «Мозг, у нас проблемы! С нашей прогностической моделью что-то не так». Что делает мозг после обнаружения ошибки предсказания? Задерживается на стимуле и проходит несколько циклов его обработки: исследует, делает предсказания, получает новые ошибки, учится. Поэтому, столкнувшись с визуальной неопределенностью картины, мозг может на ней, что называется, залипнуть.

Возьмем «Плачущую женщину» Пикассо. Общий модуль распознавания сцены при взгляде на картину обнаружит что-то, напоминающее лицо, и отправит предсказания о том, где должны быть у этого лица глаза и нос. Наоборот, глаза и нос на работе абстракциониста пошлют предсказание, что перед нами лицо. Если все прогнозы исполняются, то нужды в новых прогнозах нет и процесс стабилизируется. Но с «Плачущей женщиной» всё не так: глаза не там, где надо; нос почему-то двухцветный и с однобокими ноздрями; лицо местами и не лицо вовсе, а платок, которым утирают слезы. «Плачущая женщина» без устали генерирует в мозге сигналы ошибки прогнозирования, мозг тем временем снова и снова возвращается к изображению, чтобы подправить свои предсказания.

Через некоторое время зрительной системе удается найти хоть какое-то скудное объяснение непредсказуемым стимулам картины. В голове случается «ах, вот оно что»-момент. Зрительная система наконец соглашается, что «Плачущая женщина» — тоже лицо, просто вот такое непривычное. Когда удается худо-бедно восстановить предсказуемость, то есть объяснить ошибки предсказания, — мы испытываем положительные эмоции. Например, эксперимент с искаженными изображениями реального мира и последующей краткой демонстрацией неискаженной версии приводил к «ах, вот оно что»-моменту и сопровождался активностью эмоционального миндалевидного тела. Чем выше была активность эмоционального центра, тем лучше испытуемые запоминали способ устранить «ошибку предсказания». В исследовании восприятия музыки было показано, что красивые мелодии, от которых бегут «мурашки по коже», имеют неожиданный, непредсказуемый компонент, то есть тоже несут в себе ошибку предсказания. При этом «эффект мурашек» был связан с изменением активности эмоциональных областей — миндалины и области, участвующей в вознаграждении, — центре удовольствия (вентральном стриатуме).

Визуальная неопределенность просачивается с картин в наш мозг, порождает ошибки предсказания и заставляет нейроны завороженно — и с удовольствием — решать несоответствия.

И мозгу всё равно — видит он раскраски без границ от алгоритма или шедевр признанного мастера. Художники и машины эксплуатируют одну и ту же человеческую нейробиологию. Только с одной огромной разницей: первые делают это намеренно, а последние — нет.

Пикассо XXI века, один из самых высокооплачиваемых современных художников Герхард Рихтер рисует смазанные, словно бы выхваченные из черно-белой хроники портреты и обнаженных девушек, сотканных из сновидений и воспоминаний. Зачем? Герхард Рихтер объясняет: «Мы находим картины интересными только потому, что всегда ищем что-то, что кажется нам знакомым. <…> И обычно мы находим эти сходства и определяем: вот стол, вот одеяло и т. д. Когда мы ничего не находим, мы расстраиваемся, и это заставляет нас быть взволнованными и заинтересованными…»

А вы?

«В тот день облака висели низко в пасмурном небе. Внутри, однако, температура и влажность были под контролем. Йоко лениво сидела на диване, проводя время за бессмысленными играми», — начинается повесть, написанная нейросетью. В 2017-м она прошла в финал литературного конкурса — премии Хоси Синъити.

«Сегодня не стоит плакать из-за того, что вам скучно и хочется жрать. …Не помешает сходить в лес с моржами. Во второй половине дня возможно наступление вечера», — обещает мне нейрогороскоп от алгоритма. У нейросети получается — цитата создателя — «что-то между обычным гороскопом и рассказом Сереги из соседнего подъезда, который долбит амфетамин две недели и не собирается прекращать».

«Мы пошлем из него то для них — восхвалять человека, поистине, он — вражебесное!» — декламируют динамики взломанных камер псевдорелигиозный текст, сгенерированный алгоритмом deus X mchn.

Балабоба от «Яндекса» лихо копирует стиль любого текстового отрезка и дописывает его по своему разумению. Композитор-нейросеть AIVA пишет эмоциональные саундтреки к кино и видеоиграм. Нейросети дорисовывают картину Рембрандта и дописывают «Реквием» Моцарта.

Мы оказались в мире, где алгоритмы могут писать повести, стихи, музыку, картины, гороскопы, новости. При этом граница между человеком и машиной проходит по тесту Тьюринга: сможет ли компьютерная программа ввести человека в заблуждение, заставив поверить, что она — человек. Переводя тест Тьюринга в плоскость творчества: сможет ли алгоритм обдурить людей, убедив их, что картина или музыка написаны человеком, а не машиной. На художественной ярмарке Art Basel зрители не смогли отличить полотна, созданные алгоритмом AICAN, от работ современных художников и даже посчитали их более «человеческими». Нейроповести для получения премии Хоси Синъити не хватило не «человечности», а того, что персонажи были недостаточно проработаны. Нейросеть может написать новость — и люди поверят ей, не отличив фейк от алгоритма.

Однако же «творческий» тест Тьюринга машина проходит лишь по отдельным направлениям, а не по всем сразу, — она умеет хорошо делать что-то одно. И потому «искусственный интеллект — и тем более творческий искусственный интеллект — еще не созданы», считает Денис Малимонов.

Искусственный — и искусный — интеллект не существуют. Машины заимствуют паттерны, как люди, но всё же не совсем как люди: не осознавая, не испытывая эмоций, не осмысляя. Машины создают визуальную неопределенность и генерируют в нашем мозге ошибки предсказания, используют тот же инструмент воздействия на нейробиологию, что и «обычное» искусство. Но — опять же — не как человек, а почти как человек: ненамеренно, не целясь в неопределенность. Алгоритмы могут нарисовать портрет стоимостью в полмиллиона долларов, но факт покупки не сделает их работу произведением искусства, а так, почти искусством. Ведь именно люди — коллектив Obvious — поместили картину от алгоритма на рынок и тем самым поиронизировали над вопросом авторства.

И даже то, что нейросеть может дорисовать картину «как Рембрандт», не делает ее художником, а лишь подтверждает статус инструмента.

«Это очень кропотливая работа, — говорит Анастасия Четверикова. — Алгоритм изучил технику Рембрандта по оригиналу „Ночного дозора“, сделал копию работы в технике Рембрандта, а затем воссоздал некогда обрезанные у картины края в нужном размере. Нейросеть может выполнить такую работу дотошно и досконально настолько, насколько рука человека не может. Однако это механический труд, как ни крути, не супертворческий. А значит, пример на самом деле подтверждает: пока что нейросеть — механическое орудие, а не творческое начало».

Талантливые нейросети, несмотря на некоторую схожесть с талантливыми людьми, зависли в статусе «почти не инструмент, еще не автор».

Считается ли «еще не»? Считается «почти»?

А пока мы решаем, создают ли алгоритмы искусство, или, напротив, обвиняем их в бездарности, заодно вспомним и опопсевшую сцену из фильма «Я, робот»:

— Ты всего лишь машина. Только имитация жизни. Робот сочинит симфонию? Робот превратит кусок холста в шедевр искусства?
— А Вы?