Изящные речи чистого разума: может ли нейросеть быть художником?
Стихи, картины и прозу сегодня создают не только люди, но и нейросети. Но можно ли считать их продукты искусством? А может быть, художник — это автор алгоритмов или человек, обучивший нейросеть? Ответ зависит от того, кто спрашивает и что именно он считает «искусством». Нейрофизиолог и научная журналистка Мария Пази предлагает собственный взгляд на творчество компьютеров, альтернативный по отношению к искусствоведческой точке зрения.
У меня есть знакомый знакомого из Бостона. Знакомый-знакомого-из-Бостона пишет алгоритмы, а еще — стихи. Когда я сменила фото профиля в фейсбуке, из Бостона прилетело сообщение: мол, есть у меня четверостишие, оно написано не тебе и не про тебя; но ты подходишь под описание:
Красивая, отвечаю, получилась окрошка из Есенина и Лермонтова. «Волосы цветом в осень» — это из «Заметался пожар голубой»: хулиган Есенин, чтобы «тонко касаться руки / и волос твоих цветом в осень», обещает забыть кабаки и забросить стихи. А бирюзовые, вернее, лазурные, глаза были у Лермонтова: «С глазами, полными лазурного огня, / С улыбкой розовой, как молодого дня…».
История, впрочем, не про стихи или поэтов. Четверостишие по мотивам фото профиля я получила тогда же, когда прочитала о нейросети, преобразующей текст в картинки. Алгоритм создала некоммерческая компания по изучению искусственного интеллекта Open AI. Нейросеть назвали DALL.E — в честь усатого сюрреалиста Сальвадора Дали и робота ВАЛЛ.И. По текстовому описанию DALL.E может нарисовать что угодно: от кресла-авокадо до редьки в балетной пачке, выгуливающей собаку. В открытом доступе можно найти прохожий код, который вполне убедительно рисует портреты Волан де Морта и пейзажи Хогвартса. В эту нейросеть я и подгрузила лирику из Бостона (а что с ней еще делать?).
Алгоритм в ответ нарисовал «знойный полдень жаркого лета» и абстракцию в бирюзово-медных тонах. Но целью было получить портрет — чем я, в конце концов, хуже Волан де Морта? Потому запрос сократился до двух последних строк «глаза твои бирюзовые, океанова цвета / Твои волосы медные, цвета осени…». Нейросеть же покорно нарисовала пару портретов в жанре «на любителя» и голубого щенка.
Когда реальная фотография превратилась в стихотворное описание, а затем в нейропортрет, я увлеклась: прогнала через нейросеть Есенина, Блока и Бродского. А закончилось всё отрисовкой лирики «Нейронной обороны» — нейросети, обученной на стихах Егора Летова. В 2016 году эту нейросеть-поэта создали Алексей Тихонов и Иван Ямщиков из «Яндекса». В домашней студии они записали 13 песен на тексты нейросети — музыкальный эрзац-альбом «404». Что получится, если загрузить стихи нейропоэта в нейросеть-художник? Алгоритм нарисует шагающий по полю красный мак на ножках и чьи-то глаза апельсинового цвета.
Игры с нейросетями увлекают многих. Энтузиаст машинного обучения Герман Тюменцев создал клип по «Бытию 2:7». Иллюстрации сгенерированы искусственным интеллектом по тексту Библии, а озвучивает текст нейросеть, обученная на голосе Дарта Вейдера. Послушать, как под видеоряд психоделических ветхозаветных картинок Дарт Вейдер зачитывает «И создал Господь Бог человека из праха земного, и вдунул в лице его дыхание жизни, и стал человек душею живою», можно в инстаграме энтузиаста.
Берлинская художница София Креспо с помощью искусственного интеллекта генерирует изображения несуществующих животных. Тревор Паглен рисует «Состязательно развившиеся галлюцинации»: шоссе смерти, искусственные зубы, радугу, комету, венерину мухоловку. В лаборатории искусства и искусственного интеллекта Ратгерского университета на основе 81 449 картин научили алгоритм-художник AICAN рисовать пиксельные размытые пасторали и кибер-кажется-портреты. И, конечно, есть нейросеть от французского коллектива Obvious, чей портрет несуществующего Эдмонда де Белами продали за баснословные $432 500.
Сам ты художник
«Портрет Эдмонда де Белами» издалека кажется экспонатом классического искусства: из прямоугольника позолоченной рамы на зрителя хмуро глядит расплывчатый незнакомец в темном сюртуке и белой сорочке. Алгоритмическое происхождение картины выдает лишь подпись — математическая формула, которая создала портрет (min G max D x [log (D(x))] + z [log (1 — D (G(z)))]). Это генеративно-состязательная сеть (Generative Adversarial Network, GAN) — система, которая натравливает алгоритмы друг на друга: одна нейросеть генерирует образцы изображений, а другая пытается отличить «правильные» от «неправильных». Впервые генеративно-состязательные нейросети были созданы ученым Иэном Гудфеллоу (Ian Goodfellow). Фамилия Белами — своего рода дань первосоздателю: good и fellow примерно переводятся на французский как bel ami — Белами.
Вокруг нейроискусства густо роятся споры. Может ли искусственный интеллект быть художником? Вероятно, алгоритм — это просто инструмент? Кто — или что — имеет авторское право: алгоритм; программист, его написавший; или художник, его применивший?
Мы, увы, не можем спросить, что думает нейросеть. Художники же расходятся во мнении. Пьер Фотрель из коллектива Obvious в интервью отмечал:
Герман Тюменцев, создатель нейроклипа по Библии, уже не считает алгоритм лишь инструментом, но и отдавать авторство машине не склонен:
Скажем, один и тот же код Герман Тюменцев и я использовали по-разному. Я грузанула Есенина; Герман — Библию. Я грузанула, потому что «так вышло», предыстория клипа Германа интереснее. Поначалу он обучал нейросеть «разговаривать» на семплах электронной музыки. Но из-за небольшого количества слов в электронной музыке нейросети не хватило данных, произошел так называемый underfitting — сеть будто пыталась что-то сказать, но напоминало это крики из преисподней. «Вопли из ада» стали поводом задуматься о религиозной тематике и сгенерировать по библейскому тексту иллюстрации.
Именно этот процесс создания — сотрудничество человека и машины, — с точки зрения сторонников алгоритмов, гораздо ценнее конечного продукта. Признание соавторства художника и алгоритма — полумера, помогающая разрешить спор «художник ли? искусство ли?». Потому как сотрудничество человека и машины в поиске новых визуальных форм мало чем отличается от концептуального искусства, где идея, лежащая в основе работы, и процесс ее создания важнее результата.
Но можем ли мы найти у алгоритмов качества, свойственные художникам, поэтам, композиторам? Можем, но — в схожей «полумере» — не совсем можем.
Кто с кого списывал
Машины обвиняют в том, что они неспособны, как человек, создавать что-то принципиально новое, а лишь эксплуатируют усвоенные паттерны. Сторонники искусственного интеллекта защищаются — но ведь и человек обучается схожим образом: мы воспринимаем множество чужих текстов, картин, музыки и так учимся генерировать собственные. Приведу пример.
Помните, в стихах из Бостона были позаимствованные у Лермонтова «лазурные» глаза? Михаилу Юрьевичу не впервой сталкиваться с литературным воровством. «Лазурь» у него также подсмотрел Владимир Соловьев (не тот, о котором вы подумали, а поэт, философ и мистик XIX века). «В пурпуре небесного блистания, с очами, полного лазурного огня», Соловьеву в пустыне под Каиром на третье свидание явилась София Премудрость Божия. Владимир Соловьев признавался, что украл «лазурный огонь» у Лермонтова. Чувство юмора такое; украл и украл, чего бубнить-то. Но хорошо смеется тот, кто смеется последний. Блок потом тоже пошутил. Говорил, что соловьевская София у него стала Прекрасной Дамой — то есть проституткой в трауре. Премудрость Божию разжаловали.
В живописи заимствования тоже не единичны. Анастасия Четверикова в книге «Искусство для пацанчиков» рассказывает, как Босх в свое время восхитил сюрреалистов. Копировал Босха и Сальвадор Дали: в некоторых его набросках появляются характерные монстры. А из триптиха «Сад земных наслаждений» Дали взял пригорок, по которому ползут всякие твари, перевернул его и получился человеческий профиль для картины «Великий мастурбатор». Этот позаимствованный у Босха профиль, в котором Дали узнал себя, потом еще долго кочевал по работам сюрреалиста.
Если «вселенная не будет разбираться, кто с кого списывал», — так ли отличается заимствование паттернов алгоритмом от заимствований художников?
«Искусство — это всё же представление действительности сквозь призму какого-то эмоционального состояния, — говорит Денис Малимонов, автор телеграм-канала о нейроискусстве. — Нейросеть же — просто копирка. У нее нет никаких эмоциональных переживаний, осмысления, фантазии. Нейросеть может изобразить закат — но закат не навевает на нее какую-нибудь грусть. Она может сочинить лица людей, которые не существуют, — но „нафантазирует“ их лишь в жестких рамках данных, на которых ее обучали. Скажем, учили нейросеть на тысячах фотографий людей: они все отличаются по пропорциям, ширине носа, цвету глаз — но по расположению носа, глаз и рта они одинаковые. Алгоритм не выйдет за эти рамки, переставив местами рот и глаза, никогда не „нафантазирует“ три глаза и т. д.»
«Человеческий же разум абсолютно нельзя уложить в рамки, — продолжает Анастасия Четверикова. — Он мыслит неординарно, нетривиально, не „по-машинному“. Машине за этим не угнаться, даже если обучить ее на самых креативных данных вроде работ Уорхола».
Нейронные сети, хоть и воспроизводят опыт как люди, но с оговоркой: они воспроизводят его автоматически, будучи не способны осмыслить созданные артефакты.
Не(йро)определенность
В середине XX века искусство проверяли на прочность. Марсель Дюшан восстал против «сетчаточного» искусства — искусства исключительно для визуального восприятия. Дюшан выставлял в галереях обычные вещи: сушилку для бутылок, расческу и писсуар — превращал их в искусство благодаря контексту, но не форме. Признание работ Дюшана навсегда изменило традиционную систему координат: заспиртованные акулы Дэмьена Херста, неубранная кровать Трэйси Эмин или приклеенный изолентой к стене банан Маурицио Каттелана стали рассматриваться как искусство. Про алгоритмическое искусство говорят схожее и часто сравнивают с Дюшаном: процесс создания и идея ценнее конечного продукта.
Впрочем, нейросети похожи на художника-бунтаря и в другом. До «сетчаточного» восстания Дюшан нарисует самую знаменитую свою работу — «Обнаженную, спускающуюся по лестнице, № 2». Работа была отвергнута кубистами. «Ваши работы слишком расплывчаты, это не искусство, вы убиваете творчество», — звучали претензии. Нейросети сейчас выслушивают те же претензии.
Точно так же, как «Обнаженная» Дюшана словно бы смазана, работам нейросетей свойственна визуальная неопределенность: вы видите что-то знакомое, но не можете его толком идентифицировать. Нейросети Софии Креспо рисуют медузность, которая не соотносится с существующими медузами. В «Шоссе смерти» Паглена угадывается дорога, которая при внимательном рассмотрении шоссе всё же не является. Наконец, в сгенерированной нейросетью иллюстрации к Блоку вы можете усмотреть ночь, улицу и даже фонарь, но присмотритесь поближе — и всё куда-то пропадет. Нейросети скорее создают смазанное ощущение, а не четкий образ.
Дело в том, что алгоритмы должны создавать похожие на реальные различные ситуации, объекты, текстуры и освещения. Однако искусственный интеллект не может просто скопировать части изображений из обучающей выборки и вставить в новые. Современные исследования предполагают, что нейросети решают проблему, создавая объекты, размещая их в кадре, а затем добавляя цвет, текстуру и освещение. При этом расположение объекта и его текстура непрерывны, размазаны по всей плоскости изображения. Нейросети как бы заполняют раскраску, пренебрегая четкими границами, — части объектов и текстуры смешиваются, наслаиваются и перетекают друг в друга.
Визуальная неопределенность, порожденная ли «разумным» алгоритмом или воображением художника, завораживает зрителя, заставляет плутать в смазанных образах.
Запутавшийся мозг
Корни визуальной неопределенности искусства — от наскальных рисунков до генеративных нейросетей — лежат в нейробиологии. Исследователи связывают завораживающий эффект неоднозначных изображений с теорией предсказательного кодирования.
Согласно теории, мозг не пассивно воспринимает информацию от органов чувств, а активно предвосхищает то, что мы должны почувствовать. Скажем, на основе предыдущего опыта делает прогнозы о том, что увидит. Те области мозга, в которых информация согласуется с предсказанием, подавляются; а несоответствия регистрируются как ошибки предсказания и отправляются на дальнейший анализ. Это наращивает эффективность обработки: нейронные ресурсы для предсказуемых стимулов сведены к минимуму, а, напротив, на стимулы-сюрпризы брошено всё внимание. В свете эволюции способность эффективно кодировать и обрабатывать сенсорную информацию очень выгодна для такого энергетически прожорливого органа, как мозг. А значит, было бы разумно, чтобы эволюция вознаграждала нас, когда предсказания подтверждаются, а когда всё идет наперекосяк, эмоционально подчеркивала бы: «Мозг, у нас проблемы! С нашей прогностической моделью что-то не так». Что делает мозг после обнаружения ошибки предсказания? Задерживается на стимуле и проходит несколько циклов его обработки: исследует, делает предсказания, получает новые ошибки, учится. Поэтому, столкнувшись с визуальной неопределенностью картины, мозг может на ней, что называется, залипнуть.
Возьмем «Плачущую женщину» Пикассо. Общий модуль распознавания сцены при взгляде на картину обнаружит что-то, напоминающее лицо, и отправит предсказания о том, где должны быть у этого лица глаза и нос. Наоборот, глаза и нос на работе абстракциониста пошлют предсказание, что перед нами лицо. Если все прогнозы исполняются, то нужды в новых прогнозах нет и процесс стабилизируется. Но с «Плачущей женщиной» всё не так: глаза не там, где надо; нос почему-то двухцветный и с однобокими ноздрями; лицо местами и не лицо вовсе, а платок, которым утирают слезы. «Плачущая женщина» без устали генерирует в мозге сигналы ошибки прогнозирования, мозг тем временем снова и снова возвращается к изображению, чтобы подправить свои предсказания.
Через некоторое время зрительной системе удается найти хоть какое-то скудное объяснение непредсказуемым стимулам картины. В голове случается «ах, вот оно что»-момент. Зрительная система наконец соглашается, что «Плачущая женщина» — тоже лицо, просто вот такое непривычное. Когда удается худо-бедно восстановить предсказуемость, то есть объяснить ошибки предсказания, — мы испытываем положительные эмоции. Например, эксперимент с искаженными изображениями реального мира и последующей краткой демонстрацией неискаженной версии приводил к «ах, вот оно что»-моменту и сопровождался активностью эмоционального миндалевидного тела. Чем выше была активность эмоционального центра, тем лучше испытуемые запоминали способ устранить «ошибку предсказания». В исследовании восприятия музыки было показано, что красивые мелодии, от которых бегут «мурашки по коже», имеют неожиданный, непредсказуемый компонент, то есть тоже несут в себе ошибку предсказания. При этом «эффект мурашек» был связан с изменением активности эмоциональных областей — миндалины и области, участвующей в вознаграждении, — центре удовольствия (вентральном стриатуме).
Визуальная неопределенность просачивается с картин в наш мозг, порождает ошибки предсказания и заставляет нейроны завороженно — и с удовольствием — решать несоответствия.
И мозгу всё равно — видит он раскраски без границ от алгоритма или шедевр признанного мастера. Художники и машины эксплуатируют одну и ту же человеческую нейробиологию. Только с одной огромной разницей: первые делают это намеренно, а последние — нет.
Пикассо XXI века, один из самых высокооплачиваемых современных художников Герхард Рихтер рисует смазанные, словно бы выхваченные из черно-белой хроники портреты и обнаженных девушек, сотканных из сновидений и воспоминаний. Зачем? Герхард Рихтер объясняет: «Мы находим картины интересными только потому, что всегда ищем что-то, что кажется нам знакомым. <…> И обычно мы находим эти сходства и определяем: вот стол, вот одеяло и т. д. Когда мы ничего не находим, мы расстраиваемся, и это заставляет нас быть взволнованными и заинтересованными…»
А вы?
«В тот день облака висели низко в пасмурном небе. Внутри, однако, температура и влажность были под контролем. Йоко лениво сидела на диване, проводя время за бессмысленными играми», — начинается повесть, написанная нейросетью. В 2017-м она прошла в финал литературного конкурса — премии Хоси Синъити.
«Сегодня не стоит плакать из-за того, что вам скучно и хочется жрать. …Не помешает сходить в лес с моржами. Во второй половине дня возможно наступление вечера», — обещает мне нейрогороскоп от алгоритма. У нейросети получается — цитата создателя — «что-то между обычным гороскопом и рассказом Сереги из соседнего подъезда, который долбит амфетамин две недели и не собирается прекращать».
«Мы пошлем из него то для них — восхвалять человека, поистине, он — вражебесное!» — декламируют динамики взломанных камер псевдорелигиозный текст, сгенерированный алгоритмом deus X mchn.
Балабоба от «Яндекса» лихо копирует стиль любого текстового отрезка и дописывает его по своему разумению. Композитор-нейросеть AIVA пишет эмоциональные саундтреки к кино и видеоиграм. Нейросети дорисовывают картину Рембрандта и дописывают «Реквием» Моцарта.
Мы оказались в мире, где алгоритмы могут писать повести, стихи, музыку, картины, гороскопы, новости. При этом граница между человеком и машиной проходит по тесту Тьюринга: сможет ли компьютерная программа ввести человека в заблуждение, заставив поверить, что она — человек. Переводя тест Тьюринга в плоскость творчества: сможет ли алгоритм обдурить людей, убедив их, что картина или музыка написаны человеком, а не машиной. На художественной ярмарке Art Basel зрители не смогли отличить полотна, созданные алгоритмом AICAN, от работ современных художников и даже посчитали их более «человеческими». Нейроповести для получения премии Хоси Синъити не хватило не «человечности», а того, что персонажи были недостаточно проработаны. Нейросеть может написать новость — и люди поверят ей, не отличив фейк от алгоритма.
Однако же «творческий» тест Тьюринга машина проходит лишь по отдельным направлениям, а не по всем сразу, — она умеет хорошо делать что-то одно. И потому «искусственный интеллект — и тем более творческий искусственный интеллект — еще не созданы», считает Денис Малимонов.
Искусственный — и искусный — интеллект не существуют. Машины заимствуют паттерны, как люди, но всё же не совсем как люди: не осознавая, не испытывая эмоций, не осмысляя. Машины создают визуальную неопределенность и генерируют в нашем мозге ошибки предсказания, используют тот же инструмент воздействия на нейробиологию, что и «обычное» искусство. Но — опять же — не как человек, а почти как человек: ненамеренно, не целясь в неопределенность. Алгоритмы могут нарисовать портрет стоимостью в полмиллиона долларов, но факт покупки не сделает их работу произведением искусства, а так, почти искусством. Ведь именно люди — коллектив Obvious — поместили картину от алгоритма на рынок и тем самым поиронизировали над вопросом авторства.
И даже то, что нейросеть может дорисовать картину «как Рембрандт», не делает ее художником, а лишь подтверждает статус инструмента.
Талантливые нейросети, несмотря на некоторую схожесть с талантливыми людьми, зависли в статусе «почти не инструмент, еще не автор».
Считается ли «еще не»? Считается «почти»?
А пока мы решаем, создают ли алгоритмы искусство, или, напротив, обвиняем их в бездарности, заодно вспомним и опопсевшую сцену из фильма «Я, робот»: