5 спорных мнений Бориса Орехова об искусственном интеллекте

В последние годы любые инфоповоды, связанные с ИИ, гремят, как кажется, громче остальных. Для тех, кто не пользуется технологией по профессии, она представляется чуть ли не магической. Своими мнениями о чудесах и глупостях ИИ делится лингвист, кандидат филологических наук и один из пионеров генеративных гуманитарных исследований Борис Орехов.

Достижения ИИ — это не прорыв последних месяцев, а годы работы

Понятно, что к большинству из нас шумиха про то, чему научились большие языковые модели, пришла вместе с новостями в конце 2022 года. ChatGPT в самом деле был шагом вперед, но не с нулевой отметки. Специалисты давно следили за прогрессом в этой области, нейросети уже несколько лет умели выдавать осмысленный текст и обобщать информацию. Еще в ноябре 2020, изнывая от ковидного карантина, я расспрашивал предшественника ChatGPT, получая такие ответы:

Вопрос: какое блюдо сегодня Настя приготовила на ужин?

Ответ: салат из помидоров и огурцов, запеченых в духовке

Вопрос: доколе?

Ответ: до тех пор, пока не будут удовлетворены все требования и не будут приняты необходимые законы, которые обеспечат безопасность и стабильность на всем пространстве СНГ.

Вопрос: снятся ли сны нейросетям?

Ответ: да. Снятся. Снятся, как и любые другие сны, но с одним отличием — во сне нейросети работают в режиме реального времени.

Видно, что это все еще бессмысленная машинка, но разговаривает она уже вполне бодро. Она не интересуется тем, кто такая Настя (я и сам не знаю), и бодро рапортует о меню на вечер, тут компьютер и человек поменялись местами: вопросы не всегда осмысленные, а вот ответы выглядят вполне убедительно. Гораздо лучше, чем текст от нейросетей из 2018 года.

Тогда в журнале «Диалог. Карнавал. Хронотоп» я опубликовал то, что выдала нейросеть, обученная на собрании сочинений М. М. Бахтина: «Здесь в этой форме сохранялось в монологическом понимании истории древнего диалога». Учитывая сложность для восприятия многих текстов гуманитарной и философской ориентации, может быть, не сразу и различишь, что тут что-то не так.

А вот что и как писала нейросеть в 2016 году в книге на лингвистическую тему: «Эти свойства различаются ни не может быть в насточевшей ствее времени друг с другом. Этот аргумент и образования падежа, не связанного с показателями фазы и предлога в [Бенвались] просто по падежным граммемам, что речь идет об аспекте». Это сбивчиво, не всегда с правильным сопряжением слов, но здесь сквозь магический кристалл уже различаются будущие очертания продукта от OpenAI.

Это не идеальные тексты, но всматриваясь в прошлое, мы понимаем, как из буквенного мусора шаг за шагом вырастало то, что произвело взрывной эффект в 2022; а без того предварительного этапа не было бы и нынешних успехов. Прогресс шел постепенно, и наблюдая его в реальном времени, не так сильно поражаешься тому, как внезапно ИИ заполнил все информационное пространство вокруг. Чужие дети растут быстро, а ИИ для кого-то вполне свой.

Робот может написать симфонию и картину, но это ничего не значит

Наверное, многие видели этот мем со стоп-кадром из фильма «Я робот» (2004) с Уиллом Смитом, герой которого сомневается в творческих возможностях искусственного интеллекта, и называет его имитацией жизни. Формальным критерием жизни в наши дни это быть перестало. Современные нейросети сносно пишут музыку, если надо, то и симфоническую, но жизнь в них от этого не зародилась. Однако все не так просто.

Вопрос о том, могут ли компьютеры создать что-то творческое, обострился после того, как люди проиграли им в шахматы. Интеллектуальная игра казалась той самой высотой, которую искусственный разум покорить не сможет. А он смог. Нужен был какой-то новый рубеж обороны, какое-то новое подтверждение тому, что человек не безнадежен и не проиграл в эволюционной гонке своему собственному творению. Таким рубежом стали произведения искусства, но теперь, когда кажется, что и этот рубеж пал, он не пал.

Дело в том, что в отличие от игры — в шахматы, в го или в любую другую, — где есть четкие критерии победы и поражения, в искусстве их нет.

Если даже то, что породила нейросеть, и выглядит как поэма, там будут рифмы и метафоры, то у человека есть возможность не принимать поражения, и он этой возможностью активно пользуется. Можно сказать: да, это выглядит как поэма (симфония, картина), но она плохая, неинтересная. И это даже скорее всего будет правдой. Так что при новых условиях компьютеру не победить.

Известно, что современный читатель теряет интерес к текстам, про которые он знает, что они написаны машиной. Компьютер победил в шахматах, но шахматы никуда не делись, люди продолжают играть между собой, и продолжат читать стихи, написанные людьми, а компьютер в свой круг не пустят.

То, насколько похоже на человека что-то получается у ИИ, не критерий его успешности

Мы живем в эпоху косплея. Если нейросеть успешно имитирует человека, то получает одобрение — в СМИ, от широкой публики, от спикеров-экспертов. Сгенерированы стихи, которые похожи на те, которые пишет человек, — хорошо, успешная модель. Стихи непохожи — ошибочный путь, разработчиков постигла неудача.

Но сама идея копирования человека имеет фундаментальный изъян: почему, собственно, человеческий способ решить задачу считается оптимальным?

Шахматисты хорошо знают, что есть ходы, естественные для человека, и «компьютерные», такие, которых живой игрок за доской никогда бы не нашел. Эти последние всегда лучше, сильнее, увереннее выигрывают партию. А в соцсетях мы теперь видим бесконечные попытки определить, где текст, сочиненный человеком, а где порожденный нейросетью. И если угадать не получается, значит, косплей удался.

Но ведь у машинной продукции есть свои особенности, их нужно подмечать и обращать себе на благо, а не избавляться от них, заставляя компьютеры быть похожими на людей. Пора себе признаться, что тест Тьюринга устарел: успешный ИИ — это не тот, который делает что-то неотличимо от человека, а тот, который эффективно выполняет поставленную перед ним задачу, пусть и в своей манере.

Самое интересное в творчестве ИИ — это ошибки

Нейросети обучаются на предоставленных им данных. Если покажем им «данные» со стихами, то они научатся писать стихи, усреднив все стихотворения, и выдав в итоге что-то обобщенное. Но ведь средние стихи — это плохие стихи. Хорошие стихи — особенные, не похожие ни на что, удивляющие.

А хорошая нейросеть выдает что-то серое и банальное, потому что училась на стихах без индивидуальности, таких, которые пишут все, а потом еще и поделила все это на единый знаменатель:

Луна в воде чертит узор хрустальный, 

И звёзды тонут в глади без следа. 

Тишь прерывает всплеск рыбы нежданный — 

Ночь шепчет тайны, будто нет возврата…

Но бывает, что и нейросети выдают что-то сногсшибательное, сбивающее с толку и рвущее шаблон. Но только для этого им нужно стать плохой нейросетью, начать сбоить, глючить. Например, вот это неуклюжее и спотыкающееся четверостишие, написанное устаревшей нейросетью в 2020 году:

пиво не пьют и видали

ты чьи то дни я расплачусь

встретился бой и стучали

россия моя беларусь

Несмотря на кажущуюся простоту и угловатость, это стихотворение с секретом. Первая строка читается как трехстопный дактиль («Ѝскры пото̀ками сѐя…», «Кро̀вля на цѐркви обмо̀кла…»), вслед за ней мы и вторую строку читаем в этом размере: «ты̀, чьи-то днѝ я распла̀чусь». Метр убаюкивает: «расплакаться» кажется вполне привычным словом для эмоциональной поэтической речи.

Все как будто предстает понятным и прозрачным, но последняя строка всё переворачивает с ног на голову. Оказывается, ударение падает на последний слог: «белару̀сь», а значит, там рифма: «расплачу̀сь». Читателю нужно снова вернуться ко второй строке и «пересобрать» её для себя уже как написанную ямбом: «ты чьѝ то днѝ я расплачу̀сь».

Как голливудские сценаристы заставляют нас другими глазами пересматривать фильмы с неожиданным поворотом в финале, так и здесь нейросеть создает произведение, располагающее к перечитыванию: теперь «то» кажется не частью неопределенного «чьи-то», а обретает самостоятельное указательное значение: «ты, чьи (э)то дни». Обращение к тому, кого можно назвать хозяином дней (времени) или их главным героем.

«Для меня это были твои дни, ассоциирующиеся только с тобой», – говорит нейросеть, и добавляет: я расплачиваюсь за это, за те «твои» дни, расплачиваюсь, конечно, не деньгами, а эмоциями, тяжелыми воспоминаниями. Все это результат ошибки, плохого обобщения, «массовые» стихи так не пишут. Но именно благодаря этой ошибке здесь все так замечательно.

То, насколько человек будет под впечатлением от достижений ИИ, находится в обратной зависимости от его компетенции в сфере применения ИИ

Все видели, как ловко большие языковые модели сочиняют тексты. Но люди, которые текстами занимаются профессионально (филологи, лингвисты), воодушевлены этой способностью гораздо меньше тех, кто в мир текстов не погружен. Не приведи всевышний нейросетям дадут задание породить что-то из узкоспециальной области, скажем, философских споров между древнегреческими школами! Историки философии будут разочарованы сбивчивой логикой, галлюцинациями, некорректностью формулировок.

Нейросети пишут код, но то, что получается, поражает только дилетантов, а профессиональные разработчики совсем не будут в восторге. Много мелких раздражающих неточностей — все это мешает восхититься и признать превосходство искусственного разума над естественным.

Программисты будут поражены тем, как нейросети пишут тексты, а филологи тем, как они пишут код. Но не наоборот. Технооптимистами становятся те, кто готов прощать ИИ мелкие (или не очень) огрехи или просто не замечает их в силу неопытности. Профессиональный взгляд неизменно утверждает, что ИИ очень далеко до совершенства. Но пользу в хозяйстве он, конечно, уже приносит. Будем надеяться, что пользы этой будет больше, чем вреда.