Что будет, когда текстов в интернете станет слишком много?

Представьте, что в конце концов мы все умрем не из-за климатических изменений, падения метеорита или ядерной бомбы, а из-за текстов? Из-за самых обычных текстов, но написанных в таких количествах, что просто невозможно себе представить — контент захлестнет нас как цунами, и интернет уже никогда не будет прежним.

Наше отношение к тексту сегодня меняется в корне. Искусственный интеллект, например, Chat GPT, сам успешно создает тексты. Тем не менее, люди по-прежнему пишут алгоритмы для подобных программ, а сам ИИ обучается на прозе, созданной человеком, а не на собственных опусах.

Все может измениться в одночасье. Не так давно для Chat GPT вышел новый API (Application Programming Interface), который позволит интегрировать технологию чата в веб-приложения, например, в социальные сети или интернет-магазины.

Сегодня легко представить себе ситуацию, когда одна машина побуждает другую создавать бесконечное количество синтетического текста. Именно это произошло в июне прошлого года, когда некий пользователь внедрил GPT-J (языковая модель искусственного интеллекта с открытым исходным кодом, разработанная EleutherAI) в анонимную доску объявлений 4chan — за 24 часа она опубликовала 15 000 сообщений (в основом это был спам).

Языковая модель создает бесконечный поток контента, который не просто всем мешает, но и неизбежно попадает обратно к ИИ, который таким образом обучается на собственных синтетических текстах.

Представьте, что огромная масса людей будет заниматься этим регулярно, чтобы заработать денег, достичь своих политических целей или просто из озорства. Тогда подобные тексты заполнят собой все: они будет появляться в результатах поиска, социальных сетях и проникнут даже в статьи «Википедии», дав пищу для ума новым системам машинного обучения.

Крупные издания уже вовсю экспериментируют. На сайте технических новостей CNET опубликованы десятки статей, написанных с помощью искусственного интеллекта в надежде привлечь трафик. Впоследствии в большей части этих текстов были найдены ошибки. Однако совсем скоро может наступить текстовый постапокалипсис, в результате которого машинописный язык станет нормой, а написанная человеком проза — исключением.

Текст, написанный человеком, в интернете скоро станет настоящим раритетом, и его придется беречь. В то же время ИИ будет опираться на массивы текстовых данных, созданных другими языковыми моделями, поскольку их работу уже не остановить. «Не верьте всему, что читаете» может превратиться в «не верьте ничему, что читаете».

В настоящий момент написание текстов становится все более автоматизированным процессом. Контент-фермы, создающие низкокачественные тексты для рекламы, используют ИИ, но их работа по-прежнему зависит от легионов недоучившихся креативщиков, которые выражают смысл правильными словам, слова складывают в связные предложения, а предложения — в абзацы.

Как только появится возможность автоматизировать этот труд, люди окажутся не нужны в этой сфере.

В конце девяностых Уильям Сафир одним из первых заявил об опасности увеличения объема контента в интернете. Он отмечал, что контент не обязательно должен быть содержательным, чтобы выполнять свою основную функцию — просто существовать. Увеличение объема контента — это всегда увеличение доходов от рекламы, не говоря уже о более темной стороне этого явления — информационной войне, которую мы наблюдаем в глобальной геополитической сфере.

Текст — это тоже контент, но особого типа. Если угодно, это мета-контент. На изнанке каждой веб-страницы находится текст, он же код, задающий странице определенный вид. Браузеры и сервера обмениваются текстом. Изображения, видео, аудио — текстом описывается все. Интернет — это больше чем текст, но на фундаментальном уровне он буквально состоит из него.

Все это время мы не только потребляли контент, но и сами создавали его. Сегодня Chat GPT и подобные ему программы могут писать код так же легко, как и любые другие тексты.

Мы уже сталкиваемся с беспрецедентным количеством спама, но скоро оно может стать бесконечным. Например, Финн Брунтон в книге «Спам: Теневая история интернета» рассказывает об уже существующих методах распространения спама в интернете, таких как электронные письма, составленные как пастиш известных литературных произведений, собранных из крупных онлайн-библиотек, чтобы лучше проникать через фильтры папки «спам». Также существуют целые сети блогов, заполненные контентом для привлечения трафика, и «алгоритмическая журналистика» с автоматизированными отчетами о спортивных результатах, бирже или сейсмических толчках. Кроме того, Брунтон подробно описывает происхождение ботнетов, сыгравших печально известную роль во время выборов 2016 года в США и брекзита в Великобритании.

Раньше мы часто размышляли об интернете как о месте, где человеческая креативность должна расцвести буйным цветом. На деле же уже с середины 1990-х годов стало очевидно, что корпоративные интересы компаний в сети стали преобладать над творчеством и самовыражением пользователей.

Интернет не просто менялся в сторону коммерциализации, он сам стал двигателем для добычи капитала.

Спам, хорошо знакомый нам во всем своем разнообразии, доказывает, что сеть отчасти написала себя сама. Современные же коммерческие и технологические новшества будто специально созданы для текстового апокалипсиса.

ИИ уже активно входит в нашу сетевую жизнь. Во-первых, его интегрируют в программное обеспечение для обработки текстов: в ближайшее время Chat GPT будет протестирован в Microsoft Office. Возможно, скоро ИИ будет помогать врачу выписывать рецепты для пациентов, возможно, он уже это делает. К слову, резкое увеличение количество спама в конце прошлого года связывают с популярностью Chat GPT.

Так или иначе, очевидно одно: в будущем текст будет стремительно отдаляться от практики человеческого самовыражения. Совсем скоро мы не сможем разобрать, кто на самом деле стоит за жанровой художественной литературой и за заключением врача.

На написание этого текста ушло более пятнадцати часов. Некоторые его предложения были удалены, переписаны или переставлены с одного места на другое еще до того, как статья попала к редактору. Волнует ли меня, что ChatGPT мог бы сделать эту работу лучше меня? Нет. Но меня беспокоит, что моя работа может оказаться бессмысленной, а написанные мной слова станут топливом для грядущего текстопокалипсиса.

Текстопокалипсис. Что будет, когда нейросетевые тексты станут нормой, а написанные нами — исключением

Как только появится возможность автоматизировать этот труд, люди окажутся не нужны в этой сфере.

Интернет не просто менялся в сторону коммерциализации, он сам стал двигателем для добычи капитала.