Сбой взгляда: почему замена фотографа искусственным интеллектом — плохая идея
Изображения, сгенерированные ИИ, могут раздражать и пугать, но мы с ними более-менее свыклись. А что, если доверить нейросетям... роль фотографа? Чем машинное зрение принципиально отличается от человеческого? И что оно обнажает в самом устройстве визуального медиума? Размышляет историк фотографии Евгения Маркова.
В октябре 2020 года во время футбольного матча шотландской команды Inverness Caledonian Thistle произошел эпизод, мгновенно ставший интернет-легендой. Из-за пандемийных ограничений клуб заменил живого оператора автоматизированной камерой Pixellot, которая должна была с помощью искусственного интеллекта отслеживать мяч и автоматически транслировать игру зрителям. Камера честно выполняла свою задачу — вот только вместо мяча она начала упорно следить за гладко выбритой головой судьи.
Алгоритм машинного зрения, вероятно, был натренирован на распознавание объектов круглой формы, движущихся с определенной скоростью. Голова судьи подходила под эти параметры не хуже самого мяча. Результат: во время матча камера настойчиво отказывалась фиксировать саму игру, сосредотачивая внимание на «ложном» объекте и повергая зрителей в недоумение. Но для теоретика фотографии в этом эпизоде нет сбоя. Напротив, это прозрачно показывает, как видит машина.

«Ошибка» как симптом
Для аналоговой фотографии ошибка была исключением: проявленный негатив мог быть засвечен, пленка испорчена, но дефект фиксировался как технический сбой по отношению к реальности. Цифровой же алгоритм ошибается не в отображении, но в распознавании. Его ошибка говорит нам: визуальное больше не связано с сущностным, оно не ищет подлинного объекта, а лишь проверяет соответствие некой статистической модели. Голова судьи становится мячом не потому, что машина «ошиблась» в человеческом смысле, а потому, что для нее в момент съемки это и был «мяч». Видение сместилось в сторону вероятности, а не факта.
Этот сдвиг разрушает классическое различие между «истинным» и «ложным» изображением. Машина не лжет — она видит по-своему. Она заменяет глаз логикой функции. И это делает цифровую фотографию принципиально новой формой изображения — требующей совпадения не с реальностью, а с «моделью». Ошибка становится не исключением, а раскрытием новой парадигмы: мы имеем дело с визуальностью, в которой человек уже не основной адресат.
Ошибка, как мы уже увидели, не нарушает целостность машинного зрения, а, наоборот, проявляет его внутреннюю логику. Но если в аналоговой эпохе фотография была продолжением человеческого взгляда и его материальной фиксацией, «схватыванием момента», то теперь цифровая камера становится чем-то иным: не глазом, а фильтром.

Когда «решающий момент» становится лишним
Из этого вытекает следствие — смерть «решающего момента». Классическая фотография XX века, начиная с Анри Картье-Брессона, строилась вокруг идеи, что существует некий уникальный, кратчайший миг, в котором «все складывается»: композиция, свет, движение, смысл. Момент, который надо поймать.
Цифровая технология обнуляет эту концепцию. Современные камеры ведут непрерывную съемку (burst mode), делают десятки кадров в секунду, создают 360-градусные сцены, записывают «живые фото» и видео одновременно. Пользователь получает массив данных, из которого можно впоследствии выбрать «лучшее». Но момент уже не имеет прежнего значения. Он стал сырьем для последующей селекции, временной точкой в облаке возможностей.
Если фотография больше не создается взглядом и не фиксирует момент, то перед нами не окно, сквозь которое мы смотрим на мир, а интерфейс, который настраивает этот мир под нас. Это радикальный сдвиг в самой онтологии изображения.
В прежние эпохи живопись и фотография предполагали позицию зрителя, который стоит перед изображением и находится вне него. Картина, фотография, экран были границей, за которой находился объективный мир. Но цифровая среда размывает все. То, что кажется нам изображением, в действительности результат сетевого, алгоритмического, медиального взаимодействия.
Фотография в соцсетях проходит множество невидимых фильтров: сортируется, усиливается, «улучшается». Картинка, которая «показывается» нам, — это не результат фиксации реальности, а эффект цифровой инфраструктуры, которая уже все решила за нас: что стоит показать, в каком порядке, с какой экспозицией, с каким лицом. Мы больше не видим — мы взаимодействуем с логикой показа. Современная фотография теряет связь с действительностью не потому, что она «лжет», а потому, что она больше не утверждает ничего, кроме самой возможности демонстрации.

Изображение под подозрением
Из этого проистекает и последняя, возможно, самая тревожная черта новой визуальности — невозможность свидетельства. Раньше фотография имела вес доказательства: она была следом и документом. Ее можно было представить в суде, архиве, газете. Она была, говоря языком Фуко, визуальным актом власти и правды.
Цифровая эпоха эту функцию разрушает. Изображение больше не несет следа реального. Deepfake-видео способны имитировать мимику, голос, поведение с такой точностью, что даже экспертные алгоритмы порой не могут отличить их от «настоящих». Визуальное доказательство перестает быть достоверным, и вместе с ним уходит целая культурная структура: доверие к глазу, вера в изображение, ощущение, что «если мы это видим, значит это было».
Теперь изображение — это не подтверждение, а сомнение. Оно не документирует событие, а ставит под вопрос само его существование. Мы не можем больше опереться на взгляд или фотографический снимок. Мы не уверены, было ли это, даже если оно прямо перед нами. И это в каком-то смысле финальная точка в трансформации фотографии: из следа произошедшего она превращается в симптом кризиса реальности как таковой.

И если изображение стало интерфейсом, а свидетельство больше не свидетельствует, то возникает вопрос: кто теперь является субъектом визуального действия? Традиционный гуманистический ответ — «человек» — больше не работает. В современном визуальном ландшафте камера все чаще оказывается не инструментом, а актором. Она больше не продолжение глаза, а замена взгляда.
Посмотрите на инфраструктуру городского наблюдения: автономные камеры в мегаполисах сами выбирают, что фиксировать, когда передавать данные, какие движения считать подозрительными. Мы не знаем, что именно они видят, потому что это больше не взгляд в человеческом смысле — это слежение как вычисление. Человек здесь не режиссер и не свидетель, а скорее объект, попадающий в поле статистики.
Фотография перестает быть документом прошлого и превращается в проекцию будущего. Мы больше не имеем дело с тем, что было, — цифровое изображение все чаще работает с тем, что может быть воспринято как реальное.
Типичный пример — коммерческая фотография. Большинство изображений товаров в онлайн-магазинах — это не фотографии в привычном смысле, а 3D-рендеры, имитирующие фотографическую эстетику. Мы не видим то, что сфотографировали, — мы видим то, что сгенерировали как достоверное. Это сдвигает и саму логику ожидания. Цифровая фотография программирует нашу веру в вещь, формирует наши желания до того, как объект вступит в контакт с нами. Она работает как интерфейс между реальностью и воображаемым, между желанием и вещью. Она не запечатлевает — она обещает. Не фиксирует, а формирует ожидание.

Видеть или скроллить?
Если камера становится актором, а изображение — проекцией возможного, следующий вопрос: кто и как управляет этим визуальным пространством? В эпоху цифровых платформ видимость — зона жесткой регуляции.
Например, Instagram (принадлежит корпорации Meta, признанной экстремистской в РФ) автоматически скрывает изображения с «избыточным телесным содержанием» — даже если речь идет о признанном искусстве. Это не цензура с явным запретом, а программное фильтрование, эстетика алгоритма, который выстраивает пространство видимого по своим правилам, не всегда совпадающим с культурными или художественными нормами.
Так видимость перестает быть выражением выбора или вкуса. Она становится результатом фильтрации, где исчезают и потенциально провокационные или сложные визуальные сообщения. В этом смысле «видеть» — значит принимать условия, заданные системой, и подчиняться их логике.
Если традиционный зритель — тот, кто внимательно смотрит, задерживает взгляд, вступает в диалог с изображением, то цифровой зритель превратился в пользователя интерфейса. Мы больше не свидетели, а пролистыватели и прокрутчики бесконечного потока визуального контента.
Этот новый режим видения ломает традиционные представления о зрителе как об активном субъекте. Он скорее пассивный агент, вовлеченный в бесконечное путешествие по интерфейсу, где каждое изображение — лишь пункт в цепочке переходов.