Студенты, соискатели и работодатели все чаще экономят усилия и используют нейросети при написании текстов, отчетов и резюме. Специалисты из ИТМО разработали систему, позволяющую определить автора текста. По их словам, инструмент с 94-процентной вероятностью выявляет фрагменты, написанные или исправленные ИИ.

Генеративные модели обучаются на огромных массивах текстов, созданных людьми. Тем не менее, они все еще «пишут» особым образом. Например, ИИ предпочитает использовать фразы-клише, часто повторяет одни и те же мысли, ссылается на несуществующие источники.
Один из способов быстрого распознавания «машинного» текста — использование ИИ-алгоритмов. Сейчас большинство из них плохо адаптированы под работу с русскоязычными текстами. Так, они умело различают лишь две категории текстов на русском: либо полностью написанные человеком, либо целиком сгенерированные ИИ.
Исследователи из ИТМО захотели создать систему для работы с текстами, изначально написанными человеком и улучшенными благодаря технологиям искусственного интеллекта.
Ученые разработали детектор, который анализирует содержание и стиль текста, после чего определяет, кем он написан: человеком, ИИ или ИИ с перефразированием. В основе инструмента — две независимые большие языковые модели. Обе сравнивают насколько текст соответствует шаблонам: если модели сильно «спорят» друг с другом, то материал, скорее всего, написан нейросетью.
Команда протестировал инструмент, попросив программу проанализировать 5,5 тысяч русскоязычных текстом. Результаты эксперимента показали, что в 94% случаев алгоритм верно выявляет ИИ-материалы.
Исследователи полагают, что сервис будет полезен для корректной маркировки ИИ-контента в медиа, проверки работ в вузах и корпоративных документов в компаниях.
«Сейчас мы разрабатываем удобный интерфейс для нашего сервиса и готовим пакетную обработку, которая позволит анализировать несколько текстов одновременно и ускорить процесс», — пишут ученые.
Читайте больше актуальных новостей тут.