«ВКонтакте» испытает нейросеть для борьбы с оскорблениями в комментариях

«ВКонтакте» объявила об испытании инструментов для борьбы с оскорблениями в комментариях. Как сообщается в пресс-релизе соцсети, с новыми функциями пользователи будут реже сталкиваться с нетерпимостью по религиозному, национальному или иному признаку. Эксперимент пройдет сегодня, в День народного единства, и продлится 24 часа. Фильтр высказываний не будет обязательным — администраторы могут включить его в настройках сообществ.

Порядок наведут инструменты на основе нейросети: один будет предлагать комментаторам отказаться от обидных реплик, второй —  автоматически удалять комментарии, в которых содержатся угрозы, пожелания смерти или обещания причинить вред здоровью. Автоматически удаленные комментарии будут показаны в настройках сообщества: администратор сможет вернуть их или отправить автора в черный список.

Первый из алгоритмов был протестирован еще в прошлом году, но теперь он еще лучше определяет оскорбления и угрозы, в том числе на почве религии, национальности, пола, возраста и других характеристик. По данным «ВКонтакте», в прошлом году функция помогла сократить количество оскорблений в комментариях на 36%. 4 ноября предупреждение смогут увидеть все пользователи, а спустя время начнется долгосрочный тест функции, рассчитанный только на часть аудитории.

Чтобы активировать фильтр, нужно зайти в настройки сообщества, перейти в раздел «Комментарии» и выбрать «Фильтр враждебных высказываний».

Эксперимент пригодится для обучения и доработки нейросети, ответственной за распознавание оскорблений.