ВКонтакте запустил специальный фильтр для борьбы с враждебными высказываниями. Нейросеть поможет администраторам пабликов бороться с угрозами в комментариях, а пользователям – реже сталкиваться с травлей в комментариях сообществ.
Фильтр можно включить и отключить в настройках сообщества в любое время, при этом по умолчанию он отключен. Функция уже появилась у владельцев 50% пабликов, а скоро станет доступна всем.
Пока алгоритмы умеют определять только прямые угрозы – пожелания смерти, обещания причинить вред здоровью и угрозы расправы. Разработчики ВКонтакте обещают, что в будущем он может научиться распознавать и другие признаки нетерпимости (например, травлю по национальной или религиозной принадлежности).
Руководителям сообществ доступны отфильтрованные публикации с возможностью их восстановить, однако тестовый запуск показал, что отсеянные комментарии возвращают лишь в 1% случаев.
Тестирование фильтра было запущено в ноябре 2020 года. За этот период функцией уже воспользовались руководители свыше 10% всех сообществ ВКонтакте – это 13 млн публичных страниц, групп и мероприятий.
Нейросеть содержит специальный механизм внимания, позволяющий принимать решения на основе важности слов и их комбинаций. Сейчас нейросеть правильно определяет угрозы в 80% случаев, и команда продолжает работать над ее улучшением.
ВКонтакте предлагает и другие функции для защиты от травли. Любой пользователь может отправить жалобу службе модерации, если публикация содержит оскорбление, угрозы или враждебные высказывания, – кнопка «Пожаловаться» есть у записей, комментариев, фото и видео, историй, клипов.
Источник: пресс-релиз ВКонтакте