Facebook выложил в открытый доступ две технологии, способные определять идентичных и почти идентичные фотографии и видео. Компания использует их для борьбы с контентом, нарушающим правила соцсети, например, с детской порнографией и пропагандой терроризма.
Технологии называются PDQ (фото) и TMK+PDQF (видео), соцсеть использует их для вычисления опасного контента. PDQ и TMK+PDQF позволяют хранить файлы в виде коротких цифровых хешей, с помощью которых алгоритм даже без доступа к оригиналу сможет определить, являются ли файлы аналогичными. Например, если в соцсети появляется видео с террористической пропагандой, Facebook хеширует файл и удаляет его, а затем рыссылает хеш сайтам-партнерам, чтобы они также могли удалить запрещенное видео со своих площадок.
Найти технологии можно на GitHub – ознакомиться с ними может любой желающий.
Напомним, на днях Facebook запатентовал технологию, с помощью которой Messenger будет собирать информацию о местоположении пользователей и содержании их разговоров, а затем отображать подходящую рекламу.
Источник: Блог Facebook