Яндекс.Новости – агрегатор, автоматически объединяющий новости из разных источников в большие сюжеты. Но не так давно в Сети появились предположения о том, что состав Я.Новостей может быть вручную «отцензурирован».
В компании не оставили это предположение без ответа. И рассказали, как работает алгоритм сервиса.
Любой инфоповод, освещаемый СМИ, состоит из отдельных новостей. Яндекс.Новости умеют объединять эти отдельные новости в сюжеты. Затем алгоритм автоматически оценивает вес сюжетов, основываясь на составе источников, плотности потока информации, времени публикации сообщений, весе других сюжетов на главную страницу Яндекса. ТОП постоянно обновляется и изменяется.
С начала этого года изменился состав источников в Я.Новостях. В связи с принятием закона о новостных агрегаторах Яндекс.Новости могут показывать на главной странице, в сюжетах и в тематических рубриках только материалы СМИ, зарегистрированных в Роскомнадзоре. Из-за этого количество источников сократилось, что в свою очередь влияет на вес сюжетов.
Иногда Я.Новости все-таки могут отставать от картины дня. Одна из гипотетических причин – алгоритм кластеризации, который склеивает новости в сюжеты, а сюжеты — в темы. У него не всегда получается объединять родственные сюжеты в одну тему. Например, когда есть много новостей про ДТП с разными людьми в разных городах, он может посчитать их разными событиями и не объединить в общий сюжет.
В любом случае, как отмечают в блоге компании, Яндекс.Новости – агрегатор, и он не может искусственно поднимать или умалчивать темы, не обращая внимания на сообщения в крупных СМИ.
Источник: Блог Яндекса