Яндекс раскрыл подробности работы своей рекомендательной технологии.
Технология Диско работает в сервисах с крупными каталогами объектов — Яндекс.Музыка, Я.Радио, Я.Маркет и Я.Видео. Задача Диско — свести количество предлагаемых вариантов до минимума, оставив только наиболее подходящие конкретному человеку.
Чтобы гарантированно угодить пользователям, Диско собирает данные о человеке из нескольких источников:
- История поисковых запросов.
- Технология Крипта (пол, примерный возраст, род занятий).
- Сведения от сервиса, для которого готовятся рекомендации.
При составлении рекомендаций технология опирается опять же на три подхода:
- Информация об объектах и связях между ними. Например, если человек приобрел плиту и холодильник одного и того же бренда, а сейчас ищет микроволновку, с большой вероятностью ему стоит предложить товар этого же производителя.
- Информация о связях между людьми. Крипта дает информацию о поле, возрасте и роде деятельности каждого человека. Так что при составлении рекомендаций можно опираться на предпочтения пользователей с такими же характеристиками. Очень удобно, если человек пользуется сервисом впервые и еще не оставил никакой информации о себе.
- Данные о взаимодействиях пользователей с объектами (SVD — singular value decomposition). Учитывая уже известные взаимодействия человека с объектами (просмотры ролика, отметки «Нравится» и проч.), система предсказывает его реакцию на другие объекты.
Три этих подхода лежат в основе сотен рекомендательных моделей, используемых в Диско.
Обработка рекомендаций осуществляется методом машинного обучения Маткрикснет, составляющим сочетание рекомендаций, идеально подходящих конкретному пользователю.
Результат работы Матрикснета — финальный список рекомендаций, который пользователь видит в сервисе.