Назад к подготовке

Какие нейросетевые архитектуры используют в рекомендациях

Какие нейросетевые подходы можно использовать в RecSys и где они стоят в пайплайне?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Для retrieval часто используют two-tower и sequential models вроде SASRec/next-item prediction. Для реранжирования - MLP/DeepFM/DCN/transformer-ranker поверх user/item/context features. Обычно пайплайн делят на генерацию кандидатов и реранжирование.

Полный разбор

В рекомендациях нейросети чаще всего появляются в двух местах. Первое - генерация кандидатов: two-tower модель отдельно кодирует пользователя и item, затем быстрый ANN-поиск находит близкие item embeddings. Для истории действий подходят sequential models: GRU4Rec, SASRec, BERT4Rec и похожие next-item подходы.

Второе - реранжирование: когда кандидатов уже сотни, можно использовать более тяжелую модель с user features, item features, cross features, контекстом сессии, ценой, категорией и бизнес-ограничениями. Это может быть MLP, DeepFM/DCN, transformer over sequence/context или ансамбль с бустингом.

Главный trade-off: retrieval должен быть быстрым и иметь высокий recall, реранкер может быть точнее, но работает на ограниченном наборе кандидатов. Для production еще нужны freshness embeddings, fallback, мониторинг coverage и online A/B.

Теория

Современный RecSys почти всегда каскадный: быстрый retrieval плюс более дорогое реранжирование.

Типичные ошибки

  • Пытаться ранжировать весь каталог одной тяжелой моделью online.
  • Не отделять задачу next-item prediction от финального бизнес-ранжирования.
  • Забывать про ANN/index refresh для retrieval-моделей.