К тренажеру
ВопросMediummlsd-recsysРеальный собес

MVP без истории взаимодействий

Какой baseline запустить для новой видео-ленты, если по ней еще нет кликов и покупок?

Короткий ответ

Использовать popularity/GMV/content-based baseline с фильтрами доступности и свежести, обязательно добавить controlled exploration.

Полный разбор

Для первого запуска можно ранжировать видео по агрегированному потенциалу привязанных товаров: GMV, маржа, популярность, availability, маркетинговый приоритет, свежесть и категория. Если продуктовая цель - discovery нового non-food ассортимента, полезно задать квоты или boosts на нужные категории.

Exploration нельзя оставлять случайностью без логики: часть позиций можно отдавать epsilon-greedy, rotation по категориям или свежему контенту. Это снижает popularity bias и дает данные для обучения следующего ranker.

Теория

Baseline в новой рекомендательной поверхности нужен не только для качества, но и для сбора данных. Без exploration система быстро зацементирует первые популярные видео.

Типичные ошибки

  • Показывать всем один и тот же top.
  • Не учитывать availability товаров.
  • Не разделять editorial rules и ML-score.

Как отвечать на собеседовании

  • Назови baseline за минуту.
  • Сразу объясни, как этот baseline даст датасет для следующего шага.