К тренажеру
ВопросEasymlsd-recsysРеальный собес

Быстрый baseline ранжирования лучше random

Есть релевантные кандидаты поиска, но финальный порядок случайный. Какое простое решение можно запустить быстро?

Короткий ответ

Начать с popularity/business baseline: продажи, клики, add-to-cart, рейтинг, availability и свежесть.

Полный разбор

MVP не обязан требовать обучения. Можно посчитать item popularity score по свежему окну, добавить availability, категорию, регион и business boosts, затем использовать это как deterministic reranking. Такой baseline быстро лучше random, дает контрольную точку для A/B и помогает оценить, сколько value приносит сложная модель.

Важно не превращать baseline в вечный костыль: сразу логировать impressions и downstream labels, чтобы перейти к learning-to-rank.

Теория

Strong baseline нужен до сложного LTR, чтобы отделить ценность модели от ценности уже известных бизнес-сигналов.

Типичные ошибки

  • Сразу строить сложный ranker.
  • Не учитывать freshness/availability.
  • Оптимизировать только clicks.

Как отвечать на собеседовании

  • Явно скажи: сначала baseline, затем ML.
  • Назови срок запуска и риски.