Быстрый baseline ранжирования лучше random
Есть релевантные кандидаты поиска, но финальный порядок случайный. Какое простое решение можно запустить быстро?
Короткий ответ
Начать с popularity/business baseline: продажи, клики, add-to-cart, рейтинг, availability и свежесть.
Полный разбор
MVP не обязан требовать обучения. Можно посчитать item popularity score по свежему окну, добавить availability, категорию, регион и business boosts, затем использовать это как deterministic reranking. Такой baseline быстро лучше random, дает контрольную точку для A/B и помогает оценить, сколько value приносит сложная модель.
Важно не превращать baseline в вечный костыль: сразу логировать impressions и downstream labels, чтобы перейти к learning-to-rank.
Теория
Strong baseline нужен до сложного LTR, чтобы отделить ценность модели от ценности уже известных бизнес-сигналов.
Типичные ошибки
- Сразу строить сложный ranker.
- Не учитывать freshness/availability.
- Оптимизировать только clicks.
Как отвечать на собеседовании
- Явно скажи: сначала baseline, затем ML.
- Назови срок запуска и риски.