К тренажеру
ВопросHardscalabilityРеальный собес

Миллион кандидатов перед реранкером

Запрос вроде "книга" возвращает миллион релевантных товаров. Как не скорить весь миллион тяжелой моделью?

Короткий ответ

Ввести pre-ranking/top-K cap перед реранкером: lexical/semantic score, popularity, diversity/dedup, clustering или sampling.

Полный разбор

Pipeline должен иметь дешевый этап отбора до ML-реранкера: retrieval score, business/popularity score, availability, category constraints и dedup. Затем можно обеспечить diversity по категориям или embedding clusters и скорить только допустимый K по latency budget.

K выбирается не на глаз: он связан с latency, стоимостью модели и качеством top-N выдачи.

Теория

Многоступенчатый ranking pipeline: retrieval -> pre-rank -> rank -> post-processing/business rules.

Типичные ошибки

  • Скорить все.
  • Брать random sample без quality guarantees.
  • Забыть coverage/diversity.

Как отвечать на собеседовании

  • Свяжи K с p95 latency и качеством выдачи.