ВопросHardscalabilityРеальный собес
Миллион кандидатов перед реранкером
Запрос вроде "книга" возвращает миллион релевантных товаров. Как не скорить весь миллион тяжелой моделью?
Короткий ответ
Ввести pre-ranking/top-K cap перед реранкером: lexical/semantic score, popularity, diversity/dedup, clustering или sampling.
Полный разбор
Pipeline должен иметь дешевый этап отбора до ML-реранкера: retrieval score, business/popularity score, availability, category constraints и dedup. Затем можно обеспечить diversity по категориям или embedding clusters и скорить только допустимый K по latency budget.
K выбирается не на глаз: он связан с latency, стоимостью модели и качеством top-N выдачи.
Теория
Многоступенчатый ranking pipeline: retrieval -> pre-rank -> rank -> post-processing/business rules.
Типичные ошибки
- Скорить все.
- Брать random sample без quality guarantees.
- Забыть coverage/diversity.
Как отвечать на собеседовании
- Свяжи K с p95 latency и качеством выдачи.