Назад к подготовке

ВопросСложнаяscalabilityML System Design на техническом собеседовании · Constructor

Миллион кандидатов перед реранкером

Запрос вроде "книга" возвращает миллион релевантных товаров. Как не скорить весь миллион тяжелой моделью?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Ввести pre-ranking/top-K cap перед реранкером: lexical/semantic score, popularity, diversity/dedup, clustering или sampling.

Полный разбор

Pipeline должен иметь дешевый этап отбора до ML-реранкера: retrieval score, business/popularity score, availability, category constraints и dedup. Затем можно обеспечить diversity по категориям или embedding clusters и скорить только допустимый K по latency budget. K выбирается не на глаз: он связан с latency, стоимостью модели и качеством top-N выдачи.

Теория

Многоступенчатый ranking pipeline: retrieval -> pre-rank -> rank -> post-processing/business rules.

Типичные ошибки

Скорить все.
Брать random sample без quality guarantees.
Забыть coverage/diversity.

Как отвечать на собеседовании

Свяжи K с p95 latency и качеством выдачи.