User-фичи, item-фичи и cart-level scoring
При обучении MLP или бустинга для корзины какие признаки подавать: user, item, item-to-cart или category features?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Строка ranker обычно описывает candidate в контексте корзины и пользователя: item features, cart aggregate, user history, cross-features и business constraints.
Полный разбор
Для cart ranker единица скоринга - candidate item в конкретном cart/user context. Item features описывают сам candidate: category, price, brand, availability, margin, embeddings, popularity. Cart features агрегируют текущую корзину: категории, сумма, последние добавленные товары, price range, embeddings и уже покрытые needs.
User features добавляют персонализацию: история категорий, брендов, средний чек, price sensitivity, регион, размеры, recent views. Самые сильные признаки часто cross-level: candidate-category compatibility with cart, candidate price vs cart price, user affinity to candidate category и item already bought recently.
Модель может быть MLP, GBDT или two-stage ranker, но train/serving parity важнее типа модели. Все признаки должны быть доступны на момент показа и иметь latency/freshness budget.
Теория
В ранжировании ценность часто лежит в cross-features между request context, candidate и пользователем, а не в отдельных списках user/item признаков.