Группы признаков для recommender
Какие группы признаков стоит назвать в RecSys ML System Design: user, item, context и инженерные фичи?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Называются user history, item attributes, context, interaction features, freshness, popularity, embeddings и serving-time features с контролем leakage.
Полный разбор
Типовой набор: признаки пользователя и истории, признаки item, регион/устройство/время, цена и availability, свежесть объявления, популярность, seller quality, текстовые/визуальные embeddings и interaction features между пользователем и item.
Важно разделять offline-computable признаки и признаки request-time. Serving должен получать только то, что известно до показа. Для freshness нужны TTL/streaming updates, для embeddings - versioning, для user history - fallback при новом пользователе. Фичи должны логироваться вместе с показами, иначе offline training не повторит online контур.