Назад к подготовке

Группы признаков для recommender

Какие группы признаков стоит назвать в RecSys ML System Design: user, item, context и инженерные фичи?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Называются user history, item attributes, context, interaction features, freshness, popularity, embeddings и serving-time features с контролем leakage.

Полный разбор

Типовой набор: признаки пользователя и истории, признаки item, регион/устройство/время, цена и availability, свежесть объявления, популярность, seller quality, текстовые/визуальные embeddings и interaction features между пользователем и item.

Важно разделять offline-computable признаки и признаки request-time. Serving должен получать только то, что известно до показа. Для freshness нужны TTL/streaming updates, для embeddings - versioning, для user history - fallback при новом пользователе. Фичи должны логироваться вместе с показами, иначе offline training не повторит online контур.