ВопросMediumfeature-engineeringРеальный собес
Фичи для marketplace search ranker
Какие признаки подать в модель ранжирования товаров в поиске маркетплейса?
Короткий ответ
User, item, query/context и cross user-item/query-item признаки.
Полный разбор
Item: категория, цена, наличие, рейтинг, отзывы, продажи, возвраты, текстовые BM25/embedding scores. User: регион, активность, средний чек, категории интереса. Context: query, сезон, время, устройство. Cross: история взаимодействий user-item/category, query-item relevance и совместимость с текущей сессией.
Каждый признак нужно проверить на online availability и latency. Часть тяжелых embedding features лучше precompute offline и использовать как compact similarity scores.
Теория
LTR выигрывает от сочетания поведенческих, контентных, контекстных и cross-features.
Типичные ошибки
- Перечислить только user/item без query.
- Забыть online availability.
- Добавить тяжелые фичи без latency оценки.
Как отвечать на собеседовании
- Группируй фичи по источникам.
- Сразу говори, какие считаются offline, а какие online.