К тренажеру
ВопросMediumfeature-engineeringРеальный собес

Фичи для marketplace search ranker

Какие признаки подать в модель ранжирования товаров в поиске маркетплейса?

Короткий ответ

User, item, query/context и cross user-item/query-item признаки.

Полный разбор

Item: категория, цена, наличие, рейтинг, отзывы, продажи, возвраты, текстовые BM25/embedding scores. User: регион, активность, средний чек, категории интереса. Context: query, сезон, время, устройство. Cross: история взаимодействий user-item/category, query-item relevance и совместимость с текущей сессией.

Каждый признак нужно проверить на online availability и latency. Часть тяжелых embedding features лучше precompute offline и использовать как compact similarity scores.

Теория

LTR выигрывает от сочетания поведенческих, контентных, контекстных и cross-features.

Типичные ошибки

  • Перечислить только user/item без query.
  • Забыть online availability.
  • Добавить тяжелые фичи без latency оценки.

Как отвечать на собеседовании

  • Группируй фичи по источникам.
  • Сразу говори, какие считаются offline, а какие online.