К тренажеру
ВопросEasymlsd-recsysРеальный собес

Что такое cold start для пользователя и item

Как объяснить cold start в RecSys и какие практичные решения предложить для нового пользователя и нового item?

Короткий ответ

Cold start - ситуация, когда мало истории по пользователю или объекту. Лечится контентными признаками, контекстом, популярным, onboarding-сигналами и controlled exploration.

Полный разбор

Cold start для пользователя означает, что у нас нет или мало его истории: кликов, заказов, оценок, долгосрочных интересов. Тогда используем контекст: город, ресторан/магазин, устройство, время, текущая сессия, onboarding-вопросы, популярное в сегменте.

Cold start для item означает, что новый товар еще не получил кликов/покупок, поэтому collaborative signals слабые. Здесь помогают контентные признаки: категория, текст, картинка, цена, бренд, состав, ресторан, маржа, наличие. Также можно дать новому item небольшую controlled exploration квоту, чтобы собрать первые сигналы.

В проде нужен fallback cascade: персональные рекомендации, популярное в сегменте, популярное глобально, curated/business rules. Метрики: доля cold-start traffic, coverage новых items, CTR/conversion по fallback-уровням, негативный feedback.

Теория

Cold start - одна из причин, почему production RecSys редко строится только на collaborative filtering.

Типичные ошибки

  • Обсуждать только новых пользователей и забыть про новые items.
  • Предлагать только популярное без сегментации и exploration.
  • Не измерять coverage новых товаров.

Как отвечать на собеседовании

  • Раздели user cold start и item cold start.
  • Назови content features и fallback cascade.