Что такое cold start для пользователя и item
Как объяснить cold start в RecSys и какие практичные решения предложить для нового пользователя и нового item?
Короткий ответ
Cold start - ситуация, когда мало истории по пользователю или объекту. Лечится контентными признаками, контекстом, популярным, onboarding-сигналами и controlled exploration.
Полный разбор
Cold start для пользователя означает, что у нас нет или мало его истории: кликов, заказов, оценок, долгосрочных интересов. Тогда используем контекст: город, ресторан/магазин, устройство, время, текущая сессия, onboarding-вопросы, популярное в сегменте.
Cold start для item означает, что новый товар еще не получил кликов/покупок, поэтому collaborative signals слабые. Здесь помогают контентные признаки: категория, текст, картинка, цена, бренд, состав, ресторан, маржа, наличие. Также можно дать новому item небольшую controlled exploration квоту, чтобы собрать первые сигналы.
В проде нужен fallback cascade: персональные рекомендации, популярное в сегменте, популярное глобально, curated/business rules. Метрики: доля cold-start traffic, coverage новых items, CTR/conversion по fallback-уровням, негативный feedback.
Теория
Cold start - одна из причин, почему production RecSys редко строится только на collaborative filtering.
Типичные ошибки
- Обсуждать только новых пользователей и забыть про новые items.
- Предлагать только популярное без сегментации и exploration.
- Не измерять coverage новых товаров.
Как отвечать на собеседовании
- Раздели user cold start и item cold start.
- Назови content features и fallback cascade.