К тренажеру
ВопросHardmlsd-generalРеальный собес

Как прогнозировать LTV для новых когорт без истории

Есть LTV/retention прогноз по когортам. Для старых когорт есть 7/30/180 дней истории, а для новых есть только install или trial. Как строить прогноз уже сегодня?

Короткий ответ

Для новых когорт нужно использовать признаки, доступные в момент старта: канал, страна, кампания, платформа, trial/install, цена, промо и похожие исторические когорты. Прогноз лучше отдавать с uncertainty.

Полный разбор

Начать стоит с разделения когорт по зрелости. Для зрелых когорт можно использовать накопленные retention/revenue curves и rolling statistics. Для новых когорт таких признаков нет, поэтому модель должна опираться на prior: канал привлечения, страну, платформу, campaign id, продуктовый тариф, цену, промо, источник трафика, MMP-сигналы и поведение в первые часы или первый день.

Практичный baseline: найти похожие исторические когорты и взять их кривую как prior, затем корректировать ее по ранним сигналам новой когорты. Можно обучить отдельную модель для early LTV, где target — будущий LTV, а features — только признаки, доступные на момент прогноза.

Важно честно говорить про неопределенность. Для новых когорт dispersion выше, поэтому полезны confidence intervals, prediction intervals или хотя бы флаг низкой надежности. Это помогает бизнесу не переинтерпретировать ранний прогноз.

Теория

Это cold-start задача в прогнозировании. Смысл не в том, чтобы магически восстановить отсутствующую историю, а в том, чтобы правильно использовать prior и не допустить leakage из будущих дней.

Типичные ошибки

  • Использовать 7/30-day признаки для когорты, которая существует один день.
  • Не разделить модели или feature sets для новых и зрелых когорт.
  • Дать точечный прогноз без обсуждения неопределенности.

Как отвечать на собеседовании

  • Сначала явно зафиксируй момент прогноза и какие признаки уже доступны.
  • Скажи про похожие исторические когорты, early signals и uncertainty.