Назад к подготовке

ВопросСредняяltv-modelingML System Design на техническом собеседовании · EasyBrain

Multi-output прогноз LTV-кривой

Как использовать свежие неполные когорты, если R365 для них еще неизвестен?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Предсказывать не только R365, а вектор горизонтов: R7, R14, R30, R60, R180, R365. Тогда свежие когорты дают labels на короткие горизонты, а старые - на длинные.

Полный разбор

Вместо одной головы R365 можно учить модель прогнозировать LTV-кривую или набор накопленных горизонтов. Для старых когорт известны все горизонты, для свежих - только короткие. Это позволяет учить ранние головы на актуальных данных и связывать их с поздними горизонтом через shared representation. Есть несколько вариантов: multi-output regression, survival/hazard modeling, curve fitting, прогноз инкрементов по периодам или модель отношения R365/R30. Важно не дать модели увидеть будущую информацию: признаки должны быть доступны на момент принятия решения. Валидация делается по времени и по бизнес-use case. Если модель нужна для user acquisition, важна способность рано ранжировать кампании и пользователей, а не только точный абсолютный R365.

Теория

LTV лучше мыслить как кривую во времени, а не как одну запоздавшую точку.

Типичные ошибки

Обучать R365 только на старых когортах и не использовать свежие короткие targets.
Смешивать накопленные и инкрементальные targets без ясного контракта.
Не проверять calibration на последних когортах.