Почему CatBoost, а не линейная модель
В time-series табличной задаче кандидат выбирает CatBoost. Как объяснить выбор и какой baseline нужен?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
CatBoost ловит нелинейности и interactions, но его нужно сравнить с naive, linear/ridge и простыми rules на temporal validation.
Полный разбор
Сильный ответ не продает CatBoost как магию. Сначала baseline: константа, last value, линейная модель на лагах и простые rules. Потом GBDT, если есть нелинейные зависимости, разные масштабы признаков и interactions.
Улучшение должно быть на temporal validation, без leakage. Для HFT/time-series также важно проверить стабильность по периодам, sensitivity к drift и связь offline metric с trading proxy или PnL after costs.