Назад к подготовке
ВопросСредняяmodel-selectionТехническое собеседование · BHFT

Почему CatBoost, а не линейная модель

В time-series табличной задаче кандидат выбирает CatBoost. Как объяснить выбор и какой baseline нужен?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

CatBoost ловит нелинейности и interactions, но его нужно сравнить с naive, linear/ridge и простыми rules на temporal validation.

Полный разбор

Сильный ответ не продает CatBoost как магию. Сначала baseline: константа, last value, линейная модель на лагах и простые rules. Потом GBDT, если есть нелинейные зависимости, разные масштабы признаков и interactions.

Улучшение должно быть на temporal validation, без leakage. Для HFT/time-series также важно проверить стабильность по периодам, sensitivity к drift и связь offline metric с trading proxy или PnL after costs.