Precision/Recall и обобщение по географическим признакам
Как объяснить Precision/Recall и что проверять, если модель должна обобщаться на новые регионы или географические признаки?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Precision отвечает за качество найденного, recall - за полноту найденного. Для geo-generalization нужен split по регионам/времени и проверка, что модель не запомнила локальные id.
Полный разбор
Precision показывает, какая доля выбранных объектов действительно релевантна. Recall показывает, какую долю всех релевантных объектов мы нашли. В рекомендациях и поиске баланс зависит от этапа: candidate generation чаще оптимизирует recall, финальная выдача - top-K quality.
Если в признаках есть география, нужно проверить, не запомнила ли модель конкретные region_id, store_id или локальные паттерны. Полезны holdout по регионам, time split, cold-region slices, target encoding без leakage и fallback для новых гео-сегментов.