Оптимизация цены по grid
Есть response-модель для разных вариантов доставки. Как выбрать итоговую цену или минимальную сумму заказа?
Короткий ответ
Перебрать допустимый grid действий, посчитать expected objective для каждого и выбрать лучший вариант, если он проходит guardrails и confidence thresholds.
Полный разбор
Для каждого кандидата из допустимого grid: fee или threshold - считаем predicted conversion, expected basket, margin, courier cost, cancellation risk и negative feedback. Objective может быть expected profit или contribution margin, но с ограничениями по UX и конверсии.
Нужны guardrails: не показывать слишком высокую цену, не ухудшать SLA, не менять quote слишком часто, не выбирать вариант при низкой confidence. Также нужен fallback на baseline policy для новых зон, пустых фичей и out-of-distribution контекстов.
Важно отделить model score от decision policy: модель оценивает response, policy применяет бизнес-правила.
Теория
Optimization layer превращает prediction в действие, но именно там должны жить constraints и fallback behavior.
Типичные ошибки
- Выбирать argmax модели без business constraints.
- Не ограничивать grid допустимых действий.
- Не иметь fallback для low confidence.
Как отвечать на собеседовании
- Скажи "score every action in grid".
- Добавь guardrails и fallback.