Датасет для response-модели доставки
Как построить датасет для модели, которая оценивает реакцию пользователя на стоимость доставки или минимальную сумму заказа?
Короткий ответ
Строка датасета - показ quote/action в конкретном контексте; признаки берутся на момент показа, label - заказ/GMV/margin/negative в attribution window.
Полный разбор
Единица обучения - момент, когда пользователю был показан конкретный threshold или delivery fee. В признаки входят user/order context, ресторан/зона, корзина, время, кухня, курьерская нагрузка, availability и само предложенное действие.
Labels зависят от objective: conversion, revenue, margin, cancellation, complaint, time-to-order. Важно хранить action propensity или хотя бы источник pricing policy, потому что без вариативности нельзя честно выучить эластичность.
Serving-time features должны соответствовать training features. Нельзя подмешивать будущие события: финальный состав заказа, фактическую задержку или реакции, которые появились после quote.
Теория
Response dataset должен описывать counterfactual задачу: что случится при данном действии в данном контексте.
Типичные ошибки
- Не включить показанную цену как feature/action.
- Брать признаки после совершения заказа.
- Не логировать source policy и propensity.
Как отвечать на собеседовании
- Определи row и label явно.
- Упомяни leakage и policy bias.