К тренажеру
ВопросHardmlsd-pricingРеальный собес

Датасет для response-модели доставки

Как построить датасет для модели, которая оценивает реакцию пользователя на стоимость доставки или минимальную сумму заказа?

Короткий ответ

Строка датасета - показ quote/action в конкретном контексте; признаки берутся на момент показа, label - заказ/GMV/margin/negative в attribution window.

Полный разбор

Единица обучения - момент, когда пользователю был показан конкретный threshold или delivery fee. В признаки входят user/order context, ресторан/зона, корзина, время, кухня, курьерская нагрузка, availability и само предложенное действие.

Labels зависят от objective: conversion, revenue, margin, cancellation, complaint, time-to-order. Важно хранить action propensity или хотя бы источник pricing policy, потому что без вариативности нельзя честно выучить эластичность.

Serving-time features должны соответствовать training features. Нельзя подмешивать будущие события: финальный состав заказа, фактическую задержку или реакции, которые появились после quote.

Теория

Response dataset должен описывать counterfactual задачу: что случится при данном действии в данном контексте.

Типичные ошибки

  • Не включить показанную цену как feature/action.
  • Брать признаки после совершения заказа.
  • Не логировать source policy и propensity.

Как отвечать на собеседовании

  • Определи row и label явно.
  • Упомяни leakage и policy bias.