Нужно ли DS понимать бизнес-логику продукта
Насколько важно дата-сайентисту понимать бизнес-логику того, как пользователи попали в приложение? Достаточно ли просто событий из базы?
Короткий ответ
Да, нужно. Без бизнес-логики легко неверно интерпретировать события, пропустить важные признаки, получить leakage или оптимизировать не ту метрику.
Полный разбор
События в базе — это только наблюдения. Чтобы строить хорошую модель, DS должен понимать, откуда пришел пользователь, что ему обещали, какой был канал, какое промо, какие ограничения продукта и какая бизнес-метрика оптимизируется.
Бизнес-логика помогает правильно собрать признаки, выбрать target, понять bias выборки, найти leakage и объяснить результат стейкхолдерам. Например, одинаковые действия пользователей из разных каналов могут иметь разный intent и разную конверсию.
При этом не нужно знать все детали бизнеса как product owner. Нужно понимать те части, которые влияют на данные, target, интерпретацию и production decision.
Теория
Это вопрос про product sense в DS. Модель оптимизирует формальный target, но target и данные появляются из бизнес-процесса. Без контекста можно построить технически корректную, но бесполезную модель.
Типичные ошибки
- Сказать, что достаточно сырых events.
- Не связать бизнес-логику с target leakage и метриками.
- Не привести пример влияния acquisition/channel на поведение.
Как отвечать на собеседовании
- Отвечай через "данные не существуют вне бизнес-процесса".
- Назови 2-3 конкретных примера: канал, промо, регион, device, funnel.