Схема события в Kafka для ads CTR
Какая минимальная схема события нужна в Kafka для подсчета CTR кампаний?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Нужны event_id, event_time, campaign/ad/account id, event_type, user/request context и schema version; key обычно привязывают к campaign/account.
Полный разбор
Минимальная схема должна позволять дедуплицировать, партиционировать и агрегировать событие: event_id, event_time/ingest_time, campaign_id, advertiser/account_id, event_type = impression/click, ad_id и schema_version.
Дополнительный контекст зависит от продукта: placement, country, device, experiment_id. Важно явно разделять event_time и ingest_time, потому что late events влияют на окна. Schema evolution лучше делать через registry или совместимые версии, иначе stream job будет ломаться на изменениях producer.