Какие события и масштабы уточнять для CTR
Какие события, сущности и масштабы нужно уточнить перед проектированием ads CTR dashboard?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Минимум нужны impressions, clicks, campaign/account dimensions, суточный поток, cardinality кампаний и требования по задержке обновления.
Полный разбор
CTR считается как clicks / impressions, поэтому сырой поток должен надежно отличать показы и клики. Для sizing нужно уточнить events per day/second, количество рекламодателей, кампаний, активных кампаний одновременно и распределение нагрузки.
Также важны требования к задержке: dashboard за секунды, минуты или часы. От этого зависит, достаточно ли batch aggregation, нужен ли streaming job, какие окна материализовать заранее и какой storage выдержит частые range queries по campaign_id и времени.