Training signals и objectives для RecSys
Какие сигналы и loss-функции использовать для обучения recommendation/ranking модели?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Для retrieval подходят contrastive/pairwise losses с hard negatives; для ranker - pointwise conversion/click labels или pairwise/listwise ranking losses.
Полный разбор
Сначала фиксируется действие, которое модель оптимизирует: click, add-to-cart, purchase, long dwell, contact или composite utility. Для retrieval часто используют contrastive loss: positive пары item-query/user-item и hard negatives. Для ranker возможны pointwise classification/regression, pairwise losses или listwise objectives.
Нужно учитывать bias старого ранжирования. Негативы лучше брать из показанных, но не выбранных объектов, а не из всех непоказанных item. Для бизнес-целей labels можно взвешивать revenue, margin или downstream conversion, но guardrails должны защищать от кликового мусора и потери diversity.