Training signals и objectives для RecSys

Какие сигналы и loss-функции использовать для обучения recommendation/ranking модели?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Для retrieval подходят contrastive/pairwise losses с hard negatives; для ranker - pointwise conversion/click labels или pairwise/listwise ranking losses.

Полный разбор

Сначала фиксируется действие, которое модель оптимизирует: click, add-to-cart, purchase, long dwell, contact или composite utility. Для retrieval часто используют contrastive loss: positive пары item-query/user-item и hard negatives. Для ranker возможны pointwise classification/regression, pairwise losses или listwise objectives. Нужно учитывать bias старого ранжирования. Негативы лучше брать из показанных, но не выбранных объектов, а не из всех непоказанных item. Для бизнес-целей labels можно взвешивать revenue, margin или downstream conversion, но guardrails должны защищать от кликового мусора и потери diversity.