Назад к подготовке

ВопросСложнаяrecommender-systemsML System Design из фидбека после собеседования · T-Bank T-Bank

Обучение pointwise-ранкера без утечек и перекоса в популярные товары

Вы обучаете boosting-ранкер для рекомендаций по кликам и связкам образов. Как собрать датасет, сделать train/validation/test split и не переобучиться на популярные товары и старые показы?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Соберите примеры из реально показанных user-item или item-item пар, делайте temporal train/validation/test split, тюньте только по validation и проверяйте, что модель не тащит наверх только популярные товары из старых логов показов.

Полный разбор

Теория

Данные для ранжирования смещены тем, что система уже показывала раньше; validation и sampling должны имитировать будущие serving-решения.

Типичные ошибки

Тюнить гиперпараметры и репортить финальное качество на одном validation fold.
Использовать только случайные негативы и игнорировать товары, которые показали, но по ним не кликнули.
Учить модель на популярности товара и называть это персонализацией.
Делить данные случайно по времени и случайно использовать будущие признаки каталога или будущую популярность товара.

Как отвечать на собеседовании

Явно скажите: train, validation и test split по времени.
Скажите простыми словами: в логах есть только показанные товары, а популярные товары получают больше показов и кликов, поэтому модель может переучиться на старую выдачу.