Назад к подготовке

LightFM, content signals и bandits

Как LightFM помогает cold start и когда в рекомендациях появляются bandits?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

LightFM складывает embeddings user/item features и collaborative сигнал, поэтому может скорить новых пользователей или items по контентным признакам. Bandits нужны для exploration/exploitation.

Полный разбор

LightFM - гибридная matrix factorization модель. Пользователь и item представлены суммой embeddings их признаков: id, категории, теги, контентные признаки. Score обычно dot product. Если новый item имеет признаки, модель может дать ему embedding даже без истории взаимодействий.

Это полезно для cold start и sparse data, но качество зависит от информативности features. Если контентные признаки слабые, модель не магически решит проблему.

Bandits появляются, когда система должна не только использовать текущую лучшую выдачу, но и исследовать неопределенные варианты. Например, новым играм или объявлениям нужны показы, чтобы собрать сигнал. Bandit управляет exploration/exploitation и может учитывать reward, uncertainty, user context и business constraints.

Теория

Hybrid RecSys закрывает часть cold start, а bandits помогают собирать будущий сигнал без полного рандома.

Типичные ошибки

  • Считать LightFM полноценной deep-моделью sequence behavior.
  • Не давать exploration новым объектам.
  • Измерять bandit только по краткосрочному CTR без guardrails.