LightFM, content signals и bandits
Как LightFM помогает cold start и когда в рекомендациях появляются bandits?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
LightFM складывает embeddings user/item features и collaborative сигнал, поэтому может скорить новых пользователей или items по контентным признакам. Bandits нужны для exploration/exploitation.
Полный разбор
LightFM - гибридная matrix factorization модель. Пользователь и item представлены суммой embeddings их признаков: id, категории, теги, контентные признаки. Score обычно dot product. Если новый item имеет признаки, модель может дать ему embedding даже без истории взаимодействий.
Это полезно для cold start и sparse data, но качество зависит от информативности features. Если контентные признаки слабые, модель не магически решит проблему.
Bandits появляются, когда система должна не только использовать текущую лучшую выдачу, но и исследовать неопределенные варианты. Например, новым играм или объявлениям нужны показы, чтобы собрать сигнал. Bandit управляет exploration/exploitation и может учитывать reward, uncertainty, user context и business constraints.
Теория
Hybrid RecSys закрывает часть cold start, а bandits помогают собирать будущий сигнал без полного рандома.
Типичные ошибки
- Считать LightFM полноценной deep-моделью sequence behavior.
- Не давать exploration новым объектам.
- Измерять bandit только по краткосрочному CTR без guardrails.