Почему item2vec по сессиям является collaborative сигналом
Если item2vec обучен на последовательностях кликов в сессиях, почему это ближе к collaborative filtering, а не к content-based модели?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Потому что близость товаров берется из совместного поведения пользователей в сессиях, а не из текстов, картинок или атрибутов товара.
Полный разбор
item2vec переносит идею word2vec на последовательности товаров: товары, которые часто встречаются рядом в сессиях или похожих user journeys, получают близкие embeddings. Это behavioral/collaborative signal: модель видит co-occurrence во взаимодействиях, а не содержание товара.
Два товара могут быть близки, даже если у них разные тексты, потому что пользователи часто рассматривают их как заменители. Content-based модель, наоборот, строит близость из описания, категории, изображения, бренда и других item attributes.