Когда рекомендации естественно становятся графом
Многие продукты — это не просто user-item матрица, а граф: пользователи подписаны на авторов, товары лежат в категориях, пины сохранены на доски, песни входят в плейлисты, вакансии связаны с навыками. Графовые методы используют эту структуру напрямую.
Загрузка интерактивного виджета...
Классические графовые идеи
- Random walks: похожие айтемы часто достижимы короткими путями в user-item graph.
- Personalized PageRank: ранжируем узлы относительно конкретного пользователя или seed item.
- Meta-paths: в heterogeneous graph задаем осмысленные пути user -> item -> category -> item.
- Graph embeddings: учим векторы узлов через соседство и совместные появления.
GNN для RecSys
Graph neural networks агрегируют информацию от соседей: embedding айтема зависит не только от его фичей, но и от пользователей/досок/категорий вокруг него. PinSage показал, что эту идею можно масштабировать до миллиардов объектов через sampling и MapReduce inference.
- PinSage: random-walk GCN для Pinterest graph.
- LightGCN: упрощает GCN для collaborative filtering, убирая лишние nonlinearities.
- Heterogeneous GNN: разные типы узлов и ребер для marketplace/social/content продуктов.
Цена графов
Графовые методы сильны, когда связи действительно несут сигнал. Но они сложнее в обновлении, serving и отладке. На собесе важно проговорить не только качество, но и стоимость пересчета embeddings, freshness и explainability.