Реальный собесWildberries2026-02-11
Wildberries RecSys Technical: money recall, DSSM и content features
Техническое собеседование в RecSys-направление: offline-метрики с учетом денег, типовые проблемы рекомендательных систем, классы моделей, визуальная similarity-задача, DSSM с content embeddings, Transformer и Python internals.
Таймлайн собеседования
Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.
00:05:46-00:07:47Вопрос
ВопросEnd-to-end цикл ML-задачи до production
00:10:30-00:19:50Вопрос
ВопросРазогрев: Precision/Recall и обобщение по географическим признакам
00:20:00-00:26:35Вопрос
ВопросMoney recall: как учесть деньги в offline-метрике рекомендаций
00:26:39-00:29:50Вопрос
ВопросСтандартные проблемы RecSys: novelty, diversity и popularity bias
00:30:24-00:33:35Вопрос
ВопросRegularization и dropout: train vs inference
00:33:59-00:35:10Вопрос
ВопросЗачем нужны residual connections
00:35:30-00:39:11Вопрос
ВопросКак обучается градиентный бустинг
00:39:41-00:44:47Вопрос
ВопросКлассы моделей в рекомендательных системах
00:47:31-00:55:06MLSD
MLSDВизуальная similarity-модель для объявлений авто
00:55:22-00:56:28Вопрос
ВопросFollow-up про negative sampling и in-batch negatives
00:56:30-00:58:46Вопрос
ВопросПочему item2vec по сессиям ближе к collaborative модели
00:58:52-01:08:14Вопрос
ВопросКак добавить content embeddings в DSSM/two-tower
01:09:07-01:13:54Вопрос
ВопросАрхитектура Transformer и positional encodings
01:14:18-01:17:41Вопрос
ВопросPython dict, list и NumPy array
01:17:41-01:18:53Вопрос
ВопросФинал: live coding не будет, следующий этап ML design
Выводы и как готовиться
- Для marketplace RecSys обычных Precision/Recall часто мало: бизнес-ценность можно добавлять через weighted metrics вроде money recall.
- Content embeddings полезны в DSSM/two-tower, но их нужно нормализовать и обучать через fusion/projection, а не просто слепо приклеивать к collaborative embedding.
- Собес проверяет ширину: RecSys, metric learning, базовый DL, Transformer и Python internals, но без live coding.