К реальным собесам
Реальный собесWildberries2026-02-11

Wildberries RecSys Technical: money recall, DSSM и content features

Техническое собеседование в RecSys-направление: offline-метрики с учетом денег, типовые проблемы рекомендательных систем, классы моделей, визуальная similarity-задача, DSSM с content embeddings, Transformer и Python internals.

Таймлайн собеседования

Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.

00:05:46-00:07:47Вопрос

End-to-end цикл ML-задачи до production

00:10:30-00:19:50Вопрос

Разогрев: Precision/Recall и обобщение по географическим признакам

00:20:00-00:26:35Вопрос

Money recall: как учесть деньги в offline-метрике рекомендаций

00:26:39-00:29:50Вопрос

Стандартные проблемы RecSys: novelty, diversity и popularity bias

00:30:24-00:33:35Вопрос

Regularization и dropout: train vs inference

00:33:59-00:35:10Вопрос

Зачем нужны residual connections

00:35:30-00:39:11Вопрос

Как обучается градиентный бустинг

00:39:41-00:44:47Вопрос

Классы моделей в рекомендательных системах

00:47:31-00:55:06MLSD

Визуальная similarity-модель для объявлений авто

00:55:22-00:56:28Вопрос

Follow-up про negative sampling и in-batch negatives

00:56:30-00:58:46Вопрос

Почему item2vec по сессиям ближе к collaborative модели

00:58:52-01:08:14Вопрос

Как добавить content embeddings в DSSM/two-tower

01:09:07-01:13:54Вопрос

Архитектура Transformer и positional encodings

01:14:18-01:17:41Вопрос

Python dict, list и NumPy array

01:17:41-01:18:53Вопрос

Финал: live coding не будет, следующий этап ML design

Выводы и как готовиться

  • Для marketplace RecSys обычных Precision/Recall часто мало: бизнес-ценность можно добавлять через weighted metrics вроде money recall.
  • Content embeddings полезны в DSSM/two-tower, но их нужно нормализовать и обучать через fusion/projection, а не просто слепо приклеивать к collaborative embedding.
  • Собес проверяет ширину: RecSys, metric learning, базовый DL, Transformer и Python internals, но без live coding.