Как объяснить роль A/B-теста при проверке изменений в рекомендательной системе?
Банк вопросов из реальных собеседований
Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.
Все вопросы
673Полный банк вопросов из реальных собеседований.
ML-теория
119Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.
Python
67Устройство языка, структуры данных, тестирование и инженерная база.
SQL
12Запросы, агрегации, оконные функции и объяснение результата.
ML System Design
259Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.
Метрики и A/B
101Качество моделей, продуктовые метрики, эксперименты и валидация.
Продуктовые кейсы
72Как разложить задачу продукта, ограничения, риски и первый бейзлайн.
Математика и статистика
18Вероятность, статистика, оценки, распределения и аккуратные допущения.
Behavioral Interview
25Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.
Behavioral Interview
25 вопросов из реальных интервью
Как объяснить сложность алгоритма и формальное определение O-большого через константы и размер входа?
Explain what a convolutional neural network is to senior engineers who do not specialize in ML. Keep it accurate but accessible.
Из каких двух основных этапов обычно состоит рекомендательная система? Объясните candidate generation и ranking коротко, но не поверхностно.
Насколько важно дата-сайентисту понимать бизнес-логику того, как пользователи попали в приложение? Достаточно ли просто событий из базы?
OLX хочет единый recommendation API для motors, jobs, real estate и других touchpoints. Как спроектировать интерфейс и ownership?
Как организовать code review в backend-команде, чтобы сохранять качество и одновременно растить знание кодовой базы у команды?
Какие implicit сигналы можно использовать вместо явных оценок, и какие у них риски?
You are given an uncertain research-heavy ML project that eventually must be shipped as a working артефакт. How do you decompose the work and communicate progress?
When would you use a pure collaborative ALS or matrix-factorization baseline for a social feed, and what are its limitations?
Как построить target для реранкера товаров, если есть логи показов, кликов, корзины и покупок?
How would you evaluate and improve a summarization service if user feedback is sparse or unavailable?
What is your view on using modern GenAI or vibe-coding tools for software and ML work, and where do they fail today?
Опиши end-to-end цикл ML-задачи: от идеи и данных до выката модели, приемки результата и мониторинга.
Мы посчитали LTV, например 37.37. Маркетолог спрашивает, насколько этому числу можно доверять, потому что от него зависит покупка трафика. Как ответить?
Есть только история взаимодействий пользователей с треками. Как построить первую рекомендательную систему?
PM приходит с marketplace ML задачей: улучшить цену, рекомендацию или промо-блок объявления. Какие вопросы и метрики нужно обсудить до выбора модели?
Если не смотреть только на продуктовые события внутри приложения, какие сигналы стоит получить у стейкхолдеров, чтобы улучшить прогноз или рекомендационную систему?
Игрок только пришел в casino-продукт. Какие признаки можно собрать в первые дни, чтобы отличить потенциального VIP от обычного игрока?
Откуда брать лейблы для phishing detection и как не попасть в feedback loop после запуска предупреждений?
Можно ли дообучать модель на данных, которые сгенерировала текущая модель доставки? Какие риски?
If you train on feedback from the previous recommender, what biases can appear and how can you reduce them?
Модель редких событий вышла в production. Как построить feedback loop: мониторинг, data drift, retraining и регулярную разметку?
Cross-encoder или learning-to-rank reranker можно обучать не только на ручной разметке. Какие online-сигналы полезны для поиска по статьям?
После запуска новой модели доставки появляются свежие данные. Как понять, можно ли включать их в обучение следующей версии?