Назад к тренажеру

Банк вопросов из реальных собеседований

Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.

Все вопросы

673

Полный банк вопросов из реальных собеседований.

ML-теория

119

Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.

Python

67

Устройство языка, структуры данных, тестирование и инженерная база.

SQL

12

Запросы, агрегации, оконные функции и объяснение результата.

ML System Design

259

Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.

Метрики и A/B

101

Качество моделей, продуктовые метрики, эксперименты и валидация.

Продуктовые кейсы

72

Как разложить задачу продукта, ограничения, риски и первый бейзлайн.

Математика и статистика

18

Вероятность, статистика, оценки, распределения и аккуратные допущения.

Behavioral Interview

25

Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.

Метрики и A/B

101 вопрос из реальных интервью

Открыть в общем банке
Темы
Сложность
Компания
Язык
Метрики и A/BMedium
Bayes theorem для diagnostic test с base rate

Есть disease prevalence 1% и diagnostic test с 5% error rate. Если test result positive, как посчитать вероятность, что человек действительно болен, и где чаще всего ошибаются?

Bayes theorembase ratediagnostic testclassification metrics
Revolut
Метрики и A/BMedium
Bootstrap для оценки неопределенности LTV

Есть исторические пользователи и посчитанный LTV. Как использовать bootstrap, чтобы оценить разброс LTV и получить нижнюю границу для решения о закупке трафика?

bootstrapltvuncertaintyquantiles
Adapty
Метрики и A/BMedium
Metric learning для сопоставления авто по фото

Как построить систему, которая по фотографиям объявлений понимает, что в отчете оказалась другая машина, и удаляет ошибочные совпадения?

metric-learningcomputer-visionimage-matchingembedding-models
Dubai Tech
Метрики и A/BMedium
Precision, recall и ROC-AUC при сильном дисбалансе классов

В выборке 95 единиц и 5 нулей. Модель всегда предсказывает единицу. Посчитайте precision, recall и ROC-AUC, а затем объясните, почему такая модель плохая и какие метрики смотреть дополнительно.

precisionrecallROC-AUCclass imbalance
inDrive
Метрики и A/BMedium
Rich-get-richer bias в matching-рекомендациях

В dating или matching продукте топ-профили получают львиную долю показов, а остальные растворяются. Как диагностировать и смягчить этот перекос, не убив вовлеченность?

RecSyspopularity biasfairnessexploration
GamerAM
Метрики и A/BMedium
Как безопасно использовать AI coding tools в команде

Команда активно использует AI coding tools. Какие риски нужно контролировать и как встроить это в инженерный процесс?

AI codingcode reviewИнженерные практикиengineering-quality
Flametree
Метрики и A/BMedium
Как выбрать признаки и метрики для модели возврата

После первой модели нужно понять, какие признаки оставить и стала ли модель лучше. Какие offline-метрики и проверки использовать?

feature importanceSHAPprecisionrecall
Mayflower
Метрики и A/BMedium
Как из продуктовой идеи получить ML-задачу

Как выглядит типичная задача от бизнеса или продукта? Что вы уточняете, если приходит верхнеуровневая идея вроде поднять метрику или автоматизировать решение?

Продуктовые кейсыrequirementsbusiness metricsexperimentation
GamerAM
Метрики и A/BMedium
Как понять, что ML-фича принесла пользу

Интервьюер спрашивает: какие метрики отслеживали и как понимали, что внедренное ML-решение действительно приносит пользу?

Метрикиab-testingrecsysbusiness-impact
Raiffeisen Bank
Метрики и A/BMedium
Как посчитать money recall для рекомендаций

Две модели имеют похожие Precision@k и Recall@k, но одна приносит больше денег, потому что рекомендует более дорогие релевантные товары. Как адаптировать offline-метрику?

recsysМетрикиmoney-recallmarketplace
Wildberries
Метрики и A/BMedium
Какой constant classifier минимизирует binary logloss

Есть датасет с N0 отрицательными и N1 положительными примерами. Классификатор всегда выдает одну вероятность p. Какое p минимизирует binary logloss?

Loglossbinary-classificationОптимизацияМетрики
Huawei
Метрики и A/BMedium
Метрики удовлетворенности контентом в ленте

Как понять, что пользователям нравится контент в новостной ленте? Какие данные мониторить и какие смещения могут искажать эти метрики?

feed rankingengagement metricsbiassatisfaction
GamerAM
Метрики и A/BMedium
От чего зависит sample size в A/B-тесте конверсии

В A/B-тесте сравниваем conversion rate control и treatment. От каких компонентов зависит минимальный sample size, чтобы обнаружить статистически значимый эффект?

A/B testingsample sizeconversion ratepower
Revolut
Метрики и A/BMedium
Фальшивая монета после серии орлов

Есть 1000 монет, одна из них с орлом на обеих сторонах, остальные честные. Выбрали монету случайно и получили 10 орлов подряд. Какова вероятность, что выбрана фальшивая монета?

bayesВероятностьposteriorbayesian-update
Dubai Tech
Метрики и A/BHard
Fairness для платных объявлений в marketplace recommendations

В маркетплейсе есть бесплатные и платные объявления. Нужно давать платным больше показов/кликов, но не портить релевантность пользователю. Как решить задачу?

paid-adsfairnessmarketplacemonetization
OLX
Метрики и A/BHard
Высокоточная модерация фото авто при редком фроде

Нужно автоматически отклонять объявления, когда признаки с фото авто противоречат введенным пользователем атрибутам. Фрод редкий, а ложные отклонения бьют по пользователям. Как обучать модель, валидировать качество и выбирать пороги?

Computer Visionmoderationrare positivesthresholds
Tochka
Метрики и A/BHard
Как A/B-тестировать новую карусель или тег Deal of the Day

В marketplace добавляют новую карусель или тег Deal of the Day с модельным отбором объявлений. В A/B выросла конверсия. Как понять, что сработала именно модель, а не просто новый UI/тег?

ab-testingmarketplaceconfoundingrecsys
OLX
Метрики и A/BHard
Обучение pointwise-ранкера без утечек и перекоса в популярные товары

Вы обучаете boosting-ранкер для рекомендаций по кликам и связкам образов. Как собрать датасет, сделать train/validation/test split и не переобучиться на популярные товары и старые показы?

РанжированиеboostingВалидацияtime split
T-Bank
Метрики и A/BHard
Оптимизировать прибыль, а не только покупки

Модель учится на purchase target и поднимает дешевые товары со скидками. Как ранжировать так, чтобы больше зарабатывать?

marginobjective-designВыручкаbusiness-alignment
Constructor
Метрики и A/BHard
Поиск недвижимости по текстовому запросу: метрики и признаки

Спроектируйте поиск недвижимости без явных фильтров: пользователь вводит свободный текст. Как на первом шаге определить метрики, признаки объявлений, query/user context и базовую схему retrieval/ranking?

real-estate searchМетрикиitem featuresmarketplace
CIAN
Метрики и A/BHard
Почему еду на подносе сложно распознавать

На тарелке может быть несколько блюд, они перемешиваются и перекрывают друг друга. Почему segmentation или metric learning не решают задачу автоматически?

computer-visionsegmentationmetric-learningfood-recognition
CV catering
Метрики и A/BHard
Рекомендации между вертикалями в супераппе

В супераппе inDrive есть несколько вертикалей: такси, доставка, междугородние поездки, грузовые перевозки и курьеры. Как рекомендовать активному пользователю одной вертикали попробовать другую? Разберите метрики, данные, модель, offline-оценку и A/B-тест.

superappRecSyscross-sellmarketplace
inDrive
Метрики и A/BHard
Эмбеддинги пользователей для matching-рекомендаций

Как обучить эмбеддинги пользователей для matching: какую архитектуру, loss и target выбрать, если пользователям рекомендуются другие пользователи?

matchingembeddingssiamese networkcontrastive loss
GamerAM
Банк вопросов из реальных собеседований — ML Mentor