Назад к тренажеру

Банк вопросов из реальных собеседований

Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.

Все вопросы

Полный банк вопросов из реальных собеседований.

ML-теория

Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.

Python

Устройство языка, структуры данных, тестирование и инженерная база.

SQL

Запросы, агрегации, оконные функции и объяснение результата.

ML System Design

Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.

Метрики и A/B

Качество моделей, продуктовые метрики, эксперименты и валидация.

Продуктовые кейсы

Как разложить задачу продукта, ограничения, риски и первый бейзлайн.

Математика и статистика

Вероятность, статистика, оценки, распределения и аккуратные допущения.

Behavioral Interview

Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.

Метрики и A/B

101 вопрос из реальных интервью

Открыть в общем банке

Темы

Сложность

Компания

Язык

Поиск

ВопросКомпанияИсточникДействие

Метрики и A/BEasy

Precision и recall на примере diagnostic test

Как определить precision и recall для binary classifier и чему они равны для diagnostic test из задачи с rare disease?

precisionrecallbinary classificationconfusion matrix

Revolut

Вопрос по метрикам на техническом собеседовании · Revolut

Открыть вопрос

Метрики и A/BEasy

ROC-AUC: построение и интерпретация

ROC-AUC: построение и интерпретация

ROC-AUCclassification metricsTPRFPR

CIAN

Вопрос по метрикам из разбора после собеседования · CIAN

Открыть вопрос

Метрики и A/BEasy

Расчет годового LTV подписки по retention curve

Расчет годового LTV подписки по retention curve

LTVsubscriptionsretention curvegeometric series

Adapty

Вопрос по метрикам на скрининге · Adapty

Открыть вопрос

Метрики и A/BMedium

100 экспериментов и ложные открытия

Если провести 100 независимых тестов на уровне значимости 5%, что означает два p-value ниже 0.05?

multiple-testingp-valuefalse-positive-ratetechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

Метрики и A/BMedium

A/B-тесты рекомендательной модели

Как проводить offline и online эксперименты для рекомендательной модели? Что важно в A/B-тесте: MDE, p-value, выборка, сетевые эффекты и метрики?

A/B testingMDEp-valuenetwork effects

GamerAM

Вопрос по метрикам на техническом собеседовании · GamerAM

Открыть вопрос

Метрики и A/BMedium

Bayes theorem для diagnostic test с base rate

Есть disease prevalence 1% и diagnostic test с 5% error rate. Если test result positive, как посчитать вероятность, что человек действительно болен, и где чаще всего ошибаются?

Bayes theorembase ratediagnostic testclassification metrics

Revolut

Вопрос по метрикам на техническом собеседовании · Revolut

Открыть вопрос

Метрики и A/BMedium

Bootstrap для оценки неопределенности LTV

Есть исторические пользователи и посчитанный LTV. Как использовать bootstrap, чтобы оценить разброс LTV и получить нижнюю границу для решения о закупке трафика?

bootstrapltvuncertaintyquantiles

Adapty

Вопрос по метрикам на техническом собеседовании · Adapty

Открыть вопрос

Метрики и A/BMedium

Bootstrap: что он делает

Для чего нужен bootstrap и почему он сам по себе не уменьшает дисперсию эксперимента?

bootstrapconfidence-intervalvariancestatistics

MrBit

Вопрос по метрикам на техническом собеседовании · MrBit

Открыть вопрос

Метрики и A/BMedium

Debugging плохой метрики модели

Что проверять, если ranking/model metric неожиданно низкая или модель выглядит overfit/underfit?

model-debuggingoverfittingunderfittingdata-quality

AgeCode

Вопрос про production ML на техническом собеседовании · AgeCode

Открыть вопрос

Метрики и A/BMedium

В чем разница между FP16 и BF16 и почему BF16 часто устойчивее для обучения?

fp16bf16numericstraining

Mirai

Техническое собеседование · Mirai

Открыть вопрос

Метрики и A/BMedium

Imbalanced classification: метрики, loss и leakage

Как обучать и оценивать модель, если положительный класс редкий?

imbalanced classificationPR-AUCfocal lossУтечки

Waibee

Вопрос по метрикам на техническом собеседовании · Waibee

Открыть вопрос

Метрики и A/BMedium

Low-F1 классы в CV taxonomy

Модель хорошо работает в среднем, но у части классов низкий F1. Как диагностировать и чинить?

computer-visionМетрикиf1error-analysis

2GIS

Вопрос по метрикам на техническом собеседовании · 2GIS

Открыть вопрос

Метрики и A/BMedium

LTV/R365 и годовой data drift

Нужно прогнозировать выручку пользователя за 365 дней по ранним признакам. Почему прямой подход может плохо работать?

LTVR365data driftcohorts

EasyBrain

ML System Design на техническом собеседовании · EasyBrain

Открыть вопрос

Метрики и A/BMedium

MAP/NDCG и связь с бизнес-эффектом

Как считать MAP/NDCG для рекомендаций и почему этих метрик недостаточно без бизнес-связки?

NDCGMAPranking-metricsbusiness-metrics

GRII RED

Вопрос по метрикам на техническом собеседовании · GRII RED

Открыть вопрос

Метрики и A/BMedium

Metric learning для сопоставления авто по фото

Как построить систему, которая по фотографиям объявлений понимает, что в отчете оказалась другая машина, и удаляет ошибочные совпадения?

metric-learningcomputer-visionimage-matchingembedding-models

Dubai Tech

ML System Design на техническом собеседовании

Открыть вопрос

Метрики и A/BMedium

Multi-output прогноз LTV-кривой

Как использовать свежие неполные когорты, если R365 для них еще неизвестен?

LTV curvemulti-output regressioncohortspartial labels

EasyBrain

ML System Design на техническом собеседовании · EasyBrain

Открыть вопрос

Метрики и A/BMedium

NDCG, MAP и почему ranking-метрики не оптимизируют напрямую

Чем NDCG отличается от MAP и почему такие метрики сложно напрямую оптимизировать градиентным спуском?

NDCGMAPLambdaRankranking loss

HeadHunter

Вопрос по метрикам на техническом собеседовании · HeadHunter

Открыть вопрос

Метрики и A/BMedium

NDCG, MAP, BPR и WARP в рекомендациях

Чем отличаются NDCG/MAP и pairwise losses вроде BPR/WARP?

NDCGMAPBPRWARP

ZingBrain / Aviatrix

Вопрос по метрикам на техническом собеседовании · ZingBrain / Aviatrix

Открыть вопрос

Метрики и A/BMedium

Negative sampling и in-batch negatives

Какие бывают negative sampling стратегии в metric learning/RecSys и зачем нужны in-batch negatives?

negative-samplingmetric-learningin-batch-negativestechnical-explanation

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

Метрики и A/BMedium

Offline evaluation объектных ответов

Какими offline-метриками и ручной оценкой проверить качество генерируемых объектных ответов перед A/B тестом?

offline-evaluationsearch-qualityllm-judgeМетрики

Яндекс

Вопрос по метрикам на техническом собеседовании · Яндекс

Открыть вопрос

Метрики и A/BMedium

Offline evaluation перед A/B тестом рекомендателя

Как построить offline evaluation framework для новой модели рекомендаций и связать его с online A/B тестом?

offline-evaluationab-testingМетрикиrecommendations

OLX

Вопрос по метрикам на собеседовании · OLX

Открыть вопрос

Метрики и A/BMedium

Offline и online-метрики для рекомендаций и поиска

Какие метрики смотреть, когда выкатываешь новую рекомендательную или поисковую модель?

ROC AUCF1PrecisionRecall

Uzum

Вопрос по метрикам на техническом собеседовании · Uzum

Открыть вопрос

Метрики и A/BMedium

Online metrics для генерируемых карточек в поиске

Какие online-метрики выбрать для A/B теста карточки с генерируемым описанием и какие guardrails поставить?

ab-testingsearchonline-metricsguardrails

Яндекс

Вопрос по метрикам на техническом собеседовании · Яндекс

Открыть вопрос

Метрики и A/BMedium

P-value и confidence interval

Как совместно объяснить p-value, уровень значимости и доверительный интервал?

p-valueconfidence-intervalhypothesis-testingtechnical-explanation

MrBit

Вопрос по метрикам на техническом собеседовании · MrBit

Открыть вопрос

Метрики и A/BMedium

P-value и формула Байеса

Как коротко объяснить p-value, где он применяется, и как вывести формулу Байеса через условную вероятность и полную вероятность?

p-valuebayesab-testingВероятность

Dubai Tech

Вопрос по метрикам на техническом собеседовании

Открыть вопрос

Метрики и A/BMedium

Precision или Recall на разных этапах рекомендаций

В recommender system где важнее recall, а где precision?

recsysprecisionrecallРанжирование

Raiffeisen Bank

Техническое собеседование · Raiffeisen Bank

Открыть вопрос

Метрики и A/BMedium

Precision, recall и ROC-AUC при сильном дисбалансе классов

В выборке 95 единиц и 5 нулей. Модель всегда предсказывает единицу. Посчитайте precision, recall и ROC-AUC, а затем объясните, почему такая модель плохая и какие метрики смотреть дополнительно.

precisionrecallROC-AUCclass imbalance

inDrive

Вопрос по метрикам на техническом собеседовании · inDrive

Открыть вопрос

Метрики и A/BMedium

Precision/Recall и обобщение по географическим признакам

Как объяснить Precision/Recall и что проверять, если модель должна обобщаться на новые регионы или географические признаки?

precisionrecallgeneralizationgeo-features

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

Метрики и A/BMedium

Quantile regression и asymmetric loss

Что такое квантильная регрессия и когда полезно предсказывать не среднее, а, например, 90-й квантиль?

quantile-regressionloss-functionsriskobjective-design

Dubai Tech

Вопрос по метрикам на техническом собеседовании

Открыть вопрос

Метрики и A/BMedium

Ranking metrics и online guardrails

Как объяснить NDCG/recall и какие online guardrails нужны для ranking model?

РанжированиеNDCGrecallonline-metrics

AgeCode

Вопрос по метрикам на техническом собеседовании · AgeCode

Открыть вопрос

Метрики и A/BMedium

Rich-get-richer bias в matching-рекомендациях

В dating или matching продукте топ-профили получают львиную долю показов, а остальные растворяются. Как диагностировать и смягчить этот перекос, не убив вовлеченность?

RecSyspopularity biasfairnessexploration

GamerAM

ML System Design на скрининге · GamerAM

Открыть вопрос

Метрики и A/BMedium

RL-агент для оптимизации молекул

Кандидат рассказывает про RL-проект в drug discovery. Как объяснить постановку: состояние, действие, среда, reward и метрики качества?

reinforcement-learninggnndrug-discoveryproblem-framing

Dubai Tech

Техническое собеседование

Открыть вопрос

Метрики и A/BMedium

ROC AUC как качество ранжирования

Что означает ROC AUC и почему его можно понимать как метрику ранжирования?

roc-aucРанжированиеclassification-metricstechnical-explanation

Raiffeisen Bank

Техническое собеседование · Raiffeisen Bank

Открыть вопрос

Метрики и A/BMedium

t-test, bootstrap и z-test для delivery pricing A/B

В A/B тесте динамической доставки метрики прибыли и маржи могут иметь heavy tails. Когда использовать t-test, bootstrap или z-test?

ab-testingbootstrapz-testheavy-tails

Dodo

Вопрос по метрикам на техническом собеседовании · Dodo

Открыть вопрос

Метрики и A/BMedium

Top-K near neighbors и recall/latency trade-off

Как строить top-K похожих item и управлять компромиссом между recall, latency и стоимостью?

ANNtop-kretrievallatency

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

Метрики и A/BMedium

Variance reduction в A/B testing

Какие методы снижения дисперсии применимы в продуктовых экспериментах и где место CUPED?

variance-reductioncupedab-testingstratification

MrBit

Вопрос по метрикам на техническом собеседовании · MrBit

Открыть вопрос

Метрики и A/BMedium

Describe how you would train and validate a transformer-style reranking model for marketplace recommendations.

RecSysrerankingnegative samplingNDCG

Apriori

Материалы интервью · Apriori

Открыть вопрос

Метрики и A/BMedium

What does the Central Limit Theorem say and why is it important in statistics and A/B testing?

Central Limit Theoremsampling distributionA/B testingstatistics

Okko

Техническое собеседование · Okko

Открыть вопрос

Метрики и A/BMedium

How can you get a sentence embedding from BERT, how do sentence transformers differ, and why is this similar to metric learning for image pairs?

BERTsentence transformerspoolingmetric learning

X5

Техническое собеседование · X5

Открыть вопрос

Метрики и A/BMedium

Вопрос по метрикам

Explain why statistical significance is needed in A/B tests, what a p-value means, and what affects whether an experiment is significant.

A/B testingp-valuestatistical significancesample size

Fairmarkit

Вопрос по метрикам на собеседовании · Fairmarkit

Открыть вопрос

Метрики и A/BMedium

Вопрос по метрикам

A binary image classifier is trained with BCE loss. On validation, accuracy rises but BCE loss also rises. Can this happen and what are plausible causes?

binary cross entropyaccuracycalibrationlabel noise

Navio

Вопрос по метрикам на техническом собеседовании · Navio

Открыть вопрос

Метрики и A/BMedium

Вопрос по метрикам

Minimizing squared error corresponds to maximum likelihood under what noise distribution, and why?

least squaresmaximum likelihoodGaussian noiseregression

HFT-роль, компания не подтверждена

Вопрос по метрикам из фидбека после собеседования · HFT-роль, компания не подтверждена

Открыть вопрос

Метрики и A/BMedium

Вопрос про production ML

In PyTorch DDP training, which common layer can behave badly across processes and how do teams usually handle it?

DDPBatchNormSyncBatchNormdistributed training

Navio

Вопрос про production ML на техническом собеседовании · Navio

Открыть вопрос

Метрики и A/BMedium

Вопрос про production ML

A new perception detector improves some offline metrics but degrades others. How do you decide whether to ship it to production?

Детекция объектовmetric tradeoffsafetyoffline evaluation

Navio

Вопрос про production ML на собеседовании · Navio

Открыть вопрос

Метрики и A/BMedium

Датасет и hard negatives для visual difference

Как собрать датасет для модели, которая отличает один и тот же автомобиль от визуально похожего другого?

cvlabelingmetric-learningdataset-design

Corsearch / Navi

ML System Design на техническом собеседовании · Corsearch / Navi

Открыть вопрос

Метрики и A/BMedium

Дизайн A/B-теста, размер выборки и p-value

Дизайн A/B-теста, размер выборки и p-value

A/B testingsample sizepowerp-value

Wheely

Вопрос по метрикам на техническом собеседовании · Wheely

Открыть вопрос

Метрики и A/BMedium

Извлечение полезного контента страницы перед суммаризацией

Извлечение полезного контента страницы перед суммаризацией

web extractionHTMLboilerplate removalclassification

Constructor

ML System Design из фидбека после собеседования · Constructor

Открыть вопрос

Метрики и A/BMedium

Как безопасно использовать AI coding tools в команде

Команда активно использует AI coding tools. Какие риски нужно контролировать и как встроить это в инженерный процесс?

AI codingcode reviewИнженерные практикиengineering-quality

Flametree

Вопрос про production ML на техническом собеседовании · Flametree

Открыть вопрос

Метрики и A/BMedium

Как выбрать признаки и метрики для модели возврата

После первой модели нужно понять, какие признаки оставить и стала ли модель лучше. Какие offline-метрики и проверки использовать?

feature importanceSHAPprecisionrecall

Mayflower

Вопрос по метрикам на техническом собеседовании · Mayflower

Открыть вопрос

Метрики и A/BMedium

Как из продуктовой идеи получить ML-задачу

Как выглядит типичная задача от бизнеса или продукта? Что вы уточняете, если приходит верхнеуровневая идея вроде поднять метрику или автоматизировать решение?

Продуктовые кейсыrequirementsbusiness metricsexperimentation

GamerAM

Вопрос про production ML на техническом собеседовании · GamerAM

Открыть вопрос

Метрики и A/BMedium

Как оценивать двухстадийную рекомендательную систему

Есть генератор кандидатов и ранкер. Какие offline и online метрики смотреть для каждого этапа?

RecSyscandidate generationranking metricsNDCG

HeadHunter

Вопрос по метрикам на техническом собеседовании · HeadHunter

Открыть вопрос

Метрики и A/BMedium

Как понять, хороший ли MSE на тесте

Модель получила MSE на тестовом периоде. Как понять, хороший это результат или нет?

Метрикиmsebaselinetechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

Метрики и A/BMedium

Как понять, что ML-фича принесла пользу

Интервьюер спрашивает: какие метрики отслеживали и как понимали, что внедренное ML-решение действительно приносит пользу?

Метрикиab-testingrecsysbusiness-impact

Raiffeisen Bank

Вопрос по метрикам на техническом собеседовании · Raiffeisen Bank

Открыть вопрос

Метрики и A/BMedium

Как посчитать money recall для рекомендаций

Две модели имеют похожие Precision@k и Recall@k, но одна приносит больше денег, потому что рекомендует более дорогие релевантные товары. Как адаптировать offline-метрику?

recsysМетрикиmoney-recallmarketplace

Wildberries

Вопрос по метрикам из материалов интервью · Wildberries

Открыть вопрос

Метрики и A/BMedium

Какой constant classifier минимизирует binary logloss

Есть датасет с N0 отрицательными и N1 положительными примерами. Классификатор всегда выдает одну вероятность p. Какое p минимизирует binary logloss?

Loglossbinary-classificationОптимизацияМетрики

Huawei

Вопрос по метрикам на техническом собеседовании · Huawei

Открыть вопрос

Метрики и A/BMedium

Метрики для ML-модерации и anti-фрод

Какими offline и product metrics оценивать модель, которая отправляет подозрительные объявления на модерацию?

moderationМетрикиfraudoffline-metrics

Corsearch / Navi

Вопрос по метрикам на техническом собеседовании · Corsearch / Navi

Открыть вопрос

Метрики и A/BMedium

Метрики для recommendation-системы

Какие offline и online метрики считать для recommendation-системы с визуальными и текстовыми признаками?

МетрикиrecsysРанжированиеbusiness-metrics

GRII RED

Вопрос по метрикам на техническом собеседовании · GRII RED

Открыть вопрос

Метрики и A/BMedium

Метрики качества для восстановления пунктуации и капитализации

Метрики качества для восстановления пунктуации и капитализации

NLP metricssequence labelingprecisionrecall

Constructor

Вопрос по метрикам на техническом собеседовании · Constructor

Открыть вопрос

Метрики и A/BMedium

Метрики классификации, ties в ROC-AUC и F1

Метрики классификации, ties в ROC-AUC и F1

ROC-AUCprecisionrecallF1

Tochka

Вопрос по метрикам на техническом собеседовании · Tochka

Открыть вопрос

Метрики и A/BMedium

Метрики музыкальных рекомендаций

Какие метрики смотреть для рекомендательной системы треков?

Recall@KNDCGskip ratelistening time

Звук

Вопрос по метрикам на техническом собеседовании · Звук

Открыть вопрос

Метрики и A/BMedium

Метрики ранжирования: NDCG, MRR, Precision@K и online-метрики

Какие метрики использовать для оценки ранжирования в рекомендациях или поиске?

NDCGMRRPrecision@KRecall@K

Ozon

Вопрос по метрикам на техническом собеседовании · Ozon

Открыть вопрос

Метрики и A/BMedium

Метрики удовлетворенности контентом в ленте

Как понять, что пользователям нравится контент в новостной ленте? Какие данные мониторить и какие смещения могут искажать эти метрики?

feed rankingengagement metricsbiassatisfaction

GamerAM

Вопрос по метрикам на скрининге · GamerAM

Открыть вопрос

Метрики и A/BMedium

Метрики фрод-классификатора при асимметричных ошибках

Метрики фрод-классификатора при асимметричных ошибках

fraud detectionprecisionrecallPR-AUC

Wheely

Вопрос по метрикам из разбора после собеседования · Wheely

Открыть вопрос

Метрики и A/BMedium

Обучение со смешанной точностью, FP16/BF16 и память

Обучение со смешанной точностью, FP16/BF16 и память

mixed precisionFP16BF16GradScaler

Diagnocat

Вопрос про production ML на техническом собеседовании · Diagnocat

Открыть вопрос

Метрики и A/BMedium

От чего зависит sample size в A/B-тесте конверсии

В A/B-тесте сравниваем conversion rate control и treatment. От каких компонентов зависит минимальный sample size, чтобы обнаружить статистически значимый эффект?

A/B testingsample sizeconversion ratepower

Revolut

Вопрос по метрикам на техническом собеседовании · Revolut

Открыть вопрос

Метрики и A/BMedium

Отчетность и метрики для LLM-агента

Как построить отчетность вокруг LLM-агента, чтобы понимать качество, пользу, ошибки и стоимость?

llm-evaluationobservabilityreportingtechnical-explanation

PulsePoint

Вопрос по метрикам на техническом собеседовании · PulsePoint

Открыть вопрос

Метрики и A/BMedium

Офлайн-оценка дополняющих fashion-рекомендаций

Офлайн-оценка дополняющих fashion-рекомендаций

RecSysfashionoffline evaluationcandidate generation

Constructor

ML System Design на техническом собеседовании · Constructor

Открыть вопрос

Метрики и A/BMedium

Свойства хорошего embedding space

Какими свойствами должны обладать embeddings для поиска, рекомендаций или сопоставления объектов?

embeddingsmetric-learningretrievalsimilarity-search

Dubai Tech

Техническое собеседование

Открыть вопрос

Метрики и A/BMedium

Сезонность, переобучение и A/B тест поискового ranker

Как учитывать сезонность в поиске и как запускать новую модель в online-эксперимент?

seasonalityretrainingA/B testingMDE

Uzum

Вопрос по метрикам на техническом собеседовании · Uzum

Открыть вопрос

Метрики и A/BMedium

Теорема Байеса для болезни 1% и теста 99%

Теорема Байеса для болезни 1% и теста 99%

Bayes theorembase ratediagnostic testВероятность

Wheely

Техническое собеседование · Wheely

Открыть вопрос

Метрики и A/BMedium

Фальшивая монета после серии орлов

Есть 1000 монет, одна из них с орлом на обеих сторонах, остальные честные. Выбрали монету случайно и получили 10 орлов подряд. Какова вероятность, что выбрана фальшивая монета?

bayesВероятностьposteriorbayesian-update

Dubai Tech

Вопрос по метрикам на техническом собеседовании

Открыть вопрос

Метрики и A/BMedium

ЦПТ, A/B test и MDE

Как связаны центральная предельная теорема, дизайн A/B-теста и MDE?

cltab-testingmdestatistics

MrBit

Вопрос по метрикам на техническом собеседовании · MrBit

Открыть вопрос

Метрики и A/BMedium

Что такое p-value

Как объяснить p-value без ошибки “вероятность, что нулевая гипотеза верна”?

p-valuehypothesis-testingstatisticstechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

Метрики и A/BHard

A/B-тест и бизнес-метрики видео-ленты

Как проверить, что новая рекомендательная лента работает, и как понять, сколько держать A/B-тест?

ab-testinggmvconversionwatchtime

Самокат

Вопрос по метрикам на техническом собеседовании · Самокат

Открыть вопрос

Метрики и A/BHard

Evaluation для описаний изображений

Как оценить качество VLM, которая генерирует описание изображения для пользователя или downstream поиска?

vlmcaptioningevaluationfactuality

Яндекс

Вопрос по метрикам на техническом собеседовании · Яндекс

Открыть вопрос

Метрики и A/BHard

Fairness для платных объявлений в marketplace recommendations

В маркетплейсе есть бесплатные и платные объявления. Нужно давать платным больше показов/кликов, но не портить релевантность пользователю. Как решить задачу?

paid-adsfairnessmarketplacemonetization

OLX

ML System Design на собеседовании · OLX

Открыть вопрос

Метрики и A/BHard

Metric learning для похожих товаров

Как обучить embedding-модель, чтобы поиск по фото возвращал не просто визуально похожие картинки, а товарно релевантные результаты?

metric-learningembeddingsretrievalecommerce

Wildberries

ML System Design на техническом собеседовании · Wildberries

Открыть вопрос

Метрики и A/BHard

Metric learning для сравнения двух машин по фото

Metric learning для сравнения двух машин по фото

metric learningComputer Visionhard negativestriplet loss

Tochka

Техническое собеседование · Tochka

Открыть вопрос

Метрики и A/BHard

ML System Design

How would you build positives and negatives for training a similar-items model, and what loss would you use?

contrastive learningtriplet losshard negativeslabeling

Okko

ML System Design из фидбека после собеседования · Okko

Открыть вопрос

Метрики и A/BHard

ML System Design

Finding one bad counterparty is not enough. How would you compute the share of turnover that went to suspicious counterparties across heterogeneous bank statements?

transaction parsingamount extractionturnoverrisk aggregation

Tochka

ML System Design на техническом собеседовании · Tochka

Открыть вопрос

Метрики и A/BHard

ML System Design

Design an automatic system that checks whether a human/agent task result is good enough before delivery to a customer. How do you frame the ML problem?

quality controlLLM-агентыhuman dataproblem framing

Toloka AI

ML System Design из фидбека после собеседования · Toloka AI

Открыть вопрос

Метрики и A/BHard

Temporal embeddings и hard-case mining

Модель получает temporal embeddings, но один из event heads работает плохо. Как улучшать качество: features, post-processing, labels, hard cases?

temporal-modelinghard-negative-miningerror-analysisfeature-engineering

Waymo

ML System Design из фидбека после собеседования · Waymo

Открыть вопрос

Метрики и A/BHard

Вопрос по метрикам

How do you design an A/B test, estimate sample size/MDE, and handle cases where treatment and control users are not independent, such as drivers and passengers in a marketplace?

A/B testingMDEnetwork effectsmarketplace

inDrive

Вопрос по метрикам на техническом собеседовании · inDrive

Открыть вопрос

Метрики и A/BHard

Вопрос по метрикам

A retail video analytics model should flag suspicious behavior, but humans do not fully agree on what “suspicious” means. How would you define success and evaluate whether the system is doing a good job?

evaluationambiguous labelshuman agreementvideo analytics

Focus / Teramind

Вопрос по метрикам на скрининге · Focus / Teramind

Открыть вопрос

Метрики и A/BHard

Вопрос по метрикам

A human reviewer and an automatic checker each output a list of found errors. How do you evaluate the checker?

evaluationset matchingprecisionrecall

Toloka AI

Вопрос по метрикам из фидбека после собеседования · Toloka AI

Открыть вопрос

Метрики и A/BHard

Вопрос про production ML

You have about 10,000 statement pages per night, 100 banks, one CPU server and sensitive data that cannot leave the bank. How do you allocate expensive local LLM usage?

scalabilityprivacylocal LLMrouting

Tochka

Вопрос про production ML на техническом собеседовании · Tochka

Открыть вопрос

Метрики и A/BHard

Восстановление пунктуации и капитализации в ASR-тексте

Восстановление пунктуации и капитализации в ASR-тексте

NLPASR post-processingpunctuation restorationcapitalization

Constructor

ML System Design на техническом собеседовании · Constructor

Открыть вопрос

Метрики и A/BHard

Высокоточная модерация фото авто при редком фроде

Нужно автоматически отклонять объявления, когда признаки с фото авто противоречат введенным пользователем атрибутам. Фрод редкий, а ложные отклонения бьют по пользователям. Как обучать модель, валидировать качество и выбирать пороги?

Computer Visionmoderationrare positivesthresholds

Tochka

Вопрос про production ML на техническом собеседовании · Tochka

Открыть вопрос

Метрики и A/BHard

Как A/B-тестировать новую карусель или тег Deal of the Day

В marketplace добавляют новую карусель или тег Deal of the Day с модельным отбором объявлений. В A/B выросла конверсия. Как понять, что сработала именно модель, а не просто новый UI/тег?

ab-testingmarketplaceconfoundingrecsys

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

Метрики и A/BHard

Как думать про distributed векторный поиск

Команда говорит, что переходит от single-node векторный поиск к distributed vector retrieval system. Какие вопросы и trade-off стоит обсудить?

vector-searchanndistributed-systemsrecsys

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

Метрики и A/BHard

Как отделить эффект модели от эффекта тега

Deal of the Day или новая карусель дали uplift. Как проверить, что прирост вызвала модельная релевантность, а не сам UI-тег?

ab-testingconfoundingui-effectmarketplace

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

Метрики и A/BHard

Как оценивать LLM-фичу бизнес-метриками

В команде делают LLM/agent feature. Как выбрать метрики качества, если обычная accuracy не показывает бизнес-ценность?

LLM evaluationbusiness metricsagentsМетрики

Flametree

Вопрос по метрикам на техническом собеседовании · Flametree

Открыть вопрос

Метрики и A/BHard

Метрики для safety-critical rare events

Для редких safety-critical событий false negative дороже false positive. Какие метрики и threshold strategy выбрать?

Метрикиrare-eventssafetythreshold-selection

Waymo

Вопрос по метрикам из фидбека после собеседования · Waymo

Открыть вопрос

Метрики и A/BHard

Моделирование LTV по многим приложениям через эмбеддинги и сегменты

Моделирование LTV по многим приложениям через эмбеддинги и сегменты

LTVmulti-tenant MLembeddingssegmentation

Adapty

Вопрос про production ML из разбора после собеседования · Adapty

Открыть вопрос

Метрики и A/BHard

Обучение pointwise-ранкера без утечек и перекоса в популярные товары

Вы обучаете boosting-ранкер для рекомендаций по кликам и связкам образов. Как собрать датасет, сделать train/validation/test split и не переобучиться на популярные товары и старые показы?

РанжированиеboostingВалидацияtime split

T-Bank

ML System Design из фидбека после собеседования · T-Bank

Открыть вопрос

Метрики и A/BHard

Оптимизировать прибыль, а не только покупки

Модель учится на purchase target и поднимает дешевые товары со скидками. Как ранжировать так, чтобы больше зарабатывать?

marginobjective-designВыручкаbusiness-alignment

Constructor

Вопрос по метрикам на техническом собеседовании · Constructor

Открыть вопрос

Метрики и A/BHard

Поиск недвижимости по текстовому запросу: метрики и признаки

Спроектируйте поиск недвижимости без явных фильтров: пользователь вводит свободный текст. Как на первом шаге определить метрики, признаки объявлений, query/user context и базовую схему retrieval/ranking?

real-estate searchМетрикиitem featuresmarketplace

CIAN

ML System Design из разбора после собеседования · CIAN

Открыть вопрос

Метрики и A/BHard

Почему еду на подносе сложно распознавать

На тарелке может быть несколько блюд, они перемешиваются и перекрывают друг друга. Почему segmentation или metric learning не решают задачу автоматически?

computer-visionsegmentationmetric-learningfood-recognition

CV catering

ML System Design на техническом собеседовании · CV catering

Открыть вопрос

Метрики и A/BHard

Рекомендации между вертикалями в супераппе

В супераппе inDrive есть несколько вертикалей: такси, доставка, междугородние поездки, грузовые перевозки и курьеры. Как рекомендовать активному пользователю одной вертикали попробовать другую? Разберите метрики, данные, модель, offline-оценку и A/B-тест.

superappRecSyscross-sellmarketplace

inDrive

ML System Design на техническом собеседовании · inDrive

Открыть вопрос

Метрики и A/BHard

Таргеты, loss и negative sampling для ранкера социальной ленты

Таргеты, loss и negative sampling для ранкера социальной ленты

feed rankingtargetsloss functionsnegative sampling

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

Метрики и A/BHard

Эмбеддинги пользователей для matching-рекомендаций

Как обучить эмбеддинги пользователей для matching: какую архитектуру, loss и target выбрать, если пользователям рекомендуются другие пользователи?

matchingembeddingssiamese networkcontrastive loss

GamerAM

ML System Design на техническом собеседовании · GamerAM

Открыть вопрос

Банк вопросов из реальных собеседований — ML Mentor