Назад к тренажеру

Банк вопросов из реальных собеседований

Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.

Все вопросы

Полный банк вопросов из реальных собеседований.

ML-теория

Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.

Python

Устройство языка, структуры данных, тестирование и инженерная база.

SQL

Запросы, агрегации, оконные функции и объяснение результата.

ML System Design

Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.

Метрики и A/B

Качество моделей, продуктовые метрики, эксперименты и валидация.

Продуктовые кейсы

Как разложить задачу продукта, ограничения, риски и первый бейзлайн.

Математика и статистика

Вероятность, статистика, оценки, распределения и аккуратные допущения.

Behavioral Interview

Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.

ML-теория

119 вопросов из реальных интервью

Открыть в общем банке

Темы

Сложность

Компания

Язык

Поиск

ВопросКомпанияИсточникДействие

ML-теорияEasy

Receptive field: одна 5x5 свертка или две 3x3

Что такое receptive field в CNN? Какой receptive field у одной свертки 5x5 и у двух последовательных 3x3, и где меньше параметров?

CNNreceptive fieldconvolutionparameters

GamerAM

Техническое собеседование · GamerAM

Открыть вопрос

ML-теорияEasy

Explain how dropout behaves during training and inference. Why does the implementation need scaling, and what is inverted dropout?

dropoutregularizationPyTorchinference

Navio

Техническое собеседование · Navio

Открыть вопрос

ML-теорияEasy

Переобучение нейросети и аугментации в CV

Назовите специфичные для нейросетей способы борьбы с переобучением. Какие способы аугментации данных можно использовать в Computer Vision?

overfittingregularizationdropoutBatchNorm

Wisebits / xHamster

Скрининг · Wisebits / xHamster

Открыть вопрос

ML-теорияEasy

Переобучение, синтетика и разбиение данных

Как бороться с переобучением модели? Чем может быть опасна синтетика и зачем нужен разбиение данных?

overfittingregularizationsynthetic dataВалидация

GamerAM

Техническое собеседование · GamerAM

Открыть вопрос

ML-теорияEasy

Семантическая сегментация и свертка

Что такое семантическая сегментация? Чем она отличается от instance segmentation? Как работает свертка в CNN?

semantic segmentationinstance segmentationconvolutionCNN

Wisebits / xHamster

Скрининг · Wisebits / xHamster

Открыть вопрос

ML-теорияEasy

Токенизация, Bag of Words, TF-IDF и embeddings

Что такое токенизация и зачем она нужна в задачах обработки текста? Чем отличаются Bag of Words, TF-IDF и embeddings, например word2vec?

tokenizationBag of WordsTF-IDFword2vec

Wisebits / xHamster

Скрининг · Wisebits / xHamster

Открыть вопрос

ML-теорияEasy

Чем логистическая регрессия похожа на линейную

Интервьюер спрашивает: если рассматривать логистическую регрессию, чем она похожа на линейную и чем отличается?

logistic-regressionlinear-modelsclassificationml-basics

Raiffeisen Bank

Техническое собеседование · Raiffeisen Bank

Открыть вопрос

ML-теорияMedium

Bagging vs boosting и переобучение

Чем bagging отличается от boosting, где применяются random forest и gradient boosting, и что сказать про склонность к переобучению?

ensemblesbaggingboostingbias-variance

Dubai Tech

Техническое собеседование

Открыть вопрос

ML-теорияMedium

Bagging, boosting и регуляризация деревьев

Чем отличаются bagging и gradient boosting? Что будет, если убрать одно дерево из Random Forest и из gradient boosting, и как деревья могут переобучаться на редких категориальных признаках?

baggingrandom forestgradient boostingdecision trees

inDrive

Техническое собеседование · inDrive

Открыть вопрос

ML-теорияMedium

Bias-variance trade-off у Random Forest

Почему Random Forest обычно снижает variance по сравнению с одним деревом и какие trade-offs остаются?

random-forestbias-varianceensemblestechnical-explanation

PulsePoint

Техническое собеседование · PulsePoint

Открыть вопрос

ML-теорияMedium

CatBoost: target encoding без leakage

Как CatBoost кодирует категориальные признаки и почему это не дает leakage?

CatBoosttarget encodingУтечкиgradient boosting

ZingBrain / Aviatrix

Техническое собеседование · ZingBrain / Aviatrix

Открыть вопрос

ML-теорияMedium

CLIP и SigLIP-style обучение image-text моделей

Как работает CLIP-модель и как она обучается? В чем high-level отличие SigLIP-style обучения от классического CLIP?

CLIPSigLIPcontrastive learningmultimodal embeddings

Wisebits / xHamster

Техническое собеседование · Wisebits / xHamster

Открыть вопрос

ML-теорияMedium

Domain adaptation с VR/fisheye на обычное видео

Есть модель для first-person VR/fisheye, а нужно работать на flat third-person видео. Как переносить качество?

domain adaptationfisheyesegmentationpseudo-labeling

Infomediji

ML System Design на техническом собеседовании · Infomediji

Открыть вопрос

ML-теорияMedium

Feature importance и коррелированные признаки

Почему feature importance может обманывать, если признаки сильно коррелируют?

feature importancemulticollinearitypermutation importanceSHAP

ZingBrain / Aviatrix

Техническое собеседование · ZingBrain / Aviatrix

Открыть вопрос

ML-теорияMedium

GraphSAGE, GCN и графовые рекомендации

Как использовать графовые модели в рекомендациях? В чем отличие GCN от GraphSAGE и neighbor sampling подходов?

GCNGraphSAGEgraph recommendersuser-item graph

GamerAM

ML System Design на техническом собеседовании · GamerAM

Открыть вопрос

ML-теорияMedium

IoU вместо MSE для bounding boxes

В object detection почему для box regression часто используют IoU-style loss, а не обычный MSE по координатам углов bounding box?

Детекция объектовIoUbounding boxesloss functions

Wisebits / xHamster

Техническое собеседование · Wisebits / xHamster

Открыть вопрос

ML-теорияMedium

Item-to-item recommender для сочетаемой одежды

Как сделать рекомендации сочетаемой одежды: embeddings, ограничения по категориям, nearest neighbors и reranker?

item-to-itemvector-searchmultimodal-recsysretrieval

Dubai Tech

ML System Design на техническом собеседовании

Открыть вопрос

ML-теорияMedium

Linear programming, simplex и greedy

Что сказать про линейное программирование, simplex-метод и жадные алгоритмы, если спрашивают на техническом ML-интервью?

linear-programmingsimplexЖадный алгоритмОптимизация

Dubai Tech

Техническое собеседование

Открыть вопрос

ML-теорияMedium

Linear regression, normal equation и regularization

Как связаны matrix equation, least squares, gradient descent и L1/L2 regularization?

linear-regressionleast-squaresregularizationgradient-descent

AgeCode

Техническое собеседование · AgeCode

Открыть вопрос

ML-теорияMedium

Logo detection при ограниченной разметке

Как построить logo detection для множества брендов и вариантов логотипов, если ручная bbox-разметка дорогая?

cvlogo-detectionannotationobject-detection

Corsearch / Navi

ML System Design на техническом собеседовании · Corsearch / Navi

Открыть вопрос

ML-теорияMedium

LoRA и нулевая начальная добавка

Что такое LoRA? Почему она полезна для fine-tuning больших моделей? Как обычно инициализируют low-rank матрицы, чтобы не исказить базовую модель на старте?

LoRAfine-tuninglow-rank adaptationLLM

Wisebits / xHamster

Техническое собеседование · Wisebits / xHamster

Открыть вопрос

ML-теорияMedium

LoRA против классических адаптеров

Опиши механизм LoRA. Если LoRA и classic adapters дают одинаковое качество, что выбрать для inference?

loraadaptersfine-tuninginference

Sber

Техническое собеседование · Sber

Открыть вопрос

ML-теорияMedium

LoRA, multi-GPU обучение и RLHF: что важно объяснить

Чем LoRA отличается от полного fine-tuning, какие ограничения появляются при multi-GPU обучении LLM и чем RLHF-подход отличается от классического RL?

LLMLoRAmulti-GPUreinforcement learning

Insilico Medicine

Скрининг · Insilico Medicine

Открыть вопрос

ML-теорияMedium

ML System Design

You can find posts similar to a given post. How do you turn that into user-level candidate generation for a feed?

candidate generationitem-to-itemANNfeed ranking

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML-теорияMedium

ML System Design

For a port waiting-time model, what features would you build beyond timestamp features, and how would you detect anomalies or broken tracking data?

Подготовка признаковanomaly detectiondata qualityforecasting

Quantum One

ML System Design на техническом собеседовании · Quantum One

Открыть вопрос

ML-теорияMedium

ML System Design

What should the output schema of an automatic task checker look like if humans also produce lists of found errors?

error taxonomystructured outputevaluationLLM

Toloka AI

ML System Design из фидбека после собеседования · Toloka AI

Открыть вопрос

ML-теорияMedium

Overfitting, regularization и dropout

Как бороться с переобучением модели? Объясните L1/L2, dropout 0.5 и что происходит с dropout на inference.

regularizationdropoutoverfittingdeep-learning

Sber

Техническое собеседование · Sber

Открыть вопрос

ML-теорияMedium

Partitioning по campaign_id и hot-key риски

Как сделать так, чтобы события одной кампании попадали к нужному worker и корректно агрегировались?

kafkapartitioninghot-keystechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML-теорияMedium

Pointwise, pairwise и listwise ранжирование

Сравни pointwise, pairwise и listwise подходы для ранжирования видео в рекомендательной ленте.

Ранжированиеlearning-to-rankpairwiselistwise

Самокат

Техническое собеседование · Самокат

Открыть вопрос

ML-теорияMedium

Prompting, fine-tuning или data-centric improvement

Команда хочет улучшить качество VLM в продукте. Когда достаточно prompt engineering, когда нужен fine-tuning, а когда лучше улучшать данные?

vlmfine-tuningpromptingdata-centric-ml

Яндекс

Техническое собеседование · Яндекс

Открыть вопрос

ML-теорияMedium

PyTorch: view против reshape

PyTorch: view против reshape

PyTorchtensor memoryviewreshape

Автотехника

Скрининг · Автотехника

Открыть вопрос

ML-теорияMedium

Regularization и dropout: train vs inference

Что такое regularization, как работает dropout и почему поведение отличается на train и inference?

regularizationdropoutoverfittingtechnical-explanation

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

ML-теорияMedium

RL для моделирования молекул

Как сформулировать RL-задачу для оптимизации молекул и почему direct optimization может быть недостаточной?

reinforcement-learningdrug-discoveryОптимизацияtechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

ML-теорияMedium

SASRec и база Transformer для рекомендательных систем

Объясните SASRec как последовательную рекомендательную модель, устройство self-attention в Transformer и отличие SASRec от BERT4Rec.

SASRecTransformerSelf-attentionBERT4Rec

T-Bank

Фидбек после собеседования · T-Bank

Открыть вопрос

ML-теорияMedium

Skip connection и зачем он нужен

Что такое skip connection и почему residual-связи помогают обучать глубокие сети?

resnetskip-connectionsresidual-connectionstechnical-explanation

Sber

Техническое собеседование · Sber

Открыть вопрос

ML-теорияMedium

Stride и padding в CNN

Что такое stride и padding в сверточной сети, и как они влияют на размер feature map?

cnnconvolutionstridepadding

Sber

Техническое собеседование · Sber

Открыть вопрос

ML-теорияMedium

Systematic exploration в RL

Что такое systematic exploration в reinforcement learning, зачем оно нужно и почему это проблема?

reinforcement-learningexplorationbanditsml-theory

Mirai

Техническое собеседование · Mirai

Открыть вопрос

ML-теорияMedium

Temperature, top-k, top-p и max length в LLM generation

Объясните основные параметры генерации LLM: temperature, max length, top-k и top-p. Как они влияют на ответы support bot?

LLM generationtemperaturesamplingllm-theory

Solmate / TAVAX

Техническое собеседование · Solmate / TAVAX

Открыть вопрос

ML-теорияMedium

Time grid и признаки из нерегулярных HFT событий

Как построить feature matrix на регулярной 100 ms сетке из нерегулярных trades и order book events?

hfttime-gridfeature-engineeringtechnical-explanation

BHFT

ML System Design на техническом собеседовании · BHFT

Открыть вопрос

ML-теорияMedium

Tokenization и multilingual transformer для поиска

Какие риски возникают при использовании multilingual transformer для китайского/международного поиска и как их диагностировать?

transformerstokenizationmultilingualsearch

Яндекс

Техническое собеседование · Яндекс

Открыть вопрос

ML-теорияMedium

Trades и order book как источники признаков

Какие сигналы обычно извлекают из trades и order book при HFT-задаче прогноза цены?

hftorder-bookfeaturestechnical-explanation

BHFT

ML System Design на техническом собеседовании · BHFT

Открыть вопрос

ML-теорияMedium

Training signals и objectives для RecSys

Какие сигналы и loss-функции использовать для обучения recommendation/ranking модели?

loss-functionstraining-dataРанжированиеrecsys

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML-теорияMedium

Transformer attention, токенизация и cross-attention

Transformer attention, токенизация и cross-attention

TransformerattentiontokenizationRoPE

Tochka

Техническое собеседование · Tochka

Открыть вопрос

ML-теорияMedium

Transformer в sequential RecSys

Как использовать transformer в рекомендациях и чем это отличается от RNN-подхода?

TransformerSASRecBERT4RecRNN

HeadHunter

Техническое собеседование · HeadHunter

Открыть вопрос

ML-теорияMedium

Transformers против RNN в NLP

Слышали ли вы про модели transformers? Чем они отличаются от RNN и почему они популярны в NLP?

transformersRNNSelf-attentionsequence modeling

Wisebits / xHamster

Скрининг · Wisebits / xHamster

Открыть вопрос

ML-теорияMedium

Truncated BPTT для длинных последовательностей

Как обучать LSTM на последовательности длиной 100k шагов, если полный backprop слишком дорогой?

lstmbptttraininglong-sequences

BHFT

Техническое собеседование · BHFT

Открыть вопрос

ML-теорияMedium

VLM-теги как признаки для визуального поиска

Можно ли добавлять теги от VLM/image captioning модели в поиск по фото? Где они помогут, а где навредят?

vlmcaptioningvisual-searchfeatures

Wildberries

ML System Design на техническом собеседовании · Wildberries

Открыть вопрос

ML-теорияMedium

База Transformer: токены, positional encoding и cross-attention

База Transformer: токены, positional encoding и cross-attention

Transformerattentiontokenizationpositional encoding

CIAN

Разбор после собеседования · CIAN

Открыть вопрос

ML-теорияMedium

Базовая архитектура Transformer

Коротко объясните, из каких блоков состоит Transformer и какую роль играет attention.

TransformerattentionNLPdl-theory

T1 / PrideInBrains

Техническое собеседование · T1 / PrideInBrains

Открыть вопрос

ML-теорияMedium

Важность признаков в линейных моделях при мультиколлинеарности

Важность признаков в линейных моделях при мультиколлинеарности

linear modelsfeature importancestandardizationmulticollinearity

Tochka

Техническое собеседование · Tochka

Открыть вопрос

ML-теорияMedium

Для задачи матчинга фото еды и категорий что выбрать: CLIP-подход или supervised multilabel classifier?

clipclassificationcontrastive-learningmodel-selection

2GIS

Техническое собеседование · 2GIS

Открыть вопрос

ML-теорияMedium

Когда выбирать линейную модель, а когда tree-based model или boosting?

linear-modelstree-modelsrandom-forestgradient-boosting

AgeCode

Техническое собеседование · AgeCode

Открыть вопрос

ML-теорияMedium

If a YOLO-style detector was trained at one image resolution, what can happen if you run inference at a different resolution? When is it technically possible?

YOLOДетекция объектовfully convolutional networksresolution

Navio

Техническое собеседование · Navio

Открыть вопрос

ML-теорияMedium

Which lightweight model would you use to extract fields such as INN, amount, date and payment purpose from noisy statement text, and what should it output?

NERtoken classificationBERTdocument AI

Tochka

Техническое собеседование · Tochka

Открыть вопрос

ML-теорияMedium

What are the main generation/inference hyperparameters of an LLM and how do they affect output?

LLMtemperaturetop-ptop-k

AgentPlace

Скрининг · AgentPlace

Открыть вопрос

ML-теорияMedium

Градиент и vanishing gradient

Что такое градиент и почему в глубоких сетях возникает затухающий градиент?

backpropagationgradientsvanishing-gradienttechnical-explanation

Sber

Техническое собеседование · Sber

Открыть вопрос

ML-теорияMedium

Градиентный бустинг против Random Forest

Чем gradient boosting отличается от Random Forest и где в бустинге появляется градиент?

gradient-boostingrandom-forestml-theorytechnical-explanation

Raiffeisen Bank

Техническое собеседование · Raiffeisen Bank

Открыть вопрос

ML-теорияMedium

Датасет и разметка food categories

Как собрать датасет и организовать разметку для матчинга фото ресторана с категориями еды?

labelingdatasetcomputer-visiondata-quality

2GIS

ML System Design на техническом собеседовании · 2GIS

Открыть вопрос

ML-теорияMedium

Дискриминативные и генеративные модели

Есть дискриминативные и генеративные модели. Чем они отличаются с математической точки зрения? Приведите примеры современных генеративных моделей.

generative modelsdiscriminative modelsdiffusionGAN

Wisebits / xHamster

Техническое собеседование · Wisebits / xHamster

Открыть вопрос

ML-теорияMedium

Единое embedding space для текста и изображений

Как объединить текстовые и визуальные сигналы в одном retrieval/ranking пространстве?

multimodalembeddingsretrievalrecsys

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML-теорияMedium

Зачем LoRA вместо полного fine-tuning

Почему нельзя просто полностью fine-tune всю LLM? Что выигрывает LoRA и как это влияет на batch size?

lorafine-tuningПамятьllm-training

Mirai

Техническое собеседование · Mirai

Открыть вопрос

ML-теорияMedium

Зачем нужен `torch.no_grad()` на inference

В PyTorch inference код часто оборачивают в `torch.no_grad()`. Что это дает и когда это важно?

PyTorchinferenceno_gradml-engineering

Solmate / TAVAX

Техническое собеседование · Solmate / TAVAX

Открыть вопрос

ML-теорияMedium

Зачем нужны residual connections

Почему residual connections помогают обучать глубокие сети?

residual-connectionsresnetgradientstechnical-explanation

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

ML-теорияMedium

Интуиция Adam, momentum и RMSProp

Интуиция Adam, momentum и RMSProp

ОптимизацияSGDmomentumRMSProp

Tochka

Техническое собеседование · Tochka

Открыть вопрос

ML-теорияMedium

Как loss учитывается при выборе split в бустинге

Как дерево в gradient boosting выбирает split с учетом loss function?

gradient boostingTaylor approximationsplit gainCatBoost

ZingBrain / Aviatrix

Техническое собеседование · ZingBrain / Aviatrix

Открыть вопрос

ML-теорияMedium

Как обнаруживать overfitting и чем регуляризовать

Как обнаруживать overfitting и чем регуляризовать

overfittingregularizationdropoutВалидация

QIC

Техническое собеседование · QIC

Открыть вопрос

ML-теорияMedium

Как обучается градиентный бустинг

Объясните интуицию gradient boosting: что учит каждое следующее дерево и как это связано с loss.

gradient-boostingdecision-treesloss-functionstechnical-explanation

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

ML-теорияMedium

Как работает LoRA fine-tuning

Как работает LoRA fine-tuning

LoRAfine-tuningTransformerlow-rank adaptation

Apriori

Материалы интервью · Apriori

Открыть вопрос

ML-теорияMedium

Как работает LoRA и зачем нужны low-rank adapters

Объясни технически, что делает LoRA при дообучении большой модели и почему это экономит память.

llmlorapeftfine-tuning

FlameTree

Техническое собеседование · FlameTree

Открыть вопрос

ML-теорияMedium

Как работает self-attention в трансформере

Объясните self-attention и основные блоки трансформера так, чтобы было понятно без формального вывода.

Self-attentiontransformersQKVmulti-head attention

Ozon

Техническое собеседование · Ozon

Открыть вопрос

ML-теорияMedium

Как работать с категориальными признаками в ранжировании

В модели есть категориальные признаки товара и пользователя. Как их кодировать и где возникают риски?

categorical featurestarget encodingembeddingsРанжирование

Uzum

Техническое собеседование · Uzum

Открыть вопрос

ML-теорияMedium

Как строить генерацию кандидатов для товарных рекомендаций

Есть рекомендации похожих или сочетаемых товаров. Какие источники кандидатов и признаки можно использовать?

candidate generationitem-to-itemcollaborative filteringВекторный поиск

Uzum

ML System Design на техническом собеседовании · Uzum

Открыть вопрос

ML-теорияMedium

Как уменьшить мерцание маски в видео/VR

Модель сегментирует объект в видео, но маска мерцает и ломается при взаимодействии с человеком. Что делать?

video segmentationmattingtemporal smoothingdepth map

Infomediji

ML System Design на техническом собеседовании · Infomediji

Открыть вопрос

ML-теорияMedium

Как устроены float и зачем нужен bfloat16

Как устроены числа с плавающей точкой? Чем bfloat16 отличается от float16 и почему его используют в нейросетях?

floatfp32fp16bfloat16

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияMedium

Какие признаки дать поисковому реранкеру

После retrieval есть набор кандидатов. Какие признаки использовать для реранжирования и что можно считать заранее?

rerankingfeaturescross featuressearch quality

LifePay

ML System Design на техническом собеседовании · LifePay

Открыть вопрос

ML-теорияMedium

Какие события и масштабы уточнять для CTR

Какие события, сущности и масштабы нужно уточнить перед проектированием ads CTR dashboard?

impressionsclickscapacity-planningtechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML-теорияMedium

Какой market-data feed приходит раньше

По данным с primary и secondary feed нужно понять, через какой канал события приходят на сервер раньше. Как это посчитать корректно?

hftlatencymarket-datafeeds

Wunderfund

Техническое собеседование · Wunderfund

Открыть вопрос

ML-теорияMedium

Когда transformer уместен в поиске и рекомендациях

Почему transformer может быть полезен для поиска/рекомендаций, и когда он избыточен?

transformersrecsysРанжированиеsequence-modeling

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML-теорияMedium

Когда одно дерево решений может обойти Random Forest

Когда одно дерево решений может обойти Random Forest

decision treesRandom Forestbias-variancefeature subsampling

CIAN

Разбор после собеседования · CIAN

Открыть вопрос

ML-теорияMedium

Линейная регрессия и проблемы аналитического решения

Как объяснить линейную регрессию, MSE и почему аналитическое решение через матрицу не всегда удобно?

linear-regressionОптимизацияml-theorytechnical-explanation

Raiffeisen Bank

Техническое собеседование · Raiffeisen Bank

Открыть вопрос

ML-теорияMedium

Минутные счетчики для CTR

Какие агрегаты считать по campaign_id и минутному окну, чтобы строить CTR график?

ctrАгрегацияtime-bucketstechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML-теорияMedium

Обучение visual embeddings для сравнения объектов

Какие loss, backbone и augmentations уместны для embeddings-модели, сравнивающей изображения объектов?

cvembeddingstriplet-lossloss-functions

Corsearch / Navi

Техническое собеседование · Corsearch / Navi

Открыть вопрос

ML-теорияMedium

Переобучение, регуляризация и подбор гиперпараметров

Для бинарной классификации есть очень много признаков. Какие проблемы это создает, как заметить переобучение и как подбирать гиперпараметры без утечки в тест?

overfittingregularizationcross-validationhyperparameters

inDrive

Техническое собеседование · inDrive

Открыть вопрос

ML-теорияMedium

Пост не соответствует выбранному game tag

Как детектировать посты, которые не соответствуют выбранному тегу игры: если есть сильная VLM-модель и если ресурсы ограничены?

content moderationVLMCLIPTF-IDF

GamerAM

ML System Design на техническом собеседовании · GamerAM

Открыть вопрос

ML-теорияMedium

Почему item2vec по сессиям является collaborative сигналом

Если item2vec обучен на последовательностях кликов в сессиях, почему это ближе к collaborative filtering, а не к content-based модели?

item2veccollaborative-filteringsession-embeddingstechnical-explanation

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

ML-теорияMedium

Почему в LSTM явно выделяют time dimension

Какой смысл имеет time dimension в LSTM input и почему порядок шагов важен?

lstmsequence-modelingdeep-learningtechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

ML-теорияMedium

Почему нулевая инициализация ломает нейросети

Почему нулевая инициализация ломает нейросети

neural networksinitializationsymmetry breakingXavier initialization

Wheely

Разбор после собеседования · Wheely

Открыть вопрос

ML-теорияMedium

Почему у BPE-токенизатора почти нет unknown tokens

Почему современные subword tokenizers вроде BPE/SentencePiece редко используют unknown token, и какие trade-off есть у такого подхода?

tokenizationBPELLMnlp-theory

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияMedium

Проблемы item-to-item рекомендаций одежды

Какие особенности и риски есть у item-to-item рекомендаций в fashion каталоге?

fashionitem-to-itemrecommendationstechnical-explanation

BHFT

ML System Design на техническом собеседовании · BHFT

Открыть вопрос

ML-теорияMedium

Сколько forward-pass нужно GPT на train batch

GPT генерирует autoregressive, токен за токеном. Сколько forward-pass нужно сделать для одного training batch и почему?

gptcausal-masktrainingtransformers

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияMedium

Схема события в Kafka для ads CTR

Какая минимальная схема события нужна в Kafka для подсчета CTR кампаний?

kafkaschemaadstechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML-теорияMedium

Устойчивость градиентов, активации, skip connections и инициализация

Устойчивость градиентов, активации, skip connections и инициализация

gradient stabilityReLULeaky ReLUskip connections

Tochka

Техническое собеседование · Tochka

Открыть вопрос

ML-теорияMedium

Фичи для marketplace search ranker

Какие признаки подать в модель ранжирования товаров в поиске маркетплейса?

featuresmarketplacesearchfeature-design

Constructor

ML System Design на техническом собеседовании · Constructor

Открыть вопрос

ML-теорияHard

3D-сегментация dental lesions при ограниченной разметке

3D-сегментация dental lesions при ограниченной разметке

3D medical imagingsegmentationinstance segmentationweak labels

Diagnocat

ML System Design на техническом собеседовании · Diagnocat

Открыть вопрос

ML-теорияHard

ASR для low-resource языка, когда Whisper не справляется

ASR для low-resource языка, когда Whisper не справляется

ASRlow-resource languageslabelingfine-tuning

Chinor

ML System Design на техническом собеседовании · Chinor

Открыть вопрос

ML-теорияHard

DDP и all-reduce overlap при distributed training

Как работает Distributed Data Parallel training и почему overlap gradient all-reduce с backprop помогает ускорить обучение?

DDPall-reducedistributed trainingsystems-ml

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияHard

GenAI-профили пользователей для рекомендаций

Компания генерирует текстовые user profiles из истории пользователя с помощью GPT-like модели. Как использовать такие профили в recommender system?

genaiuser-profilespersonalizationembeddings

OLX

ML System Design на собеседовании · OLX

Открыть вопрос

ML-теорияHard

Long-context training: почему не помещается attention

При обучении на сотнях тысяч токенов обычный/Flash Attention все равно не помещается в GPU. Что раздувает память и какие классы решений есть?

long-contextattention-memorysequence-parallelismtraining

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияHard

ML System Design

How would you train the ranker for real-estate search, choose negatives, and blend paid monetized listings without destroying relevance?

rankernegative samplingpairwise learningmonetization

CIAN

ML System Design из разбора после собеседования · CIAN

Открыть вопрос

ML-теорияHard

ML System Design

How would you use векторный поиск, user clustering and domain-specific text/image embeddings to improve a social-feed recommender?

ANNВекторный поискuser clusteringembeddings

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML-теорияHard

ML System Design

How would you train a two-tower or CLIP-like text-image recommender using user-post interactions?

two-towerCLIPtriplet lossnegative sampling

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML-теорияHard

ML System Design

How would you build and validate a training dataset for extracting transaction fields from many bank-statement formats with limited human labeling?

dataset constructionsynthetic datasamplingВалидация

Tochka

ML System Design на техническом собеседовании · Tochka

Открыть вопрос

ML-теорияHard

Negative sampling и embeddings без таргета

Какие проблемы есть у in-batch negatives и как обучать embeddings объявлений, если пользовательских действий еще нет?

negative samplingin-batch negativesself-supervised learningembeddings

HeadHunter

ML System Design на техническом собеседовании · HeadHunter

Открыть вопрос

ML-теорияHard

Open vocabulary цвета и атрибутов

Каталог содержит много цветов и текстовых описаний, а пользователи ищут по фото. Как извлекать и использовать цветовые атрибуты, если словарь не полностью закрыт?

attributescoloropen-vocabularymultimodal

Wildberries

ML System Design на техническом собеседовании · Wildberries

Открыть вопрос

ML-теорияHard

Self-distillation и DINO

Что такое self-distillation и зачем модель учить на собственных предсказаниях? Как устроен DINO-style teacher-student подход?

self-distillationDINOteacher-studentEMA

Wisebits / xHamster

Техническое собеседование · Wisebits / xHamster

Открыть вопрос

ML-теорияHard

Self-supervised pretraining на unlabeled sequences

Есть много неразмеченных driving/log sequences и мало labels для редких событий. Какие self-supervised подходы можно использовать до supervised fine-tuning?

self-supervised-learningsequence-modelingrepresentation-learningpretraining-objectives

Waymo

ML System Design из фидбека после собеседования · Waymo

Открыть вопрос

ML-теорияHard

UCB при большом action space

Почему UCB может быть плохой идеей при 1000 actions и горизонте 2000 или 20 шагов? Что делать вместо этого?

banditsucbexplorationml-theory

Mirai

Техническое собеседование · Mirai

Открыть вопрос

ML-теорияHard

VLM для распознавания еды: точность vs latency

Большая VLM неплохо распознает блюда, если дать ей фото и меню, но отвечает десятки секунд. Как использовать такую модель в продукте с жестким latency?

computer-visionvlmdistillationlatency

CV catering

ML System Design на техническом собеседовании · CV catering

Открыть вопрос

ML-теорияHard

Выбор фото блюда для категории

Есть много фотографий ресторана и фиксированные категории еды. Как выбрать наиболее подходящее фото для категории в поисковой выдаче?

computer-visionclipretrievalРанжирование

2GIS

ML System Design на техническом собеседовании · 2GIS

Открыть вопрос

ML-теорияHard

Зачем нужен KV cache при inference LLM

При autoregressive generation модель генерирует токены по одному. Что такое KV cache и как он ускоряет inference?

KV cacheattentionLLM inferencellm-internals

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияHard

Как персонализировать item-page карусель автомобилей

На странице конкретного автомобиля все пользователи видят одинаковые item-to-item рекомендации. Как добавить персонализацию, сохранив связь с текущим item и низкую latency?

motorsitem-to-itemuser-to-itempersonalization

OLX

ML System Design на собеседовании · OLX

Открыть вопрос

ML-теорияHard

Как подавать разнотипные признаки в трансформер для RecSys

Есть числовые, категориальные и поведенческие признаки пользователя и товара. Как превратить их во вход трансформера?

feature encodingtransformerscategorical featuresuser embeddings

Ozon

ML System Design на техническом собеседовании · Ozon

Открыть вопрос

ML-теорияHard

Как превратить текстовый запрос в кандидатов для поиска недвижимости

Пользователь пишет свободный текстовый запрос по недвижимости, в котором могут быть частые атрибуты и редкие бытовые детали. Как превратить такой query в кандидатов через structured attributes, полнотекстовый поиск и векторный поиск?

semantic searchattribute extractionВекторный поискBM25

CIAN

ML System Design из разбора после собеседования · CIAN

Открыть вопрос

ML-теорияHard

На что уходит GPU memory при training LLM

На какие сущности уходит GPU memory при обучении LLM, и почему KV cache обычно используют на inference, а не на training?

llm-traininggpu-memorykv-cacheoptimizer-state

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML-теорияHard

Переписывание мультимодального запроса

Пользователь отправляет картинку и короткий текстовый запрос. Как переписать это в поисковый запрос, который лучше работает с существующим поиском?

vlmquery-rewritingsearchmultimodal

Яндекс

ML System Design на техническом собеседовании · Яндекс

Открыть вопрос

ML-теорияHard

Почему time-series модель может развалиться после хорошего offline

Модель на временном ряде показывает хороший offline score, но в реальности не работает. Какие причины проверить первыми?

time-seriesВалидацияdata-leakagetechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

ML-теорияHard

Ревью notebook: leakage и gap между train/test

На ревью notebook для временного ряда нужно найти leakage. Что проверять в feature generation и split?

notebook-reviewdata-leakageВалидацияtechnical-explanation

BHFT

Техническое собеседование · BHFT

Открыть вопрос

ML-теорияHard

Токенизация и BERT-style разметка против autoregressive rewriting

Токенизация и BERT-style разметка против autoregressive rewriting

BERTautoregressive modelstokenizationsequence labeling

Constructor

Техническое собеседование · Constructor

Открыть вопрос

ML-теорияHard

Фильтрация web search результатов для brand protection

Спроектируйте систему, которая ищет в интернете потенциальные нарушения бренда и фильтрует массу нерелевантных результатов для 1000+ клиентов.

searchmoderationbrand-protectionretrieval

Corsearch / Navi

ML System Design на техническом собеседовании · Corsearch / Navi

Открыть вопрос

Банк вопросов из реальных собеседований — ML Mentor