Назад к тренажеру

Банк вопросов из реальных собеседований

Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.

Все вопросы

Полный банк вопросов из реальных собеседований.

ML-теория

Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.

Python

Устройство языка, структуры данных, тестирование и инженерная база.

SQL

Запросы, агрегации, оконные функции и объяснение результата.

ML System Design

Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.

Метрики и A/B

Качество моделей, продуктовые метрики, эксперименты и валидация.

Продуктовые кейсы

Как разложить задачу продукта, ограничения, риски и первый бейзлайн.

Математика и статистика

Вероятность, статистика, оценки, распределения и аккуратные допущения.

Behavioral Interview

Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.

ML System Design

259 вопросов из реальных интервью

Открыть в общем банке

Темы

Сложность

Компания

Язык

Поиск

ВопросКомпанияИсточникДействие

ML System DesignEasy

Production-readiness ML-системы

Как проверить, что ML-система готова к production: какие контракты, rollout, мониторинг, rollback и quality gates нужны перед запуском?

production MLrolloutmonitoringrollback

Satel Generation

Вопрос про production ML на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignEasy

RAG простыми словами

Как объяснить RAG простыми словами: retrieval, augmentation и generation, и почему это похоже на двухстадийные рекомендации?

ragretrievalllmsimple-explanation

Dubai Tech

RAG-вопрос на техническом собеседовании

Открыть вопрос

ML System DesignEasy

Быстрый baseline ранжирования лучше random

Есть релевантные кандидаты поиска, но финальный порядок случайный. Какое простое решение можно запустить быстро?

search-rankingbaselinemarketplacescope-reduction

Constructor

ML System Design на техническом собеседовании · Constructor

Открыть вопрос

ML System DesignEasy

Для чего нужен Docker multistage build

Интервьюер спрашивает: зачем в Dockerfile нужен multistage build и что он дает в production?

dockerdeploymentbackendmlops

FlameTree

Вопрос про production ML на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignEasy

Что такое cold start для пользователя и item

Как объяснить cold start в RecSys и какие практичные решения предложить для нового пользователя и нового item?

recsyscold-startfallbacksfundamentals

Dodo

ML System Design на скрининге · Dodo

Открыть вопрос

ML System DesignMedium

A/B metrics и guardrails для доставки

Какие offline, online и guardrail-метрики выбрать для A/B-теста динамической стоимости доставки?

ab-testingМетрикиguardrailsexperiment-design

Dodo

Вопрос по метрикам на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Airflow-пайплайн для обучения и inference

Как устроить Airflow-пайплайн для регулярного переобучения и offline inference модели? Какие компоненты, артефакты и оптимизации нужны?

AirflowDAGoffline inferenceGPU utilization

GamerAM

Вопрос про production ML на техническом собеседовании · GamerAM

Открыть вопрос

ML System DesignMedium

ALS и матричная модель для cart recommendations

Как использовать уже существующую матричную модель или ALS в задаче рекомендаций к текущей корзине, не потеряв постановку item-to-cart?

matrix-factorizationalscart-recommendationspersonalization

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Baseline для рекомендаций в корзине через item-item co-occurrence

Нужно сделать рекомендации товаров в блоке корзины: 10 млн пользователей и 100 тыс. товаров. Как построить простой baseline через совместные покупки?

recsyscartitem-itembaseline

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

BERT vs GPT: в чем архитектурная разница

Объясните разницу между BERT-like encoder моделями и GPT-like decoder моделями, и почему они подходят для разных задач.

BERTGPTTransformersllm-theory

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML System DesignMedium

BERT: encoder, pretraining и attention

Что такое BERT, чем encoder отличается от decoder и какие pretraining-механизмы у BERT?

berttransformerattentionnlp

Sber

Техническое собеседование · Sber

Открыть вопрос

ML System DesignMedium

Cache и latency в рекомендательной системе

Как проектировать caching и latency budget для recommendation API?

cachinglatencyservingrecsys

DROM

Вопрос про production ML на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Classified marketplace vs ecommerce для ML

Чем classified marketplace отличается от ecommerce для pricing, ranking и recommendation моделей?

classifiedsmarketplaceecommerceРанжирование

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Continuous batching в LLM inference

Что такое continuous batching и зачем он нужен в inference больших языковых моделей?

llm-servingcontinuous-batchinginferencesystems

Mirai

Вопрос про production ML на техническом собеседовании · Mirai

Открыть вопрос

ML System DesignMedium

Data drift и мониторинг production-модели

Что такое data drift, как его выявлять в данных и какие сигналы мониторить у ML-модели в production?

data driftmodel monitoringPSIKolmogorov-Smirnov

inDrive

Вопрос про production ML на техническом собеседовании · inDrive

Открыть вопрос

ML System DesignMedium

Deterministic orchestration вместо свободного агента

Когда в LLM-ассистенте лучше deterministic routing, а не свободный agent/tool calling?

LLM-агентыroutingtool callingguardrails

TripleTen

RAG-вопрос на техническом собеседовании · TripleTen

Открыть вопрос

ML System DesignMedium

Endpoint с watchdog и устойчивым поведением

Как спроектировать endpoint, который вызывает нестабильный downstream или долгий pipeline и должен корректно переживать сбои?

Надежностьwatchdogapitimeouts

PulsePoint

Вопрос про production ML на техническом собеседовании · PulsePoint

Открыть вопрос

ML System DesignMedium

Event stream вместо одного summary из LLM

Как превратить документы в признаки для прогноза: один summary, JSON-state или ленту событий?

llm-extractionevent-streamstructured-outputforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Function calling и structured output в LLM-приложении

Как работает function calling и как добиться корректного structured output?

function callingstructured outputconstrained decodingLLM-агенты

Waibee

RAG-вопрос на техническом собеседовании · Waibee

Открыть вопрос

ML System DesignMedium

Hidden student profile и prompt injection

Как использовать скрытый профиль студента и не дать пользователю вытащить его через prompt injection?

prompt injectionprivacyhidden contextguardrails

TripleTen

RAG-вопрос на техническом собеседовании · TripleTen

Открыть вопрос

ML System DesignMedium

High-level pipeline для CTR dashboard

Как разложить realtime CTR dashboard на ingestion, stream aggregation, storage и API?

Потоковая обработкаolapdashboardtechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Kafka, S3 и ClickHouse: роли компонентов

В realtime CTR dashboard есть поток impression/click events. Как разделить роли Kafka, S3 и ClickHouse?

kafkaclickhousestorageПотоковая обработка

Ads / Marketplace

Вопрос про production ML на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Leakage из pretraining LLM на историческом backtest

Почему исторический backtest LLM-фичей может быть нечестным, даже если документы подаются с правильными датами?

llmdata-leakagebacktestingforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

LLM JSON extraction, контекст филиала и оценка качества

LLM JSON extraction, контекст филиала и оценка качества

LLMJSON extractionRAGevaluation

Chinor

RAG-вопрос на техническом собеседовании · Chinor

Открыть вопрос

ML System DesignMedium

Location и image quality признаки объявления

Как использовать локацию и качество изображений в pricing/recommendation модели объявления, не смешивая качество товара с качеством фото?

locationimage-qualityfeature-engineeringmarketplace

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Long tail и novelty у item-item baseline

Какие слабые места появляются у item-item co-occurrence baseline для корзины: long tail, новые товары, популярность и novelty?

item-itemlong-tailnoveltycold-start

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Monitoring и audit для рекомендаций

Какие логи, метрики и алерты нужны после запуска рекомендательной модели?

monitoringobservabilityalertsrecsys

DROM

Вопрос про production ML на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Multi-head attention как PyTorch-модуль

Multi-head attention как PyTorch-модуль

multi-head attentionPyTorchtensor shapesTransformer

Diagnocat

Техническое собеседование · Diagnocat

Открыть вопрос

ML System DesignMedium

Multimodal признаки в RecSys pipeline

Как добавить текстовые и визуальные признаки в рекомендательную систему без поломки serving pipeline?

multimodalfeature-storeembeddingsrecsys

DROM

ML System Design на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

MVP без истории взаимодействий

Какой baseline запустить для новой видео-ленты, если по ней еще нет кликов и покупок?

baselinecold-startexplorationproduct-thinking

Самокат

ML System Design на техническом собеседовании · Самокат

Открыть вопрос

ML System DesignMedium

Native PDF или OCR: как выбрать путь обработки

В invoice parsing часть документов native PDF, часть сканы. Как определить, какой путь обработки использовать и какие ошибки ждать?

OCRPDF parsinglayoutdata-quality

Vertex / BP

Техническое собеседование · Vertex / BP

Открыть вопрос

ML System DesignMedium

Online inference и latency budget в RecSys

Как организовать online inference, если модель рекомендаций тяжелая и должна отвечать в latency budget?

servinglatencyinferencerecsys

GRII RED

Вопрос про production ML на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Online serving архитектура реранкера

Как встроить ML-реранкер в существующий поиск, если candidate generation уже возвращает itemIds?

servingfeature-storelatencyml-architecture

Constructor

Вопрос про production ML на техническом собеседовании · Constructor

Открыть вопрос

ML System DesignMedium

Online и offline рекомендации под latency constraints

Какие подходы к рекомендациям можно использовать и как выбирать между offline precompute и online inference, если важны latency, RPS и качество?

online servingoffline inferencelatencyfeature freshness

GamerAM

ML System Design на техническом собеседовании · GamerAM

Открыть вопрос

ML System DesignMedium

Online-метрики: нашел ли пользователь ответ в статьях

Поиск по статьям можно оценивать offline, но продукту важно, помог ли он пользователю. Какие online-сигналы это показывают?

searchonline-metricsevaluationux

AgeCode

Вопрос по метрикам на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignMedium

Online-фичи кухни и доставки для pricing

Какие свежие операционные признаки кухни и курьеров доступны для модели стоимости доставки, и как отделить их от стабильных user/unit features?

online-featureskitchen-loadcourier-statusfeature-store

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Output record для CTR time series

Какую строку должен писать stream job в хранилище агрегатов для dashboard?

clickhousetime-seriesschematechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Production-loop для CV модели после rollout

После запуска CV модели на реальных точках появляются ошибки, новые блюда и новые условия съемки. Как построить поддержку и дообучение?

computer-visionmlopsactive-learningmonitoring

CV catering

Вопрос про production ML на техническом собеседовании · CV catering

Открыть вопрос

ML System DesignMedium

RAG-вопрос

Explain how LLM tool/function calling works end to end: tool schema in the prompt, model output, real tool execution and final user response.

LLM-агентыtool callingfunction callingstructured output

Apriori

RAG-вопрос из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

RAG-вопрос

Design the end-to-end сценарий for a RAG system: data preparation, vector index ingestion and serving-time retrieval.

RAGchunkingembeddingsHNSW

Apriori

RAG-вопрос из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

RAG-вопрос

A video-analytics platform wants an assistant that answers support requests using documentation and prior tickets. How would you design the RAG system?

RAGsupport automationretrievalevaluation

3DEYE

RAG-вопрос на скрининге · 3DEYE

Открыть вопрос

ML System DesignMedium

RAG-вопрос

A векторный поиск returns top-k nearest items, but all results are too similar to each other. How can you keep relevance while increasing diversity?

Векторный поискdiversityMMRreranking

Fashion AI startup, не подтверждено

RAG-вопрос на техническом собеседовании · Fashion AI startup, не подтверждено

Открыть вопрос

ML System DesignMedium

Retraining и обновление векторного индекса

Каталог и фотографии постоянно меняются. Как организовать переобучение модели и обновление ANN-индекса для visual search?

ann-indexretrainingcatalogmlops

Wildberries

Вопрос про production ML на техническом собеседовании · Wildberries

Открыть вопрос

ML System DesignMedium

RoPE и positional embeddings в GPT

Какие бывают positional embeddings в Transformer и как работает RoPE?

ropepositional-embeddingslong-contexttransformers

Sber / GigaChat

Техническое собеседование · Sber / GigaChat

Открыть вопрос

ML System DesignMedium

Schema linking и NER в доменной базе

Пользователь пишет естественный запрос к большой корпоративной базе. Как матчить сущности, аббревиатуры, таблицы и колонки?

text2sqlschema-linkingnermetadata

Sber

RAG-вопрос на техническом собеседовании · Sber

Открыть вопрос

ML System DesignMedium

Seller features в модели цены объявления

Почему признаки продавца могут помогать pricing или ranking модели в classified marketplace, и какие риски нужно контролировать?

seller-featurespricingmarketplacefairness

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Serving VLM: latency, cost и fallback

Как выкатывать тяжелую VLM в продукт, где есть ограничения по latency и стоимости?

vlmservinglatencycost

Яндекс

Вопрос про production ML на техническом собеседовании · Яндекс

Открыть вопрос

ML System DesignMedium

Serving с учетом текущего состояния корзины

Корзина меняется в текущей сессии. Как online serving должен учитывать add/remove item, cache invalidation и fallback?

online-servingsession-featuresКешcart-state

GRII RED

Вопрос про production ML на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

State для планового производства

Как хранить извлеченный из документов план производства, чтобы новые отчеты корректно обновляли forecast features?

feature-storestatellm-extractionforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Structural break в прогнозе добычи

Почему модель на исторической добыче может резко ошибиться, если компания инвестирует в новый способ добычи или расширение рудника?

forecastingstructural-breakinvestmentstime-series

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Substitutes vs complements в корзине

Почему рекомендация похожего кольца к уже добавленному кольцу может быть хуже, чем рекомендация комплементарной категории?

complementssubstitutescategory-constraintscart

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Tabular baseline для прогноза добычи

Нужно прогнозировать поквартальную добычу по рудникам. Какие признаки и baseline-модель стоит построить до LLM-слоя?

forecastingtabular-mlfeature-engineeringbaseline

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Translation baseline против native generation

Для международного поиска можно перевести уже существующее описание или генерировать новое на целевом языке. Как сравнить подходы?

translationlocalizationgenerationbaseline

Яндекс

ML System Design на техническом собеседовании · Яндекс

Открыть вопрос

ML System DesignMedium

VAD и разделение спикеров в пайплайнах обработки звонков

VAD и разделение спикеров в пайплайнах обработки звонков

VADdiarizationASRsegmentation

Chinor

Техническое собеседование · Chinor

Открыть вопрос

ML System DesignMedium

VLM и чат-ассистент поверх поиска недвижимости

Как встроить VLM, поиск по картинкам и чат-ассистента в продукт поиска недвижимости так, чтобы они дополняли основной retrieval/ranking, а не заменяли его?

VLMRAGassistantreal-estate search

CIAN

RAG-вопрос из разбора после собеседования · CIAN

Открыть вопрос

ML System DesignMedium

W8A8, W4A16 и схемы quantization

Чем отличаются схемы quantization для LLM inference и какие trade-off нужно назвать?

quantizationllm-servinginferenceПамять

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Адаптация LLM к медицинской терминологии

Адаптация LLM к медицинской терминологии

medical LLMRAGSFTLoRA

Diagnocat

RAG-вопрос из фидбека после собеседования · Diagnocat

Открыть вопрос

ML System DesignMedium

Архитектура RAG/поисковой системы для документов

Нужно построить систему, которая ищет по внутренним документам и помогает отвечать на вопросы. Какой пайплайн спроектировать?

RAGdocument searchchunkingembeddings

LifePay

RAG-вопрос на техническом собеседовании · LifePay

Открыть вопрос

ML System DesignMedium

Безопасный rollout ONNX-модели в production

Как безопасно выкатить новую версию ONNX-модели в production: какие проверки сделать до релиза, как включать трафик, что мониторить и как быстро откатиться?

production incidentONNXrollbackdatabase publish

CIAN

Вопрос про production ML из разбора после собеседования · CIAN

Открыть вопрос

ML System DesignMedium

Бизнес-метрики и model metrics

Как связать бизнес-метрики продукта с offline-метриками рекомендательной модели?

Метрикиab-testingrecsysmodel-evaluation

DROM

Вопрос по метрикам на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Варианты speculative decoding

Какие варианты speculative decoding встречаются в LLM serving и чем они отличаются на уровне реализации?

llm-servingspeculative-decodinginference-optimizationtechnical-explanation

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Векторный и полнотекстовый поиск

Чем векторный поиск отличается от полнотекстовый поиск и почему часто нужен hybrid?

Векторный поискПолнотекстовый поискГибридный поискembeddings

Unimatch

RAG-вопрос на техническом собеседовании · Unimatch

Открыть вопрос

ML System DesignMedium

What main architecture families are used for generative models, and where are they commonly applied?

generative modelsautoregressive modelsdiffusionGAN

AgentPlace

Скрининг · AgentPlace

Открыть вопрос

ML System DesignMedium

Explain the difference between BERT and GPT in terms of Transformer architecture and training objective.

BERTGPTTransformerMLM

Fashion AI startup, не подтверждено

Техническое собеседование · Fashion AI startup, не подтверждено

Открыть вопрос

ML System DesignMedium

Вопрос по метрикам

How would you evaluate the full search pipeline and its individual components offline and online?

search evaluationoffline metricsA/B testingslices

CIAN

Вопрос по метрикам из разбора после собеседования · CIAN

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

A 72B-parameter LLM is served on an A100 80GB. Estimate whether FP16 fits and explain what quantization changes.

LLM servingGPU memoryFP16INT4

Apriori

Вопрос про production ML из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

A production service already has data, but you need to change the database schema. Describe a safe миграцию.

database migrationsschema evolutionbackfillrollback

Apriori

Вопрос про production ML из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

Explain the difference between a Kubernetes pod, service, deployment and node.

Kubernetespodservicedeployment

Apriori

Вопрос про production ML из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

A deployed ML service has 300 ms latency, but the product now needs 30 ms. What do you investigate and what optimizations can you try?

ML servinglatencyONNXTensorRT

inDrive

Вопрос про production ML на техническом собеседовании · inDrive

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

Explain at a high level how TensorRT or similar inference optimizers speed up neural networks, and why INT8 quantization usually needs calibration.

TensorRTONNXquantizationcalibration

Navio

Вопрос про production ML на техническом собеседовании · Navio

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

After launching a feed recommender, how do you decide when and how to retrain the models?

MLOpsretrainingdata driftmonitoring

T-Bank

Вопрос про production ML на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

When would you choose a columnar database over Redis, MongoDB or a row-oriented relational database for ML/data pipelines?

columnar storageClickHouseRedisMongoDB

Palabra.ai

Вопрос про production ML на скрининге · Palabra.ai

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

What mechanisms would you add so important ML datasets do not disappear because of human error or operational mistakes?

backupsdata safetyversioningaccess control

Palabra.ai

Вопрос про production ML на скрининге · Palabra.ai

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

A speech-AI pipeline needs fast analytical queries over training-data processing events. What requirements would you give DevOps before asking for ClickHouse?

ClickHousespeech AIanalyticscapacity planning

Palabra.ai

Вопрос про production ML на техническом собеседовании · Palabra.ai

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

A neural network inference pipeline is too slow. What optimizations would you consider before changing the model architecture?

inference optimizationONNXTensorRTbatching

Palabra.ai

Вопрос про production ML на техническом собеседовании · Palabra.ai

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

How can you increase LLM serving throughput or batch size on the same GPU without buying a larger GPU?

LLM servingbatchingquantizationKV cache

Fashion AI startup, не подтверждено

Вопрос про production ML на техническом собеседовании · Fashion AI startup, не подтверждено

Открыть вопрос

ML System DesignMedium

Вопрос про production ML

You have a multi-GPU server and want to host one or more open-source LLMs. What software stack and design choices would you use?

LLM servingvLLMGPU memoryquantization

LLM-роль в Dubai, компания не подтверждена

Вопрос про production ML на скрининге · LLM-роль в Dubai, компания не подтверждена

Открыть вопрос

ML System DesignMedium

Выбор архитектуры RecSys под команду и бюджет

Как сравнивать архитектурные варианты recommender-системы и выбрать устойчивый вариант?

architecturetradeoffsrecsysproduction

DROM

Вопрос про production ML на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Выбор и настройка векторный поиск для рекомендаций

Как выбрать FAISS, HNSW-based CPU индекс, Redis, Qdrant или Elasticsearch для поиска ближайших embedding? Какие параметры и метрики смотреть?

ANNHNSWFAISSRedis

GamerAM

ML System Design на техническом собеседовании · GamerAM

Открыть вопрос

ML System DesignMedium

Выбор модели для production в marketplace

Как выбирать production-модель для marketplace pricing/recommendation задачи, если offline score у сложной модели выше?

model-selectionproductionlatencyinterpretability

OLX

Вопрос про production ML на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Где bottleneck при генерации simulation data

Для редких дорожных сценариев можно генерировать synthetic/simulation data. Где главный bottleneck и как использовать такие данные в retrieval-системе?

simulationsynthetic-dataautonomous-drivingВалидация

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignMedium

Где в Transformer применяется Mixture of Experts

В MoE LLM где обычно находится Mixture of Experts: в каком слое Transformer и зачем это делают?

Mixture of ExpertsTransformerfeed-forward networkrouting

Toloka AI

Техническое собеседование · Toloka AI

Открыть вопрос

ML System DesignMedium

Где искать latency, quality и cost деградацию LLM-сервиса

LLM-сервис стал медленнее, хуже или дороже. Какие проверки делать?

LLM servingobservabilitylatencycost

Unimatch

Вопрос про production ML на техническом собеседовании · Unimatch

Открыть вопрос

ML System DesignMedium

Генерация кандидатов и реранжирование в поиске маркетплейса

Как построить архитектуру поиска: от первичных кандидатов до финального ранжирования?

candidate generationBM25Векторный поискreranking

Uzum

ML System Design на техническом собеседовании · Uzum

Открыть вопрос

ML System DesignMedium

Граница backend и ML-сервиса рекомендаций

Где провести границу между продуктовым backend, ML-сервисом, feature store и business rules?

backendml-servingapi-designrecsys

DROM

Вопрос про production ML на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Граница item-to-item и персонализации

Как объяснить, где заканчивается item-to-item рекомендация к корзине и начинается персонализированный user recommender?

item-to-itempersonalizationРанжированиеcart

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Границы pricing-системы при закрепленных курьерах

Курьеры закреплены за юнитом и зоной, а pricing-система не управляет расписанием. Как это ограничение должно повлиять на дизайн ML решения?

domain-constraintsdeliverydecision-policylogistics

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Группы признаков для recommender

Какие группы признаков стоит назвать в RecSys ML System Design: user, item, context и инженерные фичи?

feature-engineeringrecsysfeature-storetechnical-explanation

DROM

ML System Design на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Датасет и labels для RecSys ML System Design

Где брать positive/negative examples для рекомендательной системы и что считать ground truth?

recsysdatasetlabelsoffline-validation

DROM

ML System Design на техническом собеседовании · DROM

Открыть вопрос

ML System DesignMedium

Зачем нужны positional embeddings в Transformer

Для чего нужны positional embeddings и какие виды positional embeddings используются в LLM?

transformerpositional-embeddingsropeattention

Huawei

Техническое собеседование · Huawei

Открыть вопрос

ML System DesignMedium

Зачем рекомендательная система, если заказчик может вручную менять поставщиков

Заказчик может удалить предложенных поставщиков и добавить своих. Как объяснить ценность рекомендательной системы в таком продукте и какие метрики из этого следуют?

product-valueb2b-marketplacerecsysМетрики

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignMedium

Из каких компонентов состоит LLM-агент

Нужно объяснить архитектуру LLM-агента: какие основные блоки нужны, где хранится контекст и как агент вызывает инструменты.

LLM-агентыtoolscontextRAG

Flametree

RAG-вопрос на техническом собеседовании · Flametree

Открыть вопрос

ML System DesignMedium

Инференс-пайплайн и cold start в подборе поставщиков

Как обработать новый закупочный запрос и что делать с новыми закупщиками, новыми поставщиками и редкими категориями?

inferencecold-startservingfallbacks

Fairmarkit

Вопрос про production ML на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignMedium

Как LLM работает на инференсе

Интервьюер просит объяснить базовый inference loop LLM: что подается на вход, что модель возвращает и как получается следующий токен.

llminferencegenerationlogits

FlameTree

RAG-вопрос на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Как offline-предсказания попадают в production

Если embeddings, scores или recommendation lists считаются offline и лежат в S3/DWH, как безопасно передать эти результаты backend/serving-слою?

offline inferencemodel registryS3Redis

GamerAM

Вопрос про production ML на техническом собеседовании · GamerAM

Открыть вопрос

ML System DesignMedium

Как VLM обрабатывает изображение вместе с текстом

Как visual language model принимает картинку на вход: что делает vision encoder, как появляются visual tokens и как они совмещаются с текстом?

vlmvision-transformervisual-tokensmultimodal

Huawei

Техническое собеседование · Huawei

Открыть вопрос

ML System DesignMedium

Как встроить модель возврата в продукт

Модель уже умеет предсказывать вероятность возврата. Как ее применить в продукте и где хранить признаки?

model servingfeature storebatch inferencepush notifications

Mayflower

Вопрос про production ML на техническом собеседовании · Mayflower

Открыть вопрос

ML System DesignMedium

Как выбрать text encoder для запросов к дорожным сценам

Пользователь пишет запросы вроде "pedestrian crossing at night". Как выбрать и адаптировать text encoder для поиска дорожных сцен?

text-encoderembeddingsdomain-adaptationretrieval

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignMedium

Как выкатывать новые признаки и модели в сервис ранжирования

Команда хочет добавить новые признаки или модель в ранжирующий сервис. Как сделать это безопасно?

ranking servicefeature rolloutA/B testingmonitoring

Uzum

Вопрос про production ML на техническом собеседовании · Uzum

Открыть вопрос

ML System DesignMedium

Как генерировать suggest-вопросы из статей

Для статьи нужно показать короткие suggest-вопросы или подсказки. Как получить их из текста статьи и не ухудшить качество поиска?

suggestsummarizationsearchcontent-quality

AgeCode

RAG-вопрос на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignMedium

Как заранее понять пользу audio-event фичи

Есть новая возможность: по аудио понять событие вокруг пользователя, например лай собаки, открытие двери или разбитое стекло. Как до обучения модели понять, есть ли продуктовая польза?

product-mlaudio-classificationassistantuser-value

Sber / GigaChat

ML System Design на техническом собеседовании · Sber / GigaChat

Открыть вопрос

ML System DesignMedium

Как зафиксировать задачу CTR dashboard

С чего начать system design для realtime dashboard CTR рекламных кампаний?

adsctrrequirementstechnical-explanation

Ads / Marketplace

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Как интерпретировать backtest при возможном leakage

Как сравнивать модели прогноза, если LLM-extractor может знать будущие факты из pretraining?

backtestingУтечкиmodel-comparisonforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Как оптимизировать LLM inference pipeline

Как оптимизировать LLM inference pipeline: routing, batching, serving, latency и стоимость? Какие рычаги ускорения и удешевления стоит назвать?

llminferenceservingbatching

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Как оценивать качество RAG-системы

Как оценивали качество: насколько хорошо получается вести диалог, отвечать на вопрос или искать нужные документы?

ragevaluationМетрикиretrieval

Satel Generation

Вопрос по метрикам на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignMedium

Как оценивать поиск/RAG по статьям offline и online

Как понять, что система поиска по статьям или RAG работает хорошо? Какие offline и online метрики использовать?

searchragevaluationМетрики

AgeCode

Вопрос по метрикам на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignMedium

Как поставить задачу раннего VIP-прогноза

В casino-продукте sales-команде нужно как можно раньше понять, станет ли новый игрок VIP по депозитам и обороту. Как сформулировать ML-задачу, target, горизонт прогноза и бизнес-действие?

classic-mlcasinotarget-definitionbusiness-objective

MrBit

ML System Design на техническом собеседовании · MrBit

Открыть вопрос

ML System DesignMedium

Как построить модель распознавания аудио-событий

Как технически построить модель, которая по аудио определяет событие: лай собаки, звук двери, разбитое стекло и похожие классы?

audio-classificationspectrogrammodelingedge-ml

Sber / GigaChat

ML System Design на техническом собеседовании · Sber / GigaChat

Открыть вопрос

ML System DesignMedium

Как посчитать поток событий для CTR dashboard

Нужно построить систему, где рекламодатель смотрит CTR кампаний. Дано 200 млрд показов в день и CTR около 1%. Как начать system design с чисел?

system-designadsctrcapacity-planning

Компания не указана

Вопрос про production ML на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Как проверить, стоит ли менять LLM на новую open-source модель

Вышла новая open-source LLM. Как проверить, станет ли она лучше текущей модели в продукте и стоит ли ее внедрять?

llmevaluationmodel-selectionproduction

FlameTree

Вопрос про production ML на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Как работает токенизатор и зачем его обучать

Интервьюер просит рассказать про токенизатор: какие бывают алгоритмы, как он работает и нужно ли его обучать под домен или язык?

llmtokenizationbpesentencepiece

FlameTree

RAG-вопрос на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Как разделить suggest и свободный поиск по статьям

В продукте есть база статей. Пользователь может видеть подсказки или задавать свободный вопрос. Как разделить эти два режима в дизайне поиска?

searchsuggestragproduct-requirements

AgeCode

RAG-вопрос на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignMedium

Как собрать данные и классы для модели модерации

Для moderation-модели нужны классы и данные. Как собрать labels, обработать дисбаланс и не смешать разные политики в один шумный датасет?

moderationtraining-datalabelingclass-imbalance

Satel Generation

ML System Design на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignMedium

Как сформулировать ML System Design-задачу подбора поставщиков

Fairmarkit -- маркетплейс для корпоративных закупок: заказчик создает заявку, а система предлагает подходящих поставщиков. Как сформулировать ML-задачу подбора поставщиков перед выбором модели?

подбор поставщиковb2brecsysproblem-framing

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignMedium

Как считать online-фичу нагрузки курьеров

В delivery pricing модели нужна фича нагрузки курьеров. Из каких событий и состояний ее считать, чтобы она была пригодна для online decisioning?

online-featurescourier-loadfeature-engineeringdelivery

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Как устроена autoregressive generation и зачем KV cache

Как LLM генерирует ответ токен за токеном и какую роль в этом играет KV cache?

llmautoregressive-generationkv-cachedecoding

FlameTree

RAG-вопрос на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Как устроена архитектура Transformer

Расскажи базовую архитектуру Transformer: encoder/decoder, self-attention, Q/K/V, positional encoding и отличия GPT/BERT.

transformerSelf-attentionpositional-encodingnlp

Wildberries

Материалы интервью · Wildberries

Открыть вопрос

ML System DesignMedium

Как устроить BERT-based moderation inference service

Нужно развернуть сервис модерации текста на BERT/DistilBERT. Как спроектировать input/output, policy layer, thresholds и routing actions?

moderationbertinference-servicepolicy-layer

Satel Generation

Вопрос про production ML на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignMedium

Как учитывать категории и комплементарность в корзине

Если пользователь добавил кольцо, стоит ли рекомендовать еще кольца? Как сформулировать цель и ограничения для рекомендаций в корзине?

recsysdiversitycomplementsbusiness-rules

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Как учитывать сезонность в рекомендациях и прогнозах

Ты упомянул сезонность. Как с ней работать в фичах для рекомендационных систем, прогнозов или продуктовой аналитики?

recsysseasonalityfeaturestime-series

Almus

ML System Design на собеседовании · Almus

Открыть вопрос

ML System DesignMedium

Как часто пересчитывать стоимость доставки в корзине

Клиент видит стоимость доставки или порог бесплатной доставки в корзине. Каталог и корзина меняются, а на чек-ауте нельзя показать другую цену и вызвать негатив. Как спроектировать пересчет и где провести границу между точностью, latency и стоимостью?

recsyspricingdeliverymonetization

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Какая архитектура эмбеддингов была в RAG

Какую архитектуру эмбеддингов вы построили для RAG: обычный retrieval pipeline или что-то сложнее?

ragembeddingsretrievalvector-search

Satel Generation

RAG-вопрос на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignMedium

Какие offline и online метрики у moderation-модели

Модель модерации работает в production. Какие метрики смотреть offline, online и после запуска, чтобы контролировать качество и нагрузку на ручную проверку?

moderationМетрикиmanual-reviewmonitoring

Satel Generation

Вопрос по метрикам на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignMedium

Какие аномалии искать в биржевом датасете

После базовых latency-вопросов интервьюер спрашивает: какие еще аномалии можно заметить в market-data файле?

hftdata-qualityanomaly-detectiontime-series

Wunderfund

Вопрос про production ML на техническом собеседовании · Wunderfund

Открыть вопрос

ML System DesignMedium

Какие данные нужны для подбора поставщиков и что меняет масштаб

Есть исторические сделки, логи платформы, больше миллиона поставщиков и около 100 компаний-заказчиков. Какие данные использовать и как масштаб влияет на архитектуру?

datascaleevent-logscandidate-generation

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignMedium

Какие признаки использовать для модели цены объявления

Нужно построить модель для оценки или подсказки цены second-hand объявления в marketplace. Какие признаки и baseline стоит предложить?

pricingfeature-engineeringmarketplacetabular-ml

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Какие сигналы извлекать из PDF-отчетов

Какие факты из PDF-отчетов компаний полезны для прогноза добычи, и как отличать их от шумного текста?

llm-extractionpdffeature-engineeringforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Какие события логировать для обучения ranker

После запуска MVP какие события и признаки нужно собирать, чтобы обучить модель ранжирования user-video?

logginglabelsfeature-engineeringattribution

Самокат

ML System Design на техническом собеседовании · Самокат

Открыть вопрос

ML System DesignMedium

Какие стандартные проблемы есть в RecSys

Какие типовые проблемы рекомендательных систем ты бы назвал и как их можно измерять или снижать?

recsysdiversitynoveltypopularity-bias

Wildberries

ML System Design из материалов интервью · Wildberries

Открыть вопрос

ML System DesignMedium

Какие техники prompt engineering использовать в production

Какие практические техники prompt engineering помогают получать стабильный и проверяемый ответ от LLM?

llmprompt-engineeringstructured-outputguardrails

FlameTree

RAG-вопрос на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Категории и признаки каталога для cart RecSys

Какие catalog features нужны для рекомендаций в корзине и какие проблемы бывают с категориями товаров?

catalog-featuresitem-featuresdata-qualitycategories

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Когда нужен batch ETL, а когда streaming

Когда стоит использовать классический batch ETL, а когда streaming для рекомендаций, аналитики или ML-фичей?

ETLПотоковая обработкаKafkalatency

GamerAM

Вопрос про production ML на скрининге · GamerAM

Открыть вопрос

ML System DesignMedium

Когда нужен fine-tuning, а когда хватает prompt engineering

Как решить, дообучать LLM или ограничиться prompt engineering/RAG, и что меняется при LoRA adapters?

llmfine-tuninglorarag

FlameTree

Вопрос про production ML на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Когда нужен hybrid retrieval

В поиске есть embeddings и полнотекстовый индекс. Когда использовать оба подхода и как их объединять?

Гибридный поискBM25ANNВекторный поиск

LifePay

RAG-вопрос на техническом собеседовании · LifePay

Открыть вопрос

ML System DesignMedium

Когда нужен векторный поиск, а когда full-text

В продукте есть поиск по документам/артефактам. Когда использовать full-text, когда векторный поиск, и зачем может понадобиться hybrid retrieval?

Векторный поискBM25Гибридный поискretrieval

Unimatch

RAG-вопрос на техническом собеседовании · Unimatch

Открыть вопрос

ML System DesignMedium

Метрики recommender в marketplace

Какие метрики использовать для recommender в marketplace, где клики, контакты, сделки и seller exposure имеют разные цели?

recsysmarketplace-metricsprecision-at-kseller-exposure

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Метрики для рекомендаций в корзине

Какие offline, online и guardrail-метрики подходят для блока рекомендаций в корзине, если клики не равны покупке?

recsys-metricscartgmvguardrails

GRII RED

Вопрос по метрикам на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Метрики и A/B для поиска/RAG

Как оценивать качество поиска или RAG-системы offline и online?

NDCGRecall@KA/B testingfaithfulness

LifePay

Вопрос по метрикам на техническом собеседовании · LifePay

Открыть вопрос

ML System DesignMedium

Метрики и thresholds для phishing warnings

Как выбрать thresholds для предупреждения о phishing и какие метрики мониторить в production?

phishingthresholdsprecision-recallmonitoring

T-Bank

Вопрос по метрикам на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignMedium

Метрики маркетплейс-поиска

Проектируем ML для поиска на маркетплейсе. Какие бизнес, online и offline метрики выбрать?

marketplace searchNDCGconversionGMV

Uzum

ML System Design на техническом собеседовании · Uzum

Открыть вопрос

ML System DesignMedium

Мониторинг drift данных и реакция с переобучением

Мониторинг drift данных и реакция с переобучением

data driftmonitoringretrainingproduction ML

QIC

Вопрос про production ML на техническом собеседовании · QIC

Открыть вопрос

ML System DesignMedium

На какие классы делятся модели рекомендаций

Расскажи, какие классы моделей есть в рекомендательных системах и где они обычно применяются.

recsyscollaborative-filteringtwo-towerРанжирование

Wildberries

ML System Design из материалов интервью · Wildberries

Открыть вопрос

ML System DesignMedium

Оптимизация стоимости ASR и LLM-инференса для звонков

Оптимизация стоимости ASR и LLM-инференса для звонков

inference optimizationquantizationbatchingprofiling

Chinor

Вопрос про production ML на техническом собеседовании · Chinor

Открыть вопрос

ML System DesignMedium

Оптимизация цены по grid

Есть response-модель для разных вариантов доставки. Как выбрать итоговую цену или минимальную сумму заказа?

Оптимизацияpricingguardrailsdecision-policy

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

От модели до ML-микросервиса

Что должен сделать ML-инженер, чтобы довести модель до production-сервиса: интерфейс, артефакт, Docker, мониторинг и обновления?

model-servingmlopsmicroservicedeployment

Dubai Tech

Вопрос про production ML на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Ответственность за полный цикл деплоя модели

Ответственность за полный цикл деплоя модели

deploymentONNXmicroservicemonitoring

QIC

Вопрос про production ML на техническом собеседовании · QIC

Открыть вопрос

ML System DesignMedium

Отладка разрыва между офлайн-оценкой и качеством в продукте

Отладка разрыва между офлайн-оценкой и качеством в продукте

NLPdomain shiftonline qualitymonitoring

Constructor

Вопрос про production ML на техническом собеседовании · Constructor

Открыть вопрос

ML System DesignMedium

Офлайн-метрики рекомендаций: recall@K, precision@K, coverage и NDCG

Сравните recall@K, precision@K, coverage и NDCG для candidate generation и ранжирования. Как эти метрики ведут себя при изменении K?

RecSys metricsrecall@Kprecision@Kcoverage

T-Bank

Вопрос по метрикам из фидбека после собеседования · T-Bank

Открыть вопрос

ML System DesignMedium

Пайплайн OCR для вывесок

На фото есть вывеска организации. Как построить pipeline, который извлекает текст и использует его в продукте?

ocrcomputer-visionentity-matchingpipeline-design

2GIS

Вопрос про production ML на техническом собеседовании · 2GIS

Открыть вопрос

ML System DesignMedium

Поиск срезов, где LTV-модель ошибается

Поиск срезов, где LTV-модель ошибается

error analysisslicingLTVresiduals

Adapty

Вопрос про production ML из разбора после собеседования · Adapty

Открыть вопрос

ML System DesignMedium

Постановка cart recommendations при масштабе каталога

Нужно сделать блок рекомендаций в корзине для 10 млн пользователей и 100 тыс. товаров. Как сформулировать цель, ограничения и MVP?

cart-recommendationsscalebaselinerecsys

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Постановка задачи динамической стоимости доставки

В ML System Design кейсе про доставку нужно спроектировать персонализацию минимальной суммы заказа или платной доставки ниже порога. Как задать цель, границы и базовый план системы?

pricingdeliveryml-system-designproblem-framing

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Построение и обновление HNSW/Qdrant пайплайна векторного поиска

Построение и обновление HNSW/Qdrant пайплайна векторного поиска

HNSWQdrantANNAirflow

Constructor

Вопрос про production ML из фидбека после собеседования · Constructor

Открыть вопрос

ML System DesignMedium

Почему acceptance ratio может быть высоким

За счет чего speculative decoding сохраняет высокий acceptance ratio при нескольких draft tokens?

llm-servingspeculative-decodingacceptance-ratetechnical-explanation

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Почему годовой guidance нельзя наивно усреднять

Компания дала годовой guidance роста добычи. Почему опасно равномерно размазать его по кварталам?

forecastingtemporal-featuresguidanceУтечки

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Почему начинать поиск по статьям с BM25 baseline

Нужно сделать поиск/подсказки по базе статей или банковских ответов. Почему разумно начать с BM25/TF-IDF, а не сразу с embeddings/RAG?

searchragbm25baseline

AgeCode

RAG-вопрос на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignMedium

Прогнозирование временных рядов: постановка, baseline и валидация

Нужно прогнозировать retention, revenue или LTV во времени. Как поставить задачу, выбрать горизонт и гранулярность, построить baseline и провести корректную временную валидацию?

time-seriesforecastingltvbaseline

Almus

ML System Design на техническом собеседовании · Almus

Открыть вопрос

ML System DesignMedium

Разбор пользовательского и операционного сценарий до модели

Почему в кейсе доставки стоит сначала разложить путь пользователя и операционный процесс заказа, а уже потом выбирать модель?

Продуктовый сценарийoperationsdeliveryfeature-discovery

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignMedium

Роутинг звонков, отсеивание отказов и метрики

Роутинг звонков, отсеивание отказов и метрики

routingbinary classificationМетрикиLLM cost

Chinor

Вопрос про production ML на техническом собеседовании · Chinor

Открыть вопрос

ML System DesignMedium

Связывание событий из нескольких документов

Один факт о руднике встречается в годовом отчете, презентации и call transcript. Как объединить эти источники в один forecasting state?

multi-documententity-resolutionllm-extractionforecasting

Mining / Commodities

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignMedium

Связь business metrics и offline metrics модели

Как перейти от revenue, seller success и buyer value в marketplace к offline-метрикам pricing/recommendation модели?

business-metricsoffline-evaluationmarketplaceproxy-metrics

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Сколько draft tokens брать в speculative decoding

Как выбирать число draft tokens в speculative decoding и почему больше не всегда лучше?

llm-servingspeculative-decodinglatencytechnical-explanation

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Сколько данных нужно и когда включать high-resolution режим

Для audio-event фичи спрашивают: сколько данных нужно для обучения и как решить, когда переключать камеру/устройство на более дорогой режим обработки?

data-collectionthresholdsedge-mlactive-learning

Sber / GigaChat

ML System Design на техническом собеседовании · Sber / GigaChat

Открыть вопрос

ML System DesignMedium

Следующий шаг после feature selection

После набора признаков для marketplace pricing/recommendation модели что делать дальше: target, split, baseline, модель и критерий запуска?

modeling-pipelineВалидацияbaselinefeature-selection

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Файлы ML-модели, упаковка сервиса и безопасный rollout

Вы обучили и провалидировали ML-модель. Какие файлы и метаданные нужно версионировать, как упаковать сервис и как безопасно выкатить новую версию?

ML deploymentMLflowDockerFastAPI

Apriori

Вопрос про production ML из материалов интервью · Apriori

Открыть вопрос

ML System DesignMedium

Фильтры и business rules для cart recommendations

Какие товары нельзя показывать в рекомендациях корзины и где применять эти ограничения в candidate generation/reranking?

business-rulesfiltersavailabilitycart

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Формулировка модельного действия в marketplace

В marketplace кейсе модель может score-ить цену, скидку, карусель или промо-тег. Как четко сформулировать output модели и downstream action?

model-framingpricingdecision-policymarketplace

OLX

ML System Design на техническом собеседовании · OLX

Открыть вопрос

ML System DesignMedium

Цели и метрики рекомендательной ленты в банковском приложении

Цели и метрики рекомендательной ленты в банковском приложении

ML System Designfeed rankingproduct metricsengagement

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignMedium

Что делать, если Airflow DAG тормозит или зависает

Что вы делаете, когда Airflow DAG-и тормозят, зависают или не укладываются в scheduled window?

AirflowDAGpipeline debuggingdata engineering

GamerAM

Вопрос про production ML на скрининге · GamerAM

Открыть вопрос

ML System DesignMedium

Что делать, если модель и данные не помещаются на одну GPU

Какие подходы есть для обучения большой нейросети на нескольких GPU и чем они отличаются?

distributed trainingDDPmodel parallelismpipeline parallelism

Ozon

Вопрос про production ML на техническом собеседовании · Ozon

Открыть вопрос

ML System DesignMedium

Что делать, если рекомендации в корзине не нашлись

В item-item рекомендациях для корзины может не быть соседей: новый товар, редкий товар, новый пользователь или корзина из многих товаров. Какие fallback предусмотреть?

recsyscold-startfallbackscart

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignMedium

Что знать про FlashAttention на LLM-интервью

На LLM serving собеседовании спрашивают: знаешь ли ты что-то про FlashAttention? Как объяснить идею без ухода в низкоуровневые детали?

llm-servingflashattentionattentiongpu-optimization

Huawei

Техническое собеседование · Huawei

Открыть вопрос

ML System DesignMedium

Что значит надежный ML/data pipeline

Что для вас надежный pipeline и как проверить, что он действительно надежен?

MLOpsdata qualitymonitoringalerting

GamerAM

Вопрос про production ML на скрининге · GamerAM

Открыть вопрос

ML System DesignMedium

Что такое KV cache в LLM inference

На собеседовании спрашивают про KV cache в LLM inference. Что это такое, зачем он нужен и какие trade-off появляются в production?

llm-servingkv-cacheinferencelatency

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Что такое LLM agent и из каких компонентов он состоит

Интервьюер спрашивает, как устроен LLM agent: какие компоненты нужны и чем agent отличается от обычного вызова модели.

llmagentstoolsПамять

FlameTree

RAG-вопрос на техническом собеседовании · FlameTree

Открыть вопрос

ML System DesignMedium

Что такое prefill и decode стадии в LLM inference

Что такое prefill и decode стадии при генерации LLM и почему их важно различать при оптимизации inference?

llmprefilldecodeinference

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignMedium

Что такое quantization LLM и какие trade-off она дает

Интервьюер спрашивает про quantization: зачем она нужна, какие бывают варианты и чем можно заплатить за ускорение.

llmquantizationint8int4

FlameTree

Техническое собеседование · FlameTree

Открыть вопрос

ML System DesignHard

A/B тест безопасной верификации

Как онлайн проверять новую модель выбора контрольных вопросов, если ошибка может пропустить мошенника или заблокировать клиента?

ab-testingfraudguardrailsbanking

T-Bank

Вопрос по метрикам на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignHard

Agentic architecture для motion-design AI product

Нужно спроектировать AI-native продукт, который по запросу пользователя генерирует качественные motion graphics. Как выбрать между pipeline и fully agentic архитектурой, как встроить human-in-the-loop evaluation и как управлять trade-off между quality, consistency и latency?

LLM-агентыAI productevaluationhuman-in-the-loop

Hera

ML System Design из разбора после собеседования · Hera

Открыть вопрос

ML System DesignHard

Batch retrieval и realtime reranking в рекомендательной платформе

Спроектируйте платформу, где retrieval в основном считается batch, а realtime слой меняет порядок рекомендаций по свежим user interactions.

batch-retrievalrealtime-rerankingrecommendations-platformarchitecture

OLX

ML System Design на собеседовании · OLX

Открыть вопрос

ML System DesignHard

Category constraints поверх ANN retrieval

Как наложить ограничения по категориям и комплементарности, если candidates достаются через ANN по embeddings?

anncategory-constraintsretrievalreranking

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignHard

Closed-loop evaluation для LLM agents

У LLM-agent продукта уже есть offline benchmark: для каждого изменения видно, стала ли метрика лучше или хуже. Как превратить результаты evaluation в цикл улучшения системы, не скатываясь в слепую автоматическую оптимизацию под шумный benchmark?

LLM evaluationagentsRAGLLM-as-judge

Hera

RAG-вопрос из разбора после собеседования · Hera

Открыть вопрос

ML System DesignHard

CV-пайплайн для поиска разных авто в одном объявлении

Спроектируйте систему, которая по фото и метаданным объявления определяет, что в карточке или истории автомобиля появились разные машины.

cvmoderationmarketplacepipeline-design

Corsearch / Navi

ML System Design на техническом собеседовании · Corsearch / Navi

Открыть вопрос

ML System DesignHard

Deployment, артефакты and format-drift monitoring for document ML

Deployment, артефакты and format-drift monitoring for document ML

MLOpsmonitoringformat driftAirflow

Tochka

Вопрос про production ML на техническом собеседовании · Tochka

Открыть вопрос

ML System DesignHard

Distillation и quantization для большого temporal model

Большая temporal model хорошо ловит события, но слишком дорогая по latency и compute. Как сжать ее для production?

model-compressiondistillationquantizationlatency-optimization

Waymo

Вопрос про production ML из фидбека после собеседования · Waymo

Открыть вопрос

ML System DesignHard

Gold set и CI/CD для AI invoice extraction

Команда меняет prompts/models/rules для invoice parsing. Как не сломать качество при каждом изменении?

evaluationCI/CDDocument AItesting

Vertex / BP

Вопрос про production ML на техническом собеседовании · Vertex / BP

Открыть вопрос

ML System DesignHard

HFT/time-series задача: постановка и признаки

Даны временные рыночные данные для HFT-задачи. Как подойти к постановке target, построению признаков, валидации и первому baseline?

hfttime-seriesfeature-engineeringВалидация

BHFT

ML System Design на техническом собеседовании · BHFT

Открыть вопрос

ML System DesignHard

Long context в LLM: проблемы и способы решения

Какие проблемы возникают при использовании длинного контекста в LLM и какими подходами их адресуют?

long contextattentionKV cacheRAG

Toloka AI

RAG-вопрос на техническом собеседовании · Toloka AI

Открыть вопрос

ML System DesignHard

ML System Design

Design a semantic search layer for geo/address suggestions where users can type categories like "cafe" and expect restaurants, POIs and relevant addresses across many languages.

geo searchsemantic searchPOIOpenSearch

inDrive

ML System Design на собеседовании · inDrive

Открыть вопрос

ML System DesignHard

ML System Design

How would you build item embeddings from text, images/video and categorical/numerical attributes under real serving constraints?

multimodal embeddingsCLIPBERTvideo

Okko

ML System Design из фидбека после собеседования · Okko

Открыть вопрос

ML System DesignHard

ML System Design

Which offline and online metrics would you use for a similar-items recommender, and what pitfalls are easy to miss?

Recall@KNDCGcoverageA/B testing

Okko

ML System Design из фидбека после собеседования · Okko

Открыть вопрос

ML System DesignHard

ML System Design

A bank asks a suspicious legal entity for PDF statements from other banks. Design how ML can extract compliance value from those statements.

ML System DesigncompliancePDF parsingrisk scoring

Tochka

ML System Design на техническом собеседовании · Tochka

Открыть вопрос

ML System DesignHard

ML System Design

How would you parse readable PDF bank statements from many banks into structured transactions without sending personal data to an external API?

PDF parsinghybrid systemsLLMrules

Tochka

ML System Design на техническом собеседовании · Tochka

Открыть вопрос

ML System DesignHard

Offline batch vs online inference в RecSys

Модель ранжирования готова. Как вывести ее в прод: offline batch или online inference?

servingoffline-batchonline-inferenceapi

Самокат

Вопрос про production ML на техническом собеседовании · Самокат

Открыть вопрос

ML System DesignHard

Offline precision для новой карусели

Если новой карусели еще не было в продукте, как оценить offline precision или релевантность ее рекомендаций?

offline-evaluationprecisionnew-surfacecounterfactual

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

ML System DesignHard

Production-архитектура рекомендаций в корзине

После baseline и ranker нужно объяснить production: где считаются кандидаты, где хранятся фичи, как часто пересчитывать рекомендации при изменении корзины?

recsysproductionfeature-storeonline-inference

GRII RED

Вопрос про production ML на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignHard

RAG support bot для fintech-продукта

Нужно построить support bot для fintech-приложения. Какие компоненты нужны и как снизить риск неправильного ответа?

RAGsupport botfintechguardrails

Solmate / TAVAX

RAG-вопрос на техническом собеседовании · Solmate / TAVAX

Открыть вопрос

ML System DesignHard

RAG для factual search snippets

Как бы ты сделал retrieval-augmented generation для короткого factual snippet в поисковой выдаче?

ragsearchfactualitysnippets

Яндекс

RAG-вопрос на техническом собеседовании · Яндекс

Открыть вопрос

ML System DesignHard

RAG по большому корпусу документов

Как построить RAG/search систему, если корпус по масштабу похож на большой веб-поиск?

RAGretrievalреранкингBM25

Waibee

RAG-вопрос на техническом собеседовании · Waibee

Открыть вопрос

ML System DesignHard

RAG-ассистент по урокам без спойлеров

Как спроектировать ассистента, который отвечает по текущему уроку, но не раскрывает будущие материалы?

RAGeducationchunkingaccess control

TripleTen

RAG-вопрос на техническом собеседовании · TripleTen

Открыть вопрос

ML System DesignHard

Rare event classification по temporal embeddings

Есть последовательность embedding-ов дорожной сцены за временное окно. Нужно находить несколько редких событий интереса. Как сформулировать ML-задачу и baseline?

temporal-modelingmulti-label-classificationautonomous-drivingproblem-framing

Waymo

ML System Design из фидбека после собеседования · Waymo

Открыть вопрос

ML System DesignHard

Split, MDE и prelaunch checks

Как сплитовать A/B для динамической доставки, считать MDE и что проверить до запуска?

experiment-designmdeaa-teststatistics

Dodo

Вопрос по метрикам на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignHard

Target vs action в pricing модели

В кейсе динамической доставки почему цена или минимальная сумма заказа не должны быть target модели? Что тогда предсказывать?

pricingupliftconversionproblem-framing

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignHard

User-фичи, item-фичи и cart-level scoring

При обучении MLP или бустинга для корзины какие признаки подавать: user, item, item-to-cart или category features?

feature-engineeringРанжированиеpersonalizationcart

GRII RED

ML System Design на техническом собеседовании · GRII RED

Открыть вопрос

ML System DesignHard

Агент, который делает презентацию из текста

Нужно спроектировать продукт: пользователь дает текстовую задачу, система делает презентацию со слайдами, таблицами и картинками. Как построить pipeline?

LLM-агентыpresentation generationstructured outputsystem-design

Unimatch

ML System Design на техническом собеседовании · Unimatch

Открыть вопрос

ML System DesignHard

Адаптивная маршрутизация LLM-запросов по GPU

В LLM-инференсе есть несколько GPU-воркеров. Почему наивная round-robin маршрутизация может быть неэффективной, и как спроектировать адаптивный слой маршрутизации с учетом загрузки GPU, KV cache и длины запроса?

LLM servingGPU routingKV cacheinference optimization

Samsung

Вопрос про production ML на техническом собеседовании · Samsung

Открыть вопрос

ML System DesignHard

Архитектура invoice parsing из PDF

Нужно построить систему, которая извлекает полезные поля из PDF-инвойсов разных поставщиков. Какую архитектуру выбрать?

Document AIOCRLLMinvoice parsing

Vertex / BP

ML System Design на техническом собеседовании · Vertex / BP

Открыть вопрос

ML System DesignHard

Вопрос про production ML

Чем отличаются FSDP, tensor parallelism и pipeline parallelism при обучении больших моделей?

distributed-trainingfsdptensor-parallelismsystems

Mirai

Вопрос про production ML на техническом собеседовании · Mirai

Открыть вопрос

ML System DesignHard

Вопрос про production ML

Sketch the online architecture for query parsing, candidate generation, ranking and blending. How do services communicate and fail safely?

microservicesranking servicefallbacksКеш

CIAN

Вопрос про production ML из разбора после собеседования · CIAN

Открыть вопрос

ML System DesignHard

Генерация описаний для объектных ответов в поиске

В международном поиске нужно показывать короткое описание объекта в карточке ответа, например для Китая. Как построить ML-систему генерации таких описаний?

searchobject-answergenerationinternational

Яндекс

ML System Design на техническом собеседовании · Яндекс

Открыть вопрос

ML System DesignHard

Датасет для response-модели доставки

Как построить датасет для модели, которая оценивает реакцию пользователя на стоимость доставки или минимальную сумму заказа?

dataset-designpricingconversionlabeling

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignHard

Двухэтапный retrieval/ranking для подбора поставщиков

Как спроектировать candidate generation и ranking для подбора поставщиков под закупочную заявку в маркетплейсе корпоративных закупок?

retrievalРанжированиеvector-searchrecsys

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignHard

Историческая цена почти не менялась

Что делать, если исторически стоимость доставки менялась редко и почти нет вариативности для обучения эластичности?

explorationpricingcausal-inferenceexperimentation

Dodo

ML System Design на техническом собеседовании · Dodo

Открыть вопрос

ML System DesignHard

Как агрегировать frame embeddings в segment vector

Архив дорожных сцен состоит из последовательностей кадров. Как из кадров получить вектор сегмента для поиска по тексту?

computer-visiontemporal-poolingembeddingsvideo

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Как бороться с selection bias и неоднозначными negatives

Исторические данные есть только по поставщикам, которых уже показывали или приглашали. Как понять и уменьшить selection bias, и как обращаться с losing bids?

selection-biasexplorationnegative-samplinglabels

Fairmarkit

Вопрос по метрикам на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignHard

Как валидировать LLM-фичи и не дать модели додумывать

LLM извлекает признаки из PDF-отчета: например, будущий план производства. Как проверить, что признак основан на документе, а не на внешних знаниях или догадках?

llmgroundingevaluationfeature-extraction

Компания не указана

RAG-вопрос на техническом собеседовании

Открыть вопрос

ML System DesignHard

Как встроить LLM-агента в продуктовый pipeline

Нужно добавить LLM-агента в существующий продуктовый pipeline. Как спроектировать границы агента, tools, контекст, проверки и мониторинг?

llm-agentsorchestrationtoolsguardrails

PulsePoint

RAG-вопрос на техническом собеседовании · PulsePoint

Открыть вопрос

ML System DesignHard

Как выбрать чанки для контекста после retrieval

Retriever вернул top-K чанков. Как выбрать финальный контекст для LLM и где нужен reranker?

ragrerankercontext-assemblyndcg

Satel Generation

RAG-вопрос на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignHard

Как делать train/test split и offline validation для marketplace модели

Для marketplace pricing/recommendation модели нужно построить offline validation. Как выбрать строку датасета, train/test split и метрики, чтобы не получить красивую, но бесполезную оценку?

offline-evaluationВалидацияmarketplacepricing

OLX

Вопрос по метрикам на техническом собеседовании · OLX

Открыть вопрос

ML System DesignHard

Как деплоить audio-event модель на устройство

Модель распознавания аудио-событий должна работать на колонке/камере с CPU и ограничениями по latency, privacy и батарее. Как это спроектировать?

edge-mlaudio-classificationlatencyprivacy

Sber / GigaChat

Вопрос про production ML на техническом собеседовании · Sber / GigaChat

Открыть вопрос

ML System DesignHard

Как добавить content embeddings в DSSM/two-tower модель

Есть item2vec/DSSM-подобная модель, обученная на сессиях кликов: anchor, positive рядом в сессии и negative. У товара есть текстовый embedding из LLM. Как добавить content-информацию в архитектуру?

recsysdssmtwo-towercontent-embeddings

Wildberries

ML System Design из материалов интервью · Wildberries

Открыть вопрос

ML System DesignHard

Как добавить reranker и мониторить деградацию retrieval

После ANN retrieval нужно улучшить качество выдачи и понять, когда система деградирует. Как спроектировать reranker, evaluation и monitoring?

rerankingmonitoringdriftretrieval

Waymo

Вопрос про production ML на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Как дообучать encoder под доменный retrieval

Есть доменный поиск, где generic embeddings плохо работают. Как дообучить encoder и проверить, что retrieval стал лучше?

embeddingsretrievalfinetuningmetric-learning

T1 / PrideInBrains

RAG-вопрос на техническом собеседовании · T1 / PrideInBrains

Открыть вопрос

ML System DesignHard

Как использовать LLM для фичей в прогнозе производства

Есть прогноз производства по рудникам/активам. В отчетах компаний есть текст, планы роста, графики и будущие ожидания. Как использовать LLM, чтобы улучшить табличную модель, но не заменить ее полностью?

ML System Designllmfeature-extractionforecasting

Компания не указана

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignHard

Как нарезать юридические документы на чанки

Юридические документы плохо режутся фиксированным окном. Как построить chunking для legal или enterprise RAG?

ragchunkinglegal-documentsdocument-structure

Satel Generation

RAG-вопрос на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignHard

Как обучать sentence embeddings

Нужно получить хорошие embeddings предложений для retrieval/semantic search. Какие данные и loss использовать?

SBERTembeddingscontrastive learningretrieval

Sber / GigaChat

RAG-вопрос на техническом собеседовании · Sber / GigaChat

Открыть вопрос

ML System DesignHard

Как получить пары текстовый запрос — дорожный сегмент

Для обучения retrieval нужны пары текстовый запрос и релевантный дорожный сегмент из последовательностей изображений. Где взять такие labels и как не утонуть в ручной разметке?

labelingcontrastive-learningcomputer-visiondata-strategy

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Как построить модель визуального сравнения объявлений авто

Есть база объявлений авто и якорное объявление. Нужно находить архивные объявления, где визуально другая машина: другой цвет, салон, колеса, кузов или ракурс. Как поставить задачу и обучить модель?

computer-visionmetric-learningretrievalhard-negatives

Wildberries

ML System Design из материалов интервью · Wildberries

Открыть вопрос

ML System DesignHard

Как превратить годовой guidance в квартальные фичи

В отчете сказано: производство вырастет на 20% за год, рост начнется во второй половине года. Модели нужен прогноз по кварталам. Что должна вернуть LLM-фича?

forecastingllmfeature-engineeringuncertainty

Компания не указана

ML System Design на техническом собеседовании

Открыть вопрос

ML System DesignHard

Как применять Vision Transformer к последовательности изображений

Vision Transformer обычно работает с 2D image patches. Как перенести такой подход на дорожные video segments?

vision-transformervideotemporal-modelingcomputer-vision

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Как прогнозировать LTV для новых когорт без истории

Есть LTV/retention прогноз по когортам. Для старых когорт есть 7/30/180 дней истории, а для новых есть только install или trial. Как строить прогноз уже сегодня?

ltvtime-seriescohortscold-start

Almus

ML System Design на техническом собеседовании · Almus

Открыть вопрос

ML System DesignHard

Как проектировать related articles и reranker

Помимо ответа на free-text вопрос нужно показывать related articles. Как их формировать: заранее или в зависимости от запроса, и где нужен reranker?

searchragrerankerrelated-articles

AgeCode

RAG-вопрос на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignHard

Как работает KV cache и от чего зависит его память

Что такое KV cache, почему его можно переиспользовать при decode и от каких факторов зависит его объем?

llmkv-cacheattentionПамять

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignHard

Как работает speculative decoding и acceptance ratio

Интервьюер спрашивает: как можно держать высокий acceptance ratio при большом числе draft tokens в speculative decoding?

llm-servingspeculative-decodinglatencydraft-model

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignHard

Как работать с деревьями категорий заказчиков

У каждого заказчика свое дерево категорий: названия могут быть нормальными словами, внутренними кодами или разной глубины. Как учитывать такие категории при подборе поставщиков?

taxonomyembeddingscategorical-featuresb2b

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignHard

Как развернуть RAG: FastAPI, Qdrant, ranker и vLLM

В production RAG есть FastAPI, vector DB, ranker service, MLflow, Docker и self-hosted LLM. Как описать путь запроса и зоны ответственности сервисов?

ragservingqdrantvllm

Satel Generation

Вопрос про production ML на техническом собеседовании · Satel Generation

Открыть вопрос

ML System DesignHard

Как снижать hallucinations в production LLM-системе

LLM-агент иногда уверенно отвечает неверно. Какие инженерные меры помогут снизить риск hallucinations в production?

HallucinationsRAGguardrailsproduction

Flametree

Вопрос про production ML на техническом собеседовании · Flametree

Открыть вопрос

ML System DesignHard

Как собрать feature pipeline, batch scoring и мониторинг

Данные casino-продукта лежат в хранилище и приходят через очередь сообщений. Нужно регулярно обновлять признаки и скорить пользователей. Как спроектировать production pipeline?

feature-storebatch-inferencemonitoringmlops

MrBit

Вопрос про production ML на техническом собеседовании · MrBit

Открыть вопрос

ML System DesignHard

Как сравнить два LLM для customer support automation

Есть реальный продуктовый use case: customer support automation. Нужно сравнить два LLM/agent variants и выбрать, какой запускать. Как спроектировать evaluation: данные, offline metrics, human/LLM judging, system metrics и online validation?

LLM evaluationcustomer supportRAGA/B testing

Parloa

RAG-вопрос на техническом собеседовании · Parloa

Открыть вопрос

ML System DesignHard

Как строить эмбеддинги поставщиков и чем опасна многошаговая агрегация

Поставщика можно представить через прошлые заявки, профиль и категории. Как построить представление поставщика и какие проблемы есть у averaging request embeddings?

эмбеддинги поставщиковrepresentation-learningfeature-aggregationfeature-engineering

Fairmarkit

ML System Design на техническом собеседовании · Fairmarkit

Открыть вопрос

ML System DesignHard

Как сформулировать text-to-scene retrieval задачу

Есть большой архив дорожных сцен автономного автомобиля. По текстовому запросу нужно находить релевантные сегменты, например редкие ситуации с пешеходами или необычным трафиком. Как начать ML System Design?

computer-visionretrievalautonomous-drivingmultimodal

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Как ускорять тяжелую модель рекомендаций в рантайме

Есть трансформерная модель рекомендаций по истории пользователя. Как сделать так, чтобы она не ломала online-сервис?

transformer recsyscachingbatchingANN

Mayflower

ML System Design на техническом собеседовании · Mayflower

Открыть вопрос

ML System DesignHard

Как устроены MoE-модели и их inference

Чем Mixture-of-Experts отличается от dense модели, какие преимущества и недостатки, и как устроен router при inference?

moerouterllminference

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

ML System DesignHard

Как устроить dual encoder retrieval для последовательностей изображений

Нужно индексировать не одиночные картинки, а последовательности дорожных кадров. Как сделать retrieval-модель и embedding index для text-to-scene search?

dual-encoderanntemporal-modelingcomputer-vision

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Какие metadata-признаки добавить в reranker дорожных сцен

ANN retrieval вернул top-K дорожных сегментов. Какие metadata и model signals стоит добавить в reranker, чтобы лучше упорядочить результаты?

rerankingmetadataperceptionranking-features

Waymo

Вопрос про production ML на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Какую deep learning архитектуру выбрать для временного ряда

После градиентного бустинга: если смотреть в сторону deep learning, какую архитектуру предложить для последовательных данных или временного ряда и почему?

ML System Designtime-seriesdeep-learningsequence-models

BHFT

ML System Design на техническом собеседовании · BHFT

Открыть вопрос

ML System DesignHard

Когда нужен LLM поверх поиска по статьям

После hybrid retrieval можно отдать несколько статей LLM. Когда это оправдано, а когда лучше оставить обычный reranker и список результатов?

llm-rerankerragprivacylatency

AgeCode

RAG-вопрос на техническом собеседовании · AgeCode

Открыть вопрос

ML System DesignHard

Лейблы для контрольных вопросов

Какие лейблы собрать для обучения выбора контрольного вопроса и как бороться с тем, что мы видим ответы только на показанные вопросы?

labelscounterfactualssecurityРанжирование

T-Bank

Вопрос по метрикам на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignHard

Миллион кандидатов перед реранкером

Запрос вроде "книга" возвращает миллион релевантных товаров. Как не скорить весь миллион тяжелой моделью?

pre-rankinglatencycandidate-selectionsystems-thinking

Constructor

ML System Design на техническом собеседовании · Constructor

Открыть вопрос

ML System DesignHard

Поиск safe/unsafe видеофрагментов на большом масштабе

Представьте два видеосервиса с миллиардами роликов: в одном нужно быстро находить safe-фрагменты внутри в основном unsafe-контента, в другом - unsafe-фрагменты внутри в основном safe-контента. Разметки почти нет, ресурсов и времени мало. Как бы вы строили pipeline?

video moderationclass imbalancedata miningweak supervision

Wisebits / xHamster

ML System Design на техническом собеседовании · Wisebits / xHamster

Открыть вопрос

ML System DesignHard

Продакшен-архитектура автоматической записи по звонку

Продакшен-архитектура автоматической записи по звонку

architecturequeuesbookingidempotency

Chinor

Вопрос про production ML на техническом собеседовании · Chinor

Открыть вопрос

ML System DesignHard

Ранжирование контрольных вопросов в call center

В call center нужно выбрать контрольный вопрос для верификации клиента: достаточно безопасный, но не слишком сложный. Как построить ML-систему ранжирования вопросов?

bankingРанжированиеverificationcall-center

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignHard

Система предупреждений о phishing для ISP

Интернет-провайдер хочет предупреждать пользователей о phishing-страницах. Как спроектировать ML-систему детекта и показа предупреждения?

phishingsecurityclassificationisp

T-Bank

ML System Design на техническом собеседовании · T-Bank

Открыть вопрос

ML System DesignHard

Современный training pipeline LLM: pretrain, SFT, alignment

Расскажите про современную архитектуру LLM и процесс обучения: какие основные этапы, данные, objective и loss используются?

LLMTransformer decoderpretrainingSFT

Toloka AI

Техническое собеседование · Toloka AI

Открыть вопрос

ML System DesignHard

Спроектировать рекомендательную ленту видео с товарами

В e-commerce приложении запускается TikTok-like лента видео на главной. К каждому видео привязаны товары, видео около 1500 и живут 1-2 месяца. Истории по новой поверхности нет. Как спроектировать систему рекомендаций?

recsysvideo-feedecommercecold-start

Самокат

ML System Design на техническом собеседовании · Самокат

Открыть вопрос

ML System DesignHard

Чем MQA, GQA и MLA отличаются от обычного Multi-Head Attention

Какие есть варианты attention для экономии KV cache, например Multi-Query Attention, Grouped-Query Attention и MLA?

attentionmqagqamla

Huawei

Техническое собеседование · Huawei

Открыть вопрос

ML System DesignHard

Что делать, если invoice parsing слишком дорогой и медленный

Pipeline для PDF-инвойсов работает, но обработка стала медленной и дорогой. Как искать узкие места и оптимизировать?

cost optimizationlatencyDocument AIproduction-debugging

Vertex / BP

Вопрос про production ML на техническом собеседовании · Vertex / BP

Открыть вопрос

ML System DesignHard

Что договорить в retrieval до reranker

До добавления reranker нужно закончить candidate retrieval. Какие решения нужны по embedding index, freshness, фильтрам и quality evaluation?

retrievalannindexingevaluation

Waymo

ML System Design на техническом собеседовании · Waymo

Открыть вопрос

ML System DesignHard

Что такое speculative decoding и EAGLE

Что такое speculative decoding для LLM inference, как он ускоряет decode, и что за идея у EAGLE-подобных методов?

speculative-decodingeaglellminference

Huawei

Вопрос про production ML на техническом собеседовании · Huawei

Открыть вопрос

Банк вопросов из реальных собеседований — ML Mentor