OCR API обрабатывает один документ за 2 секунды, на время обработки занимает 1 CPU core и 3.5-4 GB RAM. На сервере 20 cores и 64 GB RAM. Как посчитать safe throughput?
Банк вопросов из реальных собеседований
Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.
Все вопросы
673Полный банк вопросов из реальных собеседований.
ML-теория
119Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.
Python
67Устройство языка, структуры данных, тестирование и инженерная база.
SQL
12Запросы, агрегации, оконные функции и объяснение результата.
ML System Design
259Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.
Метрики и A/B
101Качество моделей, продуктовые метрики, эксперименты и валидация.
Продуктовые кейсы
72Как разложить задачу продукта, ограничения, риски и первый бейзлайн.
Математика и статистика
18Вероятность, статистика, оценки, распределения и аккуратные допущения.
Behavioral Interview
25Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.
Продуктовые кейсы
72 вопроса из реальных интервью
For a FastAPI-backed LLM product, when would you use Postgres, ClickHouse and Redis?
Интервьюер спрашивает, какими Linux-командами пользоваться на сервере для навигации, поиска файлов, логов и диагностики процессов.
На собеседовании спросили: сколько нулей в конце числа 100!, и как это аккуратно посчитать без вычисления самого факториала?
Интервьюер спрашивает про командную работу с Git: что делает merge, что делает rebase и когда какой подход выбирать?
Dashboard должен показывать CTR за минуты, 5 минут и часы. Как спроектировать API и хранение bucket-агрегатов?
На review ты видишь тест, который проверяет только HTTP 200. Что с ним не так и как сделать проверку полезной?
Как решать cold start для нового пользователя в ленте рекомендаций? Когда использовать popularity, user-based, item-based и content-based подходы?
Что важно при запуске CV-модели на edge-устройстве или VR-гарнитуре?
Пользователь загружает фото товара, а система должна найти похожие товары в каталоге. Когда достаточно object detection, а когда нужна segmentation?
Dropout, BatchNorm и fine-tuning на маленьких батчах
В Kafka topic 10 partitions и 100 задач: 90 задач по 90 ms и 10 задач по 1 s. Задачи равномерно лежат по partitions, внутри partition порядок последовательный. Как оценить best/worst completion time для 1, 10 и 20 consumers?
Как LightFM помогает cold start и когда в рекомендациях появляются bandits?
What improvements would you add after the baseline real-estate search works: user context, visual embeddings, VLMs, quality models or richer item representations?
How would you handle new users and new posts in a social-feed recommender with text and image content?
OCR распознал текст на вывеске. Как понять, какой организации он соответствует, и когда результат можно публиковать?
Команда развивает мультимодальную модель для поиска и продукта вроде нейро-ответов. Какие use cases стоит выбрать и как приоритизировать?
Что значит "репрезентативное фото" для организации в гео-продукте и как выбрать такое фото автоматически?
Что делать, если бизнес-изменение записалось в БД, а событие в Kafka не отправилось?
У товара может быть несколько фотографий: общий вид, детали, разные ракурсы. Как получить устойчивое представление товара для поиска по фото?
Как объяснить bias-variance tradeoff, почему это не только синоним underfitting/overfitting и как интерпретировать high/low bias and variance cases?
In PyTorch, what should Dataset do, what should collate_fn do, how do num_workers affect this, and where should .to(device) usually happen?
Compare REST and gRPC at a high level. Then explain what a database index does and what simple data structures can back an index.
Multiple threads update individual pixels of the same screen. What can go wrong, and how would you design synchronization?
Multiple clients send pixel updates to a central server over the internet. What transport/protocol would you use and what tradeoffs matter?
Как построить сервис, который по текстовому запросу генерирует презентацию и PDF?
Разберите мультимодальный fashion-рекомендер совместимых вещей: генерацию кандидатов, эмбеддинги, разметку образов, hard negatives, reranking и то, что не сработало.
Есть две одинаковые неоднородные веревки. Каждая полностью сгорает за 60 минут, но скорость горения по длине неизвестна. Есть зажигалка. Как отмерить 45 минут?
Пользователь повторно отправил запрос на пополнение баланса. Как сделать endpoint идемпотентным?
Как Redis обрабатывает запросы внутри и за счет чего отдельные команды выглядят атомарными и согласованными для клиента?
Как адаптировать имеющуюся модель под новые задачи? Какие варианты вы бы рассмотрели и от чего зависит выбор?
Агент генерирует презентации/таблицы/документы. Как хранить версии артефактов и поддерживать откат/редактирование?
В датасете есть missing values и шумные признаки. Как системно обработать их до обучения и в production?
Для realtime CTR dashboard нужно описать Kafka/event log. Какая схема события нужна и по какому ключу партиционировать?
Когда накопившийся технический долг оправдывает переписывание сервиса или ML-платформы с нуля, а когда лучше улучшать систему итеративно?
В микросервисной системе сервисы общаются через API и события. Как документировать и проверять контракты, чтобы релизы не ломали consumers?
Fashion item-to-item рекомендации возвращают много почти одинаковых вещей. Как разделить ответственность retrieval, ranking и reranking, чтобы сохранить релевантность и добавить разнообразие?
В time-series табличной задаче кандидат выбирает CatBoost. Как объяснить выбор и какой baseline нужен?
Какие риски возникают при применении RL к trading/market-making задачам?
Представления пользователя и поста для мультимодальной ленты
Разбиение данных и утечки в фрод-модели
Разбор training loop на PyTorch для многоклассовой классификации
Какие базовые семейства алгоритмов есть в рекомендациях и что делать с cold start?
Сжатие моделей и catastrophic forgetting
Пользователь создал презентацию, PDF и таблицу, а потом просит "отсортируй это". Как понять, к чему относится команда?
Как тестировать и выкатывать prompt changes в LLM-продукте?
Что делать, если продукт хочет модель, а данных нет
ASR+LLM бейзлайн для извлечения записи клиента из звонка
Объясните scaled dot-product attention, его сложность, и зачем нужны GQA/MQA и Sliding Window Attention.
Объясните scaled dot-product attention, зачем Transformer нужны positional embeddings, как работает BPE-токенизация и в чем идея LoRA при fine-tuning.
Какие backend-компоненты нужны для LLM-продукта с tools, cache и долгими задачами?
Stream job считает CTR по окнам и падает посередине часа. Как не потерять данные и не задвоить агрегаты?
Есть робот-кассир: пользователь ставит поднос с едой, система делает фото и за пару секунд должна распознать блюда и сформировать чек. Как спроектировать ML-систему?
If the old product used filters rather than free-form text, how would you train a query parser or query encoder before real text-query logs exist?
Design a similar-items recommender for 1M items when the current collaborative model fails on cold-start items and misses semantic similarity.
A video analytics product watches kitchen staff and must check whether people follow location-specific safety protocols. The system needs kitchen rules, time of day and staff context. How would you design the approach?
You have a categorical feature such as port_id. Compare one-hot encoding with historical target aggregates for tree models, and explain the leakage risks.
How would you design an LLM-agent loop that checks a task output using tools such as file reading, web access or document inspection?
Когда для мультимодальной модели нужен RLHF или DPO, и как собрать preference data для такого обучения?
Undo/redo для движка формул как в Excel
How would you handle geography in free-form real-estate queries and keep retrieval fast for millions of listings and high QPS?
A speech product collects user audio. How would you filter and route audio snippets for ASR/TTS training data without poisoning the dataset?
Дизайн сервиса суммаризации URL и текста
Большая нейросетевая RecSys-модель дает хороший offline quality, но ее нужно держать в рантайме. Что оптимизировать?
Проекту нужно повторить плохо документированный legacy-протокол. Как подойти к исследованию и реализации, если часть поведения приходится восстанавливать по трафику и старой системе?
Есть поток биржевых событий: price, exchange timestamp, local timestamp и два канала доставки primary/secondary. Как понять, все ли в порядке с данными?
В ranker нужно добавить новые признаки товара, пользователя и запроса. Что считать offline, а что online?
Как на уровне Kafka/очереди рассуждать про replication, min.insync.replicas, acknowledgements и CAP trade-off, если нужно не терять сообщения при отказах?
Система развернута в двух дата-центрах, целевой SLA выше 99.95. Какие архитектурные решения помогают не уронить весь продукт при отказе одного узла или сервиса?
В части событий secondary feed приходит быстрее primary. Как охарактеризовать эти случаи и найти причину?
Нужно спроектировать рекомендательную систему или ML-платформу с нуля. Как выбирать архитектуру, данные, candidate generation и ranking?
Шумные ASR-аннотации и агрегация расшифровок