Назад к тренажеру

Банк вопросов из реальных собеседований

Направления, темы и вопросы из записей интервью. Фильтры ниже сохраняются в ссылке.

Все вопросы

673

Полный банк вопросов из реальных собеседований.

ML-теория

119

Классический ML, нейросети, NLP, CV и RecSys без длинного кейса.

Python

67

Устройство языка, структуры данных, тестирование и инженерная база.

SQL

12

Запросы, агрегации, оконные функции и объяснение результата.

ML System Design

259

Архитектура ML-сервиса, данные, обучение, инференс, мониторинг и откат версии.

Метрики и A/B

101

Качество моделей, продуктовые метрики, эксперименты и валидация.

Продуктовые кейсы

72

Как разложить задачу продукта, ограничения, риски и первый бейзлайн.

Математика и статистика

18

Вероятность, статистика, оценки, распределения и аккуратные допущения.

Behavioral Interview

25

Ответственность за задачу, конфликты, мотивация, коммуникация и работа с фидбеком.

Продуктовые кейсы

72 вопроса из реальных интервью

Открыть в общем банке
Темы
Сложность
Компания
Язык
Продуктовые кейсыEasy
Какие Linux-команды нужны для диагностики сервера

Интервьюер спрашивает, какими Linux-командами пользоваться на сервере для навигации, поиска файлов, логов и диагностики процессов.

linuxopsdebuggingserver
FlameTree
Продуктовые кейсыMedium
Cold start в рекомендациях для нового пользователя

Как решать cold start для нового пользователя в ленте рекомендаций? Когда использовать popularity, user-based, item-based и content-based подходы?

cold startuser-based recommendationsitem-based recommendationscontent features
GamerAM
Продуктовые кейсыMedium
Kafka partitions и время обработки consumer group

В Kafka topic 10 partitions и 100 задач: 90 задач по 90 ms и 10 задач по 1 s. Задачи равномерно лежат по partitions, внутри partition порядок последовательный. Как оценить best/worst completion time для 1, 10 и 20 consumers?

kafkaparallelismbackendconsumer-groups
Tevian
Продуктовые кейсыMedium
Product use cases для VLM в поисковом продукте

Команда развивает мультимодальную модель для поиска и продукта вроде нейро-ответов. Какие use cases стоит выбрать и как приоритизировать?

vlmproduct-strategyvisual-searchneuro
Яндекс
Продуктовые кейсыMedium
Агрегация нескольких фото товара

У товара может быть несколько фотографий: общий вид, детали, разные ракурсы. Как получить устойчивое представление товара для поиска по фото?

visual-searchembeddingsАгрегацияcatalog
Wildberries
Продуктовые кейсыMedium
Глубокий разбор мультимодального fashion-рекомендера совместимых вещей

Разберите мультимодальный fashion-рекомендер совместимых вещей: генерацию кандидатов, эмбеддинги, разметку образов, hard negatives, reranking и то, что не сработало.

RecSysFashionCLIPmultimodal embeddingstriplet loss
Fairmarkit
Продуктовые кейсыMedium
Две неоднородные веревки и 45 минут

Есть две одинаковые неоднородные веревки. Каждая полностью сгорает за 60 минут, но скорость горения по длине неизвестна. Есть зажигалка. Как отмерить 45 минут?

math-puzzlereasoninginvariantsoral-math
Adapty
Продуктовые кейсыMedium
Как Redis обрабатывает команды и сохраняет атомарность

Как Redis обрабатывает запросы внутри и за счет чего отдельные команды выглядят атомарными и согласованными для клиента?

Redisatomicityevent loopsingle-threaded
GamerAM
Продуктовые кейсыMedium
Как адаптировать имеющуюся модель под новые задачи

Как адаптировать имеющуюся модель под новые задачи? Какие варианты вы бы рассмотрели и от чего зависит выбор?

fine-tuningadapterstransfer learningmodel heads
Wisebits / xHamster
Продуктовые кейсыMedium
Как версионировать артефакты LLM-агента

Агент генерирует презентации/таблицы/документы. Как хранить версии артефактов и поддерживать откат/редактирование?

Версионирование артефактовLLM-агентыУправление состояниемsystem-design
Unimatch
Продуктовые кейсыMedium
Какие события класть в Kafka и как партиционировать

Для realtime CTR dashboard нужно описать Kafka/event log. Какая схема события нужна и по какому ключу партиционировать?

kafkaПотоковая обработкаpartitioningads
Компания не указана
Продуктовые кейсыMedium
Когда переписывать ML/inference платформу из-за техдолга

Когда накопившийся технический долг оправдывает переписывание сервиса или ML-платформы с нуля, а когда лучше улучшать систему итеративно?

technical debtplatform rewriteНадежностьdeveloper velocity
GamerAM
Продуктовые кейсыMedium
Переранжирование и разнообразие в fashion-рекомендациях item-to-item

Fashion item-to-item рекомендации возвращают много почти одинаковых вещей. Как разделить ответственность retrieval, ranking и reranking, чтобы сохранить релевантность и добавить разнообразие?

RecSysrerankingdiversityFashionCLIP
T-Bank
Продуктовые кейсыMedium
Состояние артефакта и маршрутизация команд пользователя

Пользователь создал презентацию, PDF и таблицу, а потом просит "отсортируй это". Как понять, к чему относится команда?

Артефактыsession stateroutingLLM-агенты
Unimatch
Продуктовые кейсыHard
CV для робота-кассира в столовой

Есть робот-кассир: пользователь ставит поднос с едой, система делает фото и за пару секунд должна распознать блюда и сформировать чек. Как спроектировать ML-систему?

computer-visionobject-detectionfood-recognitionlatency
CV catering
Продуктовые кейсыHard
Как повторить плохо описанный протокол

Проекту нужно повторить плохо документированный legacy-протокол. Как подойти к исследованию и реализации, если часть поведения приходится восстанавливать по трафику и старой системе?

protocolsreverse-engineeringbackendresearch-engineering
Мультифактор
Продуктовые кейсыHard
Как проверять качество биржевых market data

Есть поток биржевых событий: price, exchange timestamp, local timestamp и два канала доставки primary/secondary. Как понять, все ли в порядке с данными?

hftmarket-datadata-qualitytimestamps
Wunderfund
Продуктовые кейсыHard
Отказоустойчивая Kafka-очередь

Как на уровне Kafka/очереди рассуждать про replication, min.insync.replicas, acknowledgements и CAP trade-off, если нужно не терять сообщения при отказах?

kafkafault-tolerancedistributed-systemsreplication
Мультифактор
Продуктовые кейсыHard
Отказоустойчивость в двух дата-центрах

Система развернута в двух дата-центрах, целевой SLA выше 99.95. Какие архитектурные решения помогают не уронить весь продукт при отказе одного узла или сервиса?

fault-tolerancedistributed-systemsslaresilience-patterns
Мультифактор
Банк вопросов из реальных собеседований — ML Mentor