Mirai
Аудиозапись технического собеседованияТехническое собеседование2026-05-07
Mirai: LLM inference, RL и distributed training
Research/infra собеседование про continuous batching, exploration в RL, UCB при большом action space, LoRA memory trade-offs, FP16/BF16 и parallelism.
Аудио и материалы
Аудио собеседования
0:00 / 1:00:25
Выводы и как готовиться
- Continuous batching надо объяснять через decode scheduler, разные длины запросов и KV cache management.
- В RL важно оценивать action-space/horizon до выбора exploration алгоритма.
- LoRA и distributed training вопросы проверяют память: optimizer state, activation memory, tensor/pipeline/FSDP trade-offs.
