Яндекс
Аудиозапись технического собеседованияТехническое собеседование2024-11-21
Yandex VLM final: мультимодальные сценарии, evaluation и serving
Финальная/командная секция вокруг VLM-продуктов: product use cases, multimodal query rewriting, prompting vs fine-tuning, caption evaluation, preference optimization и production serving.
Аудио и материалы
Аудио собеседования
0:00 / 1:15:25
Выводы и как готовиться
- VLM должна быть привязана к конкретным UX-сценариям, метрикам и fallback, иначе это просто platform capability.
- Evaluation captions требует factual grounding и task usefulness, а не только similarity to reference.
- В production тяжелую VLM нужно выносить в offline enrichment или model cascade, если latency path критичен.
