GenAI Evaluation

FID, FVD, CLIPScore, VBench, temporal consistency, identity preservation, human preference and safety regression suites.

Что изучаем

FID, FVD, CLIPScore, VBench, temporal consistency, identity preservation, human preference and safety regression suites.

Что закрываем на этапе

Понять ключевые ограничения архитектуры или пайплайна для данного узла.
Понимать диагностические сигналы в проде и во время разработки.
Знать, где обычно ломается воспроизводимость и как проверять гипотезы.

Как проработать на собеседовании

Готовься не “перечислять термины”, а объяснять причинно-следственные связи между ограничениями системы, выбором решений и компромиссами по латентности, стоимости и надежности.

Материалы

Towards Accurate Generative Models of Video: FVD

https://arxiv.org/abs/1812.01717

VBench: Comprehensive Benchmark Suite for Video Generative Models

https://arxiv.org/abs/2311.17982

Pick-a-Pic: An Open Dataset of User Preferences for Text-to-Image Generation

https://arxiv.org/abs/2304.05988

Video and Audio Generation

Inference Optimization Foundations

Назад к программе