Computer Vision
От обработки изображений и CNN до Vision Transformers, детекции, сегментации, генеративных моделей и production-деплоя CV-систем.
📐 Основы CV
Введение в Computer Vision
Что такое CV, основные задачи (classification, detection, segmentation, generation), ключевые датасеты (ImageNet, COCO, VOC).
Обработка изображений
Пиксели, каналы, цветовые пространства (RGB, HSV, LAB), аугментации, torchvision transforms, Albumentations.
Основы CNN
Свёрточные нейросети: convolution, pooling, feature maps, receptive field, stride и padding.
Классические архитектуры CNN
Эволюция CNN: LeNet → AlexNet → VGG → GoogLeNet/Inception → ResNet. Skip connections и batch normalization.
🎯 Детекция и сегментация
Object Detection
Anchor-based (Faster R-CNN, SSD) и anchor-free (FCOS, CenterNet) детекторы. Non-Maximum Suppression (NMS).
YOLO
Семейство YOLO: архитектура backbone/neck/head, YOLOv5/v8/v9, real-time inference, Ultralytics.
Семантическая сегментация
Попиксельная классификация: FCN, U-Net, DeepLab. Encoder-decoder архитектуры, atrous convolution.
Instance и Panoptic сегментация
Mask R-CNN, Panoptic FPN — отличие instance от semantic и panoptic segmentation.
🧠 Современные подходы
Vision Transformers (ViT)
Patch embeddings, ViT архитектура, position embeddings, сравнение с CNN по эффективности и качеству.
Гибриды CNN + Transformer
Swin Transformer (shifted windows), ConvNeXt, EfficientNet-V2 — лучшее из двух миров.
Self-Supervised Learning в CV
Контрастивное обучение (SimCLR), self-distillation (DINO), маскированные автоэнкодеры (MAE), мультимодальность (CLIP).
Генеративные модели
GAN (StyleGAN), VAE, Diffusion Models (DDPM, Stable Diffusion) — генерация и редактирование изображений.
3D Vision
опц.Depth estimation, point clouds (PointNet), Neural Radiance Fields (NeRF), 3D reconstruction.
🚀 Production CV
Метрики в CV
mAP, IoU, Dice coefficient, Precision/Recall для детекции, FID/IS для генерации.
Оптимизация инференса
TensorRT, ONNX Runtime, quantization (INT8/FP16), pruning, knowledge distillation — ускорение моделей.
CV System Design
опц.Проектирование CV-пайплайнов: видеоаналитика, edge deployment, модели на мобильных устройствах.
Подготовка к собеседованию по CV
опц.Частые вопросы на собеседованиях по Computer Vision: от базовых CNN до system design.