Назад к подготовке
ВопросЛегкаяdeep-learning-basicsСкрининг · Wisebits / xHamster

Переобучение нейросети и аугментации в CV

Назовите специфичные для нейросетей способы борьбы с переобучением. Какие способы аугментации данных можно использовать в Computer Vision?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Против переобучения используют dropout, weight decay/L2, early stopping, контроль размера модели, корректный validation split, label smoothing и аугментации. В CV это кропы, отражения, повороты, ресайз, цветовые искажения, шум, blur, affine transforms, MixUp/CutMix, если они не ломают разметку.

Полный разбор

Базовый набор: weight decay, dropout, early stopping, уменьшение емкости модели, аккуратное разбиение на train/validation, label smoothing и аугментации. BatchNorm и LayerNorm не стоит называть только регуляризаторами: они в первую очередь помогают оптимизации, но на практике часто снижают давление переобучения.

В Computer Vision аугментации должны соответствовать инвариантностям задачи. Часто используют random crop, horizontal flip, resize, небольшие повороты, color jitter, изменение контраста и яркости, blur, шум и affine transforms. Для классификации иногда помогают MixUp и CutMix, потому что они сглаживают границы решений.

Главная оговорка - корректность target. Horizontal flip может поменять класс “лево/право”, crop может убрать объект, rotation может сломать текстовые или orientation labels, а для detection/segmentation нужно трансформировать разметку вместе с изображением.

Теория

Регуляризация снижает зависимость модели от случайных паттернов, а аугментация расширяет обучающее распределение допустимыми преобразованиями.

Типичные ошибки

  • Перечислять аугментации без проверки, остается ли валидной разметка.
  • Считать BatchNorm только inference-time трюком.
  • Добавлять агрессивные аугментации до исправления утечек между train и validation.

Как отвечать на собеседовании

  • Разделите регуляризацию модели и аугментацию данных.
  • Отдельно проговорите трансформацию target для detection и segmentation.