К тренажеру
ВопросMediumcv-system-designРеальный собес

Low-F1 классы в CV taxonomy

Модель хорошо работает в среднем, но у части классов низкий F1. Как диагностировать и чинить?

Короткий ответ

Нужно посмотреть confusion matrix и ошибки, проверить разметку/imbalance, добавить hard negatives, изменить prompts/descriptions, thresholds или обучить специализированную голову.

Полный разбор

Диагностика начинается с per-class precision/recall/F1 и confusion matrix. Нужно понять, что именно происходит: мало positives, много похожих классов, плохая разметка, неоднозначная taxonomy, domain shift или неверный threshold.

Дальше действия зависят от причины: добрать данные и hard negatives, уточнить инструкцию разметки, объединить слишком близкие классы, калибровать thresholds per class, улучшить текстовые описания категорий для CLIP, дообучить projection/head или сделать specialized model для группы классов.

Важно не оптимизировать только macro-F1, если бизнесу важны конкретные категории или стоимость false positives выше false negatives.

Теория

Low-F1 class может быть data problem, taxonomy problem или model problem. Их нельзя лечить одним способом.

Типичные ошибки

  • Сразу менять архитектуру без error analysis.
  • Не разделять precision и recall.
  • Игнорировать неоднозначные классы taxonomy.

Как отвечать на собеседовании

  • Начни с confusion matrix и просмотра ошибок.
  • Назови hard negatives и threshold calibration.