Low-F1 классы в CV taxonomy
Модель хорошо работает в среднем, но у части классов низкий F1. Как диагностировать и чинить?
Короткий ответ
Нужно посмотреть confusion matrix и ошибки, проверить разметку/imbalance, добавить hard negatives, изменить prompts/descriptions, thresholds или обучить специализированную голову.
Полный разбор
Диагностика начинается с per-class precision/recall/F1 и confusion matrix. Нужно понять, что именно происходит: мало positives, много похожих классов, плохая разметка, неоднозначная taxonomy, domain shift или неверный threshold.
Дальше действия зависят от причины: добрать данные и hard negatives, уточнить инструкцию разметки, объединить слишком близкие классы, калибровать thresholds per class, улучшить текстовые описания категорий для CLIP, дообучить projection/head или сделать specialized model для группы классов.
Важно не оптимизировать только macro-F1, если бизнесу важны конкретные категории или стоимость false positives выше false negatives.
Теория
Low-F1 class может быть data problem, taxonomy problem или model problem. Их нельзя лечить одним способом.
Типичные ошибки
- Сразу менять архитектуру без error analysis.
- Не разделять precision и recall.
- Игнорировать неоднозначные классы taxonomy.
Как отвечать на собеседовании
- Начни с confusion matrix и просмотра ошибок.
- Назови hard negatives и threshold calibration.