Temporal embeddings и hard-case mining
Модель получает temporal embeddings, но один из event heads работает плохо. Как улучшать качество: features, post-processing, labels, hard cases?
Короткий ответ
Нужно сделать error analysis по false negatives/false positives, проверить label noise, добавить temporal/context features, сгладить predictions во времени и собрать hard cases через active learning.
Полный разбор
Если один head проседает, сначала смотрим ошибки: где именно false negatives, где false positives, какие условия, классы объектов, время суток, погода, плотность сцены, длина события. Часто проблема не в архитектуре, а в шумных labels или слишком коротком/длинном window.
Model-side варианты: добавить positional/time features, attention over frames, event-specific head, temporal smoothing, hysteresis threshold, post-filtering коротких spikes, class-balanced sampling и focal loss. Data-side варианты часто важнее: hard negative mining, активная разметка uncertain cases, пересмотр инструкции annotator-ам и targeted labeling редких slice-ов.
Если событий несколько, нужно проверить loss weighting: общий loss может доминироваться частыми labels, а редкий head получает слабый gradient.
Теория
Улучшение rare-event модели начинается с error analysis и data strategy. Архитектурная замена без диагностики часто не попадает в проблему.
Типичные ошибки
- Сразу усложнять модель, не посмотрев false negatives.
- Не проверять шум и semantics label-а.
- Не учитывать, что общий loss может подавлять редкий event head.
Как отвечать на собеседовании
- Раздели model-side и data-side улучшения.
- Назови hard-case mining, active learning и temporal smoothing.