К тренажеру
ВопросHardml-evaluationРеальный собес

Temporal embeddings и hard-case mining

Модель получает temporal embeddings, но один из event heads работает плохо. Как улучшать качество: features, post-processing, labels, hard cases?

Короткий ответ

Нужно сделать error analysis по false negatives/false positives, проверить label noise, добавить temporal/context features, сгладить predictions во времени и собрать hard cases через active learning.

Полный разбор

Если один head проседает, сначала смотрим ошибки: где именно false negatives, где false positives, какие условия, классы объектов, время суток, погода, плотность сцены, длина события. Часто проблема не в архитектуре, а в шумных labels или слишком коротком/длинном window.

Model-side варианты: добавить positional/time features, attention over frames, event-specific head, temporal smoothing, hysteresis threshold, post-filtering коротких spikes, class-balanced sampling и focal loss. Data-side варианты часто важнее: hard negative mining, активная разметка uncertain cases, пересмотр инструкции annotator-ам и targeted labeling редких slice-ов.

Если событий несколько, нужно проверить loss weighting: общий loss может доминироваться частыми labels, а редкий head получает слабый gradient.

Теория

Улучшение rare-event модели начинается с error analysis и data strategy. Архитектурная замена без диагностики часто не попадает в проблему.

Типичные ошибки

  • Сразу усложнять модель, не посмотрев false negatives.
  • Не проверять шум и semantics label-а.
  • Не учитывать, что общий loss может подавлять редкий event head.

Как отвечать на собеседовании

  • Раздели model-side и data-side улучшения.
  • Назови hard-case mining, active learning и temporal smoothing.