Rare event classification по temporal embeddings
Есть последовательность embedding-ов дорожной сцены за временное окно. Нужно находить несколько редких событий интереса. Как сформулировать ML-задачу и baseline?
Короткий ответ
Это multi-label temporal classification: на входе sequence embeddings, на выходе sigmoid heads по событиям. Baseline: pooling/temporal CNN/Transformer поверх окна, weighted BCE или focal loss для rare labels.
Полный разбор
Сначала нужно определить единицу предсказания: fixed time window, clip или rolling segment. Если в одном окне могут быть несколько событий, это multi-label, а не multiclass: используем независимые sigmoid heads и threshold per event.
Baseline можно сделать простым: aggregate temporal embeddings через mean/max pooling и MLP. Более сильный вариант - temporal CNN, GRU или Transformer с positional/time features. Для редких событий важны class weights, focal loss или sampling strategy, потому что обычная BCE на дисбалансных labels быстро учится предсказывать "ничего нет".
Дальше нужно зафиксировать labeling contract: событие относится ко всему окну или к конкретному моменту, можно ли расширять labels по соседним timestamp-ам, что делать с overlap-ом и шумными annotations.
Теория
Редкие события в последовательностях обычно требуют multi-label постановки, temporal aggregation и явной борьбы с class imbalance.
Типичные ошибки
- Сделать multiclass softmax, хотя события могут пересекаться.
- Не обсудить class imbalance и threshold selection.
- Не определить temporal window и semantics label-а.
Как отвечать на собеседовании
- Начни с window, labels и multi-label sigmoid.
- Назови weighted BCE/focal loss и простой pooling baseline.