К тренажеру
ВопросHardmlsd-generalРеальный собес

Rare event classification по temporal embeddings

Есть последовательность embedding-ов дорожной сцены за временное окно. Нужно находить несколько редких событий интереса. Как сформулировать ML-задачу и baseline?

Короткий ответ

Это multi-label temporal classification: на входе sequence embeddings, на выходе sigmoid heads по событиям. Baseline: pooling/temporal CNN/Transformer поверх окна, weighted BCE или focal loss для rare labels.

Полный разбор

Сначала нужно определить единицу предсказания: fixed time window, clip или rolling segment. Если в одном окне могут быть несколько событий, это multi-label, а не multiclass: используем независимые sigmoid heads и threshold per event.

Baseline можно сделать простым: aggregate temporal embeddings через mean/max pooling и MLP. Более сильный вариант - temporal CNN, GRU или Transformer с positional/time features. Для редких событий важны class weights, focal loss или sampling strategy, потому что обычная BCE на дисбалансных labels быстро учится предсказывать "ничего нет".

Дальше нужно зафиксировать labeling contract: событие относится ко всему окну или к конкретному моменту, можно ли расширять labels по соседним timestamp-ам, что делать с overlap-ом и шумными annotations.

Теория

Редкие события в последовательностях обычно требуют multi-label постановки, temporal aggregation и явной борьбы с class imbalance.

Типичные ошибки

  • Сделать multiclass softmax, хотя события могут пересекаться.
  • Не обсудить class imbalance и threshold selection.
  • Не определить temporal window и semantics label-а.

Как отвечать на собеседовании

  • Начни с window, labels и multi-label sigmoid.
  • Назови weighted BCE/focal loss и простой pooling baseline.