Назад к подготовке

ВопросСложнаяml-evaluationML System Design из фидбека после собеседования · Waymo

Temporal embeddings и hard-case mining

Модель получает temporal embeddings, но один из event heads работает плохо. Как улучшать качество: features, post-processing, labels, hard cases?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Нужно сделать error analysis по false negatives/false positives, проверить label noise, добавить temporal/context features, сгладить predictions во времени и собрать hard cases через active learning.

Полный разбор

Если один head проседает, сначала смотрим ошибки: где именно false negatives, где false positives, какие условия, классы объектов, время суток, погода, плотность сцены, длина события. Часто проблема не в архитектуре, а в шумных labels или слишком коротком/длинном window. Model-side варианты: добавить positional/time features, attention over frames, event-specific head, temporal smoothing, hysteresis threshold, post-filtering коротких spikes, class-balanced sampling и focal loss. Data-side варианты часто важнее: hard negative mining, активная разметка uncertain cases, пересмотр инструкции annotator-ам и targeted labeling редких slice-ов. Если событий несколько, нужно проверить loss weighting: общий loss может доминироваться частыми labels, а редкий head получает слабый gradient.

Теория

Улучшение rare-event модели начинается с error analysis и data strategy. Архитектурная замена без диагностики часто не попадает в проблему.

Типичные ошибки

Сразу усложнять модель, не посмотрев false negatives.
Не проверять шум и semantics label-а.
Не учитывать, что общий loss может подавлять редкий event head.

Как отвечать на собеседовании

Раздели model-side и data-side улучшения.
Назови hard-case mining, active learning и temporal smoothing.