Назад к подготовке

ВопросСредняяmlsd-generalML System Design на техническом собеседовании · Sber / GigaChat

Как заранее понять пользу audio-event фичи

Есть новая возможность: по аудио понять событие вокруг пользователя, например лай собаки, открытие двери или разбитое стекло. Как до обучения модели понять, есть ли продуктовая польза?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Сначала формулируем сценарий и действие продукта: что ассистент делает после события, кому это полезно, как измерить пользу и какой вред от false positive.

Полный разбор

До модели нужно ответить на продуктовый вопрос: распознавание события само по себе не ценность. Ценность появляется, если система делает полезное действие: уведомляет, включает запись, меняет сценарий ассистента, запускает безопасность, помогает человеку с ограничениями. Дальше оцениваем частоту события, аудиторию, стоимость ошибки и user journey. Лай собаки может быть полезен не всем; разбитое стекло или сработавшая сигнализация могут быть high-value, но требуют низкого false positive и понятной реакции. Проверить гипотезу можно без полной ML-системы: fake door test, ручная разметка аудио, прототип с готовой моделью, интервью пользователей, A/B уведомлений на synthetic/curated events. Метрики: activation, response rate, disable rate, complaints, false alarm rate, retention.

Теория

MLSD начинается с product action: модель должна менять решение системы, иначе это просто техническая возможность.

Типичные ошибки

Сразу обсуждать архитектуру модели без сценария использования.
Не учитывать стоимость ложной тревоги.
Не определить, какое действие должен сделать ассистент.

Как отвечать на собеседовании

Сначала спроси: что продукт делает после события?
Назови пользу, риск ошибки и способ дешевой проверки гипотезы.