Реальный собесAgeCode2026-03-26
AgeCode MLSD: поиск по статьям, BM25 и RAG
ML System Design собеседование про поиск по базе статей: BM25 baseline, hybrid retrieval, offline/online evaluation и related articles через reranker.
Таймлайн собеседования
Сначала список вопросов и задач по ходу записи. Условие или вопрос можно раскрыть отдельно; решение и разбор спрятаны в отдельной плашке.
00:07:52-00:10:57MLSD кейсconfidence: high
Почему начинать поиск по статьям с BM25 baseline
SearchRAGBM25
00:10:57-00:14:49MLSD кейсconfidence: high
Как оценивать поиск/RAG по статьям offline и online
SearchRAGmetrics
00:21:07-00:26:24MLSD кейсconfidence: high
Как проектировать related articles и reranker
Searchrerankerrelated articles
Выводы и как готовиться
- Даже для RAG/search кейса стоит начинать с BM25 baseline, чтобы было с чем сравнивать embeddings и reranker.
- Метрики нужно разделять на offline relevance, online поведение пользователя и production guardrails.
- Related articles можно делать precomputed baseline, а затем усиливать query-aware reranker.