К реальным собесам
Реальный собесAgeCode2026-03-26

AgeCode MLSD: поиск по статьям, BM25 и RAG

ML System Design собеседование про поиск по базе статей: BM25 baseline, hybrid retrieval, offline/online evaluation и related articles через reranker.

Таймлайн собеседования

Сначала список вопросов и задач по ходу записи. Условие или вопрос можно раскрыть отдельно; решение и разбор спрятаны в отдельной плашке.

00:07:52-00:10:57MLSD кейсconfidence: high

Почему начинать поиск по статьям с BM25 baseline

SearchRAGBM25
YouTube с таймкода
00:10:57-00:14:49MLSD кейсconfidence: high

Как оценивать поиск/RAG по статьям offline и online

SearchRAGmetrics
YouTube с таймкода
00:21:07-00:26:24MLSD кейсconfidence: high

Как проектировать related articles и reranker

Searchrerankerrelated articles
YouTube с таймкода

Выводы и как готовиться

  • Даже для RAG/search кейса стоит начинать с BM25 baseline, чтобы было с чем сравнивать embeddings и reranker.
  • Метрики нужно разделять на offline relevance, online поведение пользователя и production guardrails.
  • Related articles можно делать precomputed baseline, а затем усиливать query-aware reranker.