Назад к подготовке
Vertex / BP
Аудиозапись технического собеседованияТехническое собеседование2026-04-02

Vertex / BP: invoice parsing, OCR и AI CI/CD

ML System Design интервью по извлечению полей из PDF-инвойсов: native/scanned PDF, OCR, rules/NER/LLM hybrid, latency/cost, gold set, CI/CD и rollback.

Аудио и материалы

Аудио собеседования

0:00 / 58:44

Выводы и как готовиться

  • Document AI pipeline лучше строить как hybrid: deterministic extraction, OCR/layout, model extraction и business validation.
  • Cost/latency оптимизируется через stage-level instrumentation и routing простых документов в дешевые пути.
  • Prompt/model/rule changes требуют gold set, field-level regression checks, canary и rollback.