Vertex / BP
Аудиозапись технического собеседованияТехническое собеседование2026-04-02
Vertex / BP: invoice parsing, OCR и AI CI/CD
ML System Design интервью по извлечению полей из PDF-инвойсов: native/scanned PDF, OCR, rules/NER/LLM hybrid, latency/cost, gold set, CI/CD и rollback.
Аудио и материалы
Аудио собеседования
0:00 / 58:44
Выводы и как готовиться
- Document AI pipeline лучше строить как hybrid: deterministic extraction, OCR/layout, model extraction и business validation.
- Cost/latency оптимизируется через stage-level instrumentation и routing простых документов в дешевые пути.
- Prompt/model/rule changes требуют gold set, field-level regression checks, canary и rollback.