Реальный собес2GIS2026-05-05
2GIS: Computer Vision для фото заведений и OCR
CV-собеседование про выбор лучшего фото для категории еды, CLIP vs supervised classifier, датасет/разметку, диагностику low-F1 классов и OCR вывесок.
Таймлайн собеседования
Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.
00:08:51-00:13:38MLSD
MLSDВыбор фото блюда для категории в выдаче
00:10:49-00:18:55Вопрос
ВопросCLIP vs multilabel classifier
00:18:55-00:20:27Вопрос
ВопросДатасет и разметка категорий еды
00:35:41-00:36:03Вопрос
ВопросКак чинить low-F1 классы
00:41:09-00:43:20Вопрос
ВопросЧто значит representative photo для организации
00:55:33-01:05:19Вопрос
ВопросSignage OCR pipeline
01:05:19-01:07:40Вопрос
ВопросOCR и гео-матчинг с организацией
Выводы и как готовиться
- Задачу фото категории полезно формулировать как retrieval/ranking: candidate generation, reranking и бизнес-фильтры.
- CLIP удобен как open-vocabulary baseline, но fixed taxonomy и hard classes часто требуют supervised refinement.
- OCR в гео-продукте становится entity resolution: текст нужно матчить с организацией с учетом координат и confidence.