К реальным собесам
Реальный собес2GIS2026-05-05

2GIS: Computer Vision для фото заведений и OCR

CV-собеседование про выбор лучшего фото для категории еды, CLIP vs supervised classifier, датасет/разметку, диагностику low-F1 классов и OCR вывесок.

Таймлайн собеседования

Компактный список вопросов и задач по ходу записи: раскрывайте только нужные детали.

00:08:51-00:13:38MLSD

Выбор фото блюда для категории в выдаче

00:10:49-00:18:55Вопрос

CLIP vs multilabel classifier

00:18:55-00:20:27Вопрос

Датасет и разметка категорий еды

00:35:41-00:36:03Вопрос

Как чинить low-F1 классы

00:41:09-00:43:20Вопрос

Что значит representative photo для организации

00:55:33-01:05:19Вопрос

Signage OCR pipeline

01:05:19-01:07:40Вопрос

OCR и гео-матчинг с организацией

Выводы и как готовиться

  • Задачу фото категории полезно формулировать как retrieval/ranking: candidate generation, reranking и бизнес-фильтры.
  • CLIP удобен как open-vocabulary baseline, но fixed taxonomy и hard classes часто требуют supervised refinement.
  • OCR в гео-продукте становится entity resolution: текст нужно матчить с организацией с учетом координат и confidence.