Назад к подготовке

Поиск недвижимости по текстовому запросу: метрики и признаки

Спроектируйте поиск недвижимости без явных фильтров: пользователь вводит свободный текст. Как на первом шаге определить метрики, признаки объявлений, query/user context и базовую схему retrieval/ranking?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Начать нужно с цели поиска и метрик: клики, открытия, сохранения, чаты/звонки, качественные лиды и revenue с guardrails по latency, пустым выдачам и релевантности. Для объявлений нужны geo, цена, комнаты, площадь, тип объекта, текстовые атрибуты и признаки из фото; дальше строится retrieval плюс ranker.

Полный разбор

Сначала фиксируем продуктовую поверхность: поиск покупки, долгосрочной аренды, посуточной аренды, квартир или домов может иметь разные интенты. Метрики должны отражать не только CTR, но и открытия карточек, сохранения, сообщения, звонки, качественные лиды, сделки и revenue. Guardrails: latency, пустые выдачи, жалобы, географическое покрытие, paid/organic balance и seller-side liquidity.

Для item нужны структурные признаки: гео, цена, число комнат, площадь, этаж, тип объекта, тип сделки, доступность. Из текста можно извлекать мягкие атрибуты: ремонт, вид, парковка, техника, шум, близость к метро или парку. Из фото полезны качество, ракурс/комната, визуальные embeddings и признаки интерьера.

На первом шаге схема обычно двухэтапная: retrieval набирает кандидатов, ranker сортирует их более сложной моделью. Важно отдельно думать про query: если пользователь пишет свободный текст, часть запроса нужно превращать в структурные атрибуты, а часть поддерживать full-text и vector search.

Теория

Поиск в маркетплейсе недвижимости - это одновременно релевантность, экономика площадки и ограничения latency.

Типичные ошибки

  • Сразу перейти к embeddings без определения метрик и ограничений.
  • Оставить только clicks и забыть про leads, звонки и revenue.
  • Игнорировать geo, цену и тип объекта как жесткие ограничения.

Как отвечать на собеседовании

  • Начните с метрик и guardrails.
  • Разделите item features, query understanding, retrieval и ranking.