Как генерировать suggest-вопросы из статей
Для статьи нужно показать короткие suggest-вопросы или подсказки. Как получить их из текста статьи и не ухудшить качество поиска?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
MVP берет заголовки, FAQ, headings и популярные queries. LLM может предложить short questions, но система проверяет grounding, дедупликацию, токсичность и кликабельность.
Полный разбор
Suggest-вопрос должен вести к конкретной статье или группе статей. Для MVP можно использовать заголовок, подзаголовки, FAQ-блоки, внутренние anchors и реальные query logs. Это дает простые подсказки, которые легко объяснить редакторам.
LLM можно подключить как offline generator: модель читает статью и предлагает несколько коротких вопросов. Затем pipeline проверяет, что каждый вопрос поддерживается текстом статьи, не дублирует уже существующие подсказки, не обещает того, чего в статье нет, и укладывается в язык продукта.
После публикации suggest оценивается отдельно от поиска: acceptance rate, downstream click, solved feedback, жалобы и доля подсказок, которые ведут в пустые или нерелевантные результаты. Редакторский review полезен для медицинских, юридических и финансовых тем.
Теория
Suggest generation - это content generation plus search routing. Подсказка должна быть grounded в статье и проверяться поведением пользователя.