Назад к подготовке

Как снижать hallucinations в production LLM-системе

LLM-агент иногда уверенно отвечает неверно. Какие инженерные меры помогут снизить риск hallucinations в production?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Сужаем контекст источниками, требуем citations, валидируем tool outputs, используем confidence/fallback, regression tests и мониторинг ошибок.

Полный разбор

Нужно работать на нескольких уровнях. На входе: retrieval только из разрешенных источников, явные инструкции "если данных нет, скажи, что не знаешь", ограничение контекста и версии документов. На выходе: schema validation, ссылки на источники, проверка фактов через tools или deterministic rules.

Для agentic workflow важно валидировать не только final answer, но и actions: аргументы tool calls, права доступа, таймауты, retries и человеческое подтверждение для рискованных действий. Если уверенность низкая или источники противоречат друг другу, система должна уходить в fallback или эскалацию.

В production это закрепляется тестами и мониторингом: curated bad cases, regression suite, sampling логов, пользовательские исправления, alert на рост fallback/hallucination rate.

Теория

Hallucinations нельзя полностью убрать одним prompt. Нужно уменьшать пространство неопределенности и добавлять проверяемые контуры.

Типичные ошибки

  • Надеяться только на более строгий prompt.
  • Не логировать документы и tool calls, из которых получен ответ.
  • Не делать fallback для low-confidence кейсов.

Как отвечать на собеседовании

  • Раздели меры на retrieval, generation, validation и monitoring.
  • Упомяни human-in-the-loop для рискованных действий.