Агент, который делает презентацию из текста
Нужно спроектировать продукт: пользователь дает текстовую задачу, система делает презентацию со слайдами, таблицами и картинками. Как построить pipeline?
Ответить самому
Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.
Короткий ответ
Разделить задачу на planning, structured slide spec, asset/table generation, render, validation и edit loop.
Полный разбор
Нельзя сразу просить LLM "сделай pptx" и надеяться на качество. Лучше разбить pipeline. Сначала planner извлекает цель, аудиторию, структуру и ограничения. Затем LLM генерирует typed slide spec: title, bullets, charts, tables, image prompts, speaker notes. Этот spec валидируется схемой.
Дальше отдельные tools делают assets: таблицы из данных, charts, изображения, layout/render в PPTX/PDF. После render нужен checker: нет ли пустых слайдов, переполненного текста, битых картинок, несогласованных чисел. Пользователь должен иметь edit loop: поменять стиль, убрать слайд, перегенерировать chart.
В production важны версии шаблонов, reproducibility, хранение artifacts и ограничения по приватным данным.
Типичные ошибки
- Делать один giant prompt без structured spec.
- Не валидировать слайды до render.
- Не предусмотреть редактирование пользователем.
Как отвечать на собеседовании
- Скажи typed intermediate representation.
- Раздели LLM planning и deterministic rendering.