Назад к подготовке

Агент, который делает презентацию из текста

Нужно спроектировать продукт: пользователь дает текстовую задачу, система делает презентацию со слайдами, таблицами и картинками. Как построить pipeline?

Ответить самому

Сначала сформулируйте ответ как на собеседовании, затем откройте разбор и оцените себя.

Загрузка

Короткий ответ

Разделить задачу на planning, structured slide spec, asset/table generation, render, validation и edit loop.

Полный разбор

Нельзя сразу просить LLM "сделай pptx" и надеяться на качество. Лучше разбить pipeline. Сначала planner извлекает цель, аудиторию, структуру и ограничения. Затем LLM генерирует typed slide spec: title, bullets, charts, tables, image prompts, speaker notes. Этот spec валидируется схемой.

Дальше отдельные tools делают assets: таблицы из данных, charts, изображения, layout/render в PPTX/PDF. После render нужен checker: нет ли пустых слайдов, переполненного текста, битых картинок, несогласованных чисел. Пользователь должен иметь edit loop: поменять стиль, убрать слайд, перегенерировать chart.

В production важны версии шаблонов, reproducibility, хранение artifacts и ограничения по приватным данным.

Типичные ошибки

  • Делать один giant prompt без structured spec.
  • Не валидировать слайды до render.
  • Не предусмотреть редактирование пользователем.

Как отвечать на собеседовании

  • Скажи typed intermediate representation.
  • Раздели LLM planning и deterministic rendering.