Как превратить годовой guidance в квартальные фичи
В отчете сказано: производство вырастет на 20% за год, рост начнется во второй половине года. Модели нужен прогноз по кварталам. Что должна вернуть LLM-фича?
Короткий ответ
Лучше вернуть структурированный объект: annual_guidance=+20%, timing=second_half, q1/q2 evidence missing, assumption_needed=true, confidence ниже. Не надо молча делить на 4.
Полный разбор
Если отчет дает годовой рост и говорит, что он начнется во втором полугодии, LLM не должна автоматически распределять +20% равномерно по кварталам. Это уже предположение, а не извлечение.
Правильный output: зафиксировать годовой guidance, период действия, timing hint, evidence, а для квартальных значений вернуть либо null, либо диапазон/сценарий с явным флагом assumption. Например: q1_growth=unknown, q2_growth=unknown, h2_growth_positive=true, annual_growth=20%.
Дальше бизнес-логика или downstream model может решить, как использовать это: отдельная categorical feature "growth concentrated in H2", сценарные фичи, prior distribution или ручная проверка. Главное — не смешивать факт из документа и синтетическое распределение.
Теория
В MLSD важно разделять extraction и imputation. LLM может извлечь факт и подсказку о timing, но квартальная декомпозиция часто является modeling assumption.
Типичные ошибки
- Молча разделить годовое число на 4 квартала.
- Не пометить, что квартальное распределение является предположением.
- Потерять evidence и units.
Как отвечать на собеседовании
- Скажи: факт отдельно, assumption отдельно.
- Предложи structured output с annual value, timing hint, evidence и confidence.