不同错误需要不同修复——别重新提交整个 Batch | 提示工程与优化

错误分布模式

典型的 batch 失败分布：

不分类地对待所有错误（盲目重试）会复现那 60% 的上下文错误和 25% 的格式错误。只有 15% 的瞬态故障能从不修改的重试中受益。

如果 batch 的早期结果暴露出系统性的 prompt 错误（比如用了错误的提取 schema），在整个 batch 跑完之前取消。用一个已知有问题的 prompt 处理剩余 90% 的请求，浪费的是全部成本。

30 小时 SLA 下：

在提交数千份文档前，先在 20-50 份多样化的文档样本上测试 prompt。一个团队的对比：

每月 $8 的抽样投入省了每月 $300 的重处理费用——37 倍 ROI。

一句话总结： 先在 20-50 份文档样本上测试（37 倍 ROI），尽早取消有系统性错误的 batch，按错误类型分别修复，在 SLA 内为一轮恢复留出时间预算。