目标 + 标准胜过按步骤来：82 vs 68 质量分 | Agentic 架构与编排

协调者的 system prompt 决定了它怎么编排。按步骤的程序化提示产出可预测但僵化的行为。带质量标准的目标导向提示产出自适应行为，平均高 14 分——因为 45% 的研究查询能从策略调整中获益，而僵化的程序做不到。

数据：程序化 vs 目标导向

14 分的质量提升来自协调者在子代理结果揭示意外发现或缺口时的适应能力。目标导向输出更高的方差是健康的——简单查询产出简单报告，复杂查询产出复杂报告。强制均匀输出意味着在简单查询上过度投入或在复杂查询上投入不足。

500 查询 A/B 测试：

5% 的未完成是收敛问题，可以用迭代保护修复。19 分的质量差距是根本性的。程序化通过机械跟随步骤来”完成”——但 35% 的情况下那些步骤是错误的方案。一份完成但错误的报告比一份朝质量迭代的更差。

协调者 prompt 说：“步骤 1：用搜索 agent 找 5 篇论文。“在一个量子计算查询中，搜索 agent 找到了 2 篇论文和 1 份关键政府报告。协调者忽略了政府报告——prompt 说的是”论文”，不是”报告”。

目标导向 prompt（“产出有多样来源的全面分析”）会包含那份有价值的报告。协调者的职责是追求研究目标，不是匹配来源类型的规定格式。

两个极端都不是最优：

有效的中间路线：目标和质量标准作为主框架，配上可选的程序性提示给常见模式。“通常先广泛搜索再深入分析”是提示。“务必先广泛搜索”是命令。提示引导策略但不约束它。

同一个协调者处理简单事实查询和复杂多领域分析。Prompt 应该让投入成比例：

“先评估查询复杂度。简单事实查询用一个 agent 单 pass 就够。复杂多领域查询用多个 agent 并迭代直到覆盖标准满足。”

这自然缩放：简单查询快速解决，复杂查询深入调查。一个协调者，自适应策略。

CI 协调者需要两个看似矛盾的东西：自适应策略（纯文档 PR 跳过安全扫描）和可预测输出（审计人员需要一致的报告格式）。

修复：分开它们。

协调者调整审查的方式，同时始终产出审计人员期望的东西。适应性在调查过程中；可预测性在输出结构中。

一句话总结： 目标导向 prompt 带质量标准得 82 分 vs 程序化 68 分，因为 45% 的查询从自适应策略获益——用目标定义要达成什么，可选提示给常见模式，自适应策略和可预测输出格式分开。