K4.6.2 Task 4.6

哪怕只是生成 Prompt 里的设计目标,也会压制审查发现

真正的独立意味着零生成上下文。不是”最少”的上下文,不是”相关”的上下文——是零。哪怕只是共享生成 prompt 里的设计目标,发现数量就减少 67%。

隔离光谱

共享给审查者的上下文每文件发现数
完整的生成对话0.3
代码 + 生成时的设计目标1.2
代码 + 仅审查标准3.6
人类审查者4.0

每一条泄露的生成上下文都在压制发现。“设计目标”看起来无害,但它告诉了审查者代码为什么这样写——制造的是对实现的同情而非批判性评估。

完全隔离(3.6)达到人类基线的 90%。部分隔离(1.2)只达到 30%。

“独立”到底是什么意思

审查者收到:

  • 生成的代码
  • 审查标准(来自 CLAUDE.md 或项目的质量标准)
  • 测试规格
  • 原始需求作为独立文档(不是生成 prompt)

审查者不收到:

  • 生成 prompt
  • 生成会话的对话历史
  • 生成阶段的设计依据或架构决策
  • 任何关于考虑过但放弃的替代方案的推理

提供需求但不带生成偏差

如果审查者需要理解代码应该做什么,提供原始需求文档——生成器当时用的同一份文档。不要提供生成 prompt,因为它既包含需求也包含实现推理。

需求文档描述的是代码应该完成什么。生成 prompt 描述的是 Claude 决定怎么完成。审查者需要前者;后者引入偏差。


一句话总结: 只给审查者提供代码、审查标准和原始需求——绝不要给生成 prompt 或对话历史——因为哪怕”相关的”生成上下文也会把每文件发现数从 3.6 压到 1.2。