tool_use 消灭了结构错误。语义错误还在。 | 提示工程与优化

带 JSON Schema 的 tool_use 保证两件事：零 JSON 语法错误和零 schema 违规。每个响应都是合法 JSON，所有必填字段都在，类型都对。这是 API 生成层面的强制保证——不是概率性的，不是事后检查的。

它保证不了的是：语义正确性。作者名跑到 version 字段里。行项目加起来不等于总计。必填字段里放的是编造数据。日期在逻辑上矛盾。

三层错误模型

三阶段改进的数据：

每个阶段处理不同的错误类别。tool_use 本身砍掉了一半错误，但语义问题原封不动。应用层验证处理了剩余的差距。

当 8% 的提取把值放进了错误字段时，给工具参数加上清晰的描述——说明每个字段该放什么值——引导 Claude 做正确的语义映射。这是弥补 schema 合规和内容正确性之间差距的推荐做法。

在 prompt 里写”输出合法 JSON”无法保证语法正确性或 schema 合规。解析失败后重试是被动的变通方案，浪费 API 调用。tool_use 在设计上就提供结构保证。

用 tool_choice: auto 配合虚拟提取工具时，模型有时会返回文本而不是调用工具，打断下游解析。切换到强制 tool_choice 来确保每次调用都返回结构化输出。

“把验证全删了——tool_use 保证了正确性”是错的。tool_use 保证的是结构，不是语义。对于财务文档，业务逻辑验证（行项目加总、日期先后顺序）仍然必不可少。JSON Schema 表达不了跨字段的算术约束。

一句话总结： tool_use 在 API 层面消灭语法和 schema 错误，但语义验证（跨字段逻辑、值的正确性）仍然是你的责任——结构有保证，含义没有。