Agent 和 chatbot 的区别不在模型质量、多模态支持或对话长度。就一件事:它是否使用工具自主地执行动作?
分界线
Chatbot — 收到消息,生成文本回复,等待下一条消息。它回答问题、总结文本、翻译语言。它谈论事物,不做事物。它不对外部系统采取行动。
Agent — 收到任务,规划方案,使用工具与外部系统交互,执行多步动作来完成任务。它读文件、搜数据库、处理退款、创建 issue。它做事。
一个根据知识库回答”你们的退货政策是什么?“的客服 FAQ bot 是 chatbot。一个查你的订单、处理退款、更新你账户的解决系统是 agent。
四个区分能力
- 自主完成任务 — agent 驱动流程。它不在每一步之间等待指令。
- 多步规划 — agent 把复杂目标拆成子步骤并执行。
- 工具使用 — agent 通过工具与外部系统交互(数据库、API、文件)。
- 主动执行 — agent 采取行动而不是被动回应。
什么不构成区别
- 模型质量 — agent 和 chatbot 可以用同一个模型。区别在行为,不在模型等级。
- 多轮能力 — chatbot 也可以跨轮次维持对话上下文。多轮 ≠ agent。
- 问题复杂度 — chatbot 可以从训练数据回答复杂问题。问题复杂不等于它是 agent。
- 多模态输入 — 处理图片或音频不会让一个系统变成 agent。一个有工具的纯文本系统比一个没工具的多模态 chatbot 更”agent”。
- System prompt — agent 和 chatbot 都用 system prompt 做行为配置。
工具使用测试
如果你不确定某个东西是不是 agent:它是否调用工具与外部系统交互?它是否链式执行多个动作来完成任务?两个都是 yes,就是 agent。如果它只生成文本回复,那就是 chatbot——不管那些回复多精妙。
一句话总结: Agent 使用工具自主执行多步任务;chatbot 生成文本回复——区别在于工具介导的行动 vs 被动回应,不在模型质量或对话轮数。