AI Agents
一种使用 LLM 决定下一步、调用工具执行决定、并循环直到完成目标的软件形态。
AI Agent 是这套循环,不是模型本身。模型(Claude、GPT、Gemini、开源权重 LLM)是决策者。Agent 是运行时:它给模型一个目标,让它调用工具(一个数据库、一个 API、一个代码解释器、另一个 Agent),常常经由 MCP,观察结果,并把循环喂下去直到完成。
这个区分要紧,因为 Agent 式系统的失败方式与直接的 LLM 应用不同。聊天机器人答错了,用户翻篇。一个答错的 Agent 会发出一封邮件、做一笔交易,或删一份文件。生产级 Agent 需要授权 Gate、可观测性和熔断器,而多数原型都跳过了这些。
最常见的生产失败,举个实际例子:一个客服 Agent 被给了一个「解决工单」的目标和一组工具。一张畸形工单把它送进一个循环,它把同一个查询工具调了几十次,一下午就烧光了模型预算,却从未抵达一个解决方案。修法不是一个更聪明的 Prompt,而是工程:一个硬性步数上限、一个成本天花板,以及一个会停下循环并升级给人的熔断器。任何会写的动作(发一条消息、做一笔支付、删一条记录)都加一个 Human-in-the-Loop 的 Gate;只读的循环通常可以无人值守地跑。
诚实的取舍与该避免的创始人错误:Agent 增加了非确定性、延迟,以及比固定流水线大得多的爆炸半径,换来的是处理那些步骤无法预先枚举的任务。多数被吹成「Agentic」的工作流其实是被充分理解的,用一条确定性流水线、中间放一两次 LLM 调用、常常再由 RAG 提供接地,会服务得更好。Wavect 的立场:先问 AI 是不是这里合适的工具,再问 Agent 是不是合适的 AI 形态。如果你能把步骤写下来,就别让模型即兴去演它们。