从Demo到生产:谷歌开源 Agent Executor 解决了什么

谷歌上周开源了 Agent Executor(github.com/google/ax),一个面向生产环境的 AI Agent 运行时。这篇文章聊聊它解决了什么问题、为什么值得关注,以及在实际项目里怎么评估要不要用它。

痛点:Agent 上线后的“脏环境”

过去一年多,用 LangChain 搭个 Agent demo 大概半小时就能跑通。让 LLM 调个 API、查个数据库,随便找个教程跟着敲两下就完事了。问题出在“上线”这两个字上。

一旦你的 Agent 要跑几个小时、涉及多步操作、中间还得等人审批或者外部系统回包,事情就变得非常难看。Pod 重启一下,状态丢了。网络抖了一下,整个 workflow 得从头来。两个请求同时写 session,直接数据错乱。这些破事我司的 SRE 团队用各种胶带方案撑了大半年,每次上线前都要做心理建设。

谷歌这次开源的 Agent Executor,核心就干一件事:让 Agent 在生产的脏环境里活下来。

几个真正有用的能力

持久化执行(Durable Execution)

Agent 执行的每一步都会写事件日志。Pod挂了,从最近的 checkpoint 恢复。审批流程走到一半网络断了,连回来接着走。这个听起来简单,但自己做的话要处理状态机、快照、幂等重放,工作量不小。

沙箱隔离(Secure Sandboxing)

每个 Agent 组件跑在独立的沙箱里。一个插件崩了不会拖垮整个 Agent。对于企业场景来说,这个比“优雅”重要得多——你绝对不想 LLM 调的一个外部工具把整个生产环境搞炸。

轨迹分支(Trajectory Branching)

这个是我最喜欢的特性。Agent 在执行过程中可以在任意 checkpoint 保存状态,然后分支出不同的路径去试。试错了回退,不用从头再来。做 decision-making 类 Agent 的时候这个几乎必备。

连接恢复(Connection Recovery)

长流程里最常见的死法:数据库连不上了,API 超时了,然后整个 Agent 就卡死了。Agent Executor 内置了自动重连和状态保留,遇到网络抖动会自动重试,不会丢了半路上的数据。

战略层面:似曾相识的剧本

更深一层看,谷歌这步棋的战略意图很明显。InfoWorld 那篇文章里引用了 Broadcom 的 SRE 一句话说得很到位:“Give away the runtime, drive consumption on Google Cloud via services。” 跟 K8s 当年的玩法一模一样——把 runtime 开源,通过托管服务和云基础设施赚钱。

但从开发者角度,开源总归是好事。Agent Executor 兼容 Agent2Agent(A2A)协议,意味着它可以跟不同厂商的 Agent 互操作。你可以在本地跑一个 Agent 做数据预处理,然后把结果传给云上的另一个 Agent 做分析,两者通过 A2A 通信。这种跨边界协作的模式,在微服务时代叫服务网格,在 Agent 时代需要类似的编排层。

局限性:Runtime 不是万能的

当然,Agent Executor 不是万能药。Avasant 的分析师 Gaurav Dewan 说得对:runtime 解决了执行可靠性,但治理层——可解释性、策略执行、跨系统安全接入——依然需要额外的工作。CIO 们别以为装个 Agent Executor 就万事大吉了。

目前这个赛道已经有三家在抢:谷歌的 Agent Executor、微软的 AutoGen、AWS 的 Bedrock AgentCore。三家走的是同一个路线——上层工具开源或开放,下层基础设施收费。这对开发者来说是好事,选择多、不会被锁定。但也要留个心眼:选哪个生态,其实是在选未来几年你的技术栈会绑在哪朵云上。

实际建议

如果你正在做 Agent 相关项目,别急着把所有东西迁到 Agent Executor 上。先去读读它的设计文档,看看事件日志模型和 checkpoint 策略是否匹配你的场景。对于主要是短任务、无状态的 Agent,可能 LangChain 就够用了。但如果你在做的 Agent 要跑超过 5 分钟、涉及外部审批、或者需要跨服务协调,那 Agent Executor 值得认真评估。

Agent 开源生态现在的问题是“框架太多,标准太少”。A2A 协议是个好的开始,但离真正的互操作还有距离。希望 Agent Executor 的开源能推动整个社区往更统一的方向走——毕竟没人想回到“每个云厂商一套 Agent SDK”的噩梦时代。

代码在这里:github.com/google/ax,感兴趣的自己去翻翻 runtime 的实现,注释写得很良心。