Vercel CEO:Opus 4.5让代理写大部分代码,但随便嗨和关键基础设施必须隔离开
Vercel首席执行官Guillermo Rauch发文称,自从Claude Opus 4.5发布后,对公司来说是“走进全新工程方式的一扇单向门”,如今“代理已经完成了我们大部分的编码工作”。但他同时强调,大模型具有固有缺陷与过度自信,公司在内部明确告知团队:“瞎嗨(vibing)和任务关键型基础设施不能混在一起”,必须对代理使用划清边界。
Rauch表示,Vercel正在分享内部关于“如何负责任地使用代理(agenting responsibly)”的早期指引,将安全性、持久性和可用性放在首位。 这些指引要求将“代理控制层”(agent harness)、LLM代理本身以及其生成代码的执行环境拆分为不同安全上下文:可信的控制逻辑运行在受控环境中,而由代理生成的代码则必须在隔离沙箱内执行,避免直接接触生产凭证和基础设施。
来源:公开信息
ABAB AI 解读
Rauch的表态,把“让代理写大部分代码”与“为失败路径先做安全护栏”这两件事同时推到台前,本质上是宣布一种新工程范式:开发者不再是逐行写代码的主体,而是负责设计触发器、反馈环和安全边界的“控制平面”。Opus 4.5这类模型让自动写码变得可行,但真正的工程工作转移到:如何把代理的高波动输出关进架构与安全的笼子里,让它在有限空间里高效“乱跑”,而不是把整个生产系统交给一个过度自信的黑箱。
从架构角度看,Vercel提出的“agent harness + sandbox”模式,是对未来代理系统的一个模板:可信逻辑(调度、权限、审计)与不可信逻辑(模型输出、生成程序)被硬隔离,前者像操作系统内核,后者像用户态进程,每次执行都在短命、无状态、无凭证的环境中完成。 这种设计既承认了LLM“永远会犯错”的现实,又利用其在重复任务上的强大能力,把风险从“防止错误发生”转为“控制错误的伤害半径”。
更深一层,这种“负责任使用代理”的实践也揭示了未来开发者角色的迁移:在Rauch的框架里,真正的竞争力不在于谁会用哪个模型写更快的代码,而在于谁能设计出更清晰的代理角色划分、更严格的接口和更可靠的评估回路。 这将把工程师从“手工编码者”升级为“系统与流程的编排者”,而那些忽视安全边界、把代理直接接入生产数据和凭证的团队,则很可能在下一轮安全事故中付出代价——Rauch所谓“agenting responsibly”,实际上是在给整个行业画出一条:如何在把写码权交给模型的同时,仍牢牢握住系统生死开关的分界线。