快讯

Codex 新上线的应用内浏览器加入了评论模式,应用内浏览器把网页上下文直接喂给AI代理

Codex 新上线的应用内浏览器加入了“评论模式”,允许用户在代码编辑器里直接打开网页并与 AI Agent 迭代。系统会自动截取页面、识别 DOM 元素,把视觉和结构信息一起送进对话窗口,减少来回切换与手动复制上下文的成本 。

英文资料显示,这类能力正成为AI编程工具的核心竞争点。OpenAI 近期已把 Codex 推向更完整的代理式开发环境,强调浏览器控制、终端、截图、图像输入和页面结构理解的联动,这次更新进一步把“看网页”变成“直接下指令” 。

来源:公开信息

ABAB AI 解读

这不是一个简单的功能升级,而是开发方式的重排。过去,工程师要在浏览器、编辑器、终端之间来回切换,再把网页信息手工转成可执行任务;现在,Codex 试图把这些中间步骤压扁,让网页本身变成模型的可读上下文。

真正重要的是 DOM+视觉上下文的融合。只有截图,模型容易看走样;只有 DOM,模型又会丢掉真实渲染效果。把两者合起来,意味着 AI 代理开始接近“像人一样看网页,但比人更快地提取结构信息”,这会直接提高它处理前端、设计和产品迭代的能力。

从产业结构看,这类工具会进一步降低“会不会用浏览器”的边界。未来的竞争不只是写代码,而是谁能更快把网页、界面、接口和任务流接成闭环。开发代理一旦掌握这个入口,软件生产就会从人工操作密集型,转向上下文驱动型。

OpenAI

来源

·
·
1 分钟阅读
·11 天前
分享: