快讯

Anthropic意外披露了新模型Claude Mythos

Anthropic因内容管理系统配置失误,将近3000份未发布资产暴露在公开可搜索数据库中,一篇内部博客草稿意外披露了新模型「Claude Mythos」的存在。草稿与后续回应称,Mythos 是高于 Opus 系列的全新模型层级,被内部视为「能力的阶跃式提升」,在软件编程、学术推理与网络安全测试中的表现明显强于Claude Opus 4.6,同一底层模型在内部代号为「Capybara」。

泄露文件显示,Anthropic特别强调Mythos在网络攻防能力上的领先,认为其在网络安全相关能力上「远远领先于任何其他AI模型」,并预警即将到来的新一波模型将具备远超现有防御体系的漏洞利用能力。出于安全考量,Anthropic决定采用极为谨慎的发布策略:先仅向少量早期客户开放,以防御用例为主,帮助机构提前加固代码库,同时由于运行成本极高,短期内不会面向公众开放。泄露还曝光了Anthropic即将在英国乡间18世纪庄园酒店举行欧洲企业CEO闭门峰会的细节,Dario Amodei将出席。

Anthropic将本次信息暴露归因于外部CMS工具的「人为错误」,导致未发布的博客草稿、图片、PDF等资产被存入未加密数据库。公司发言人表示,他们正在开发一款在推理、编程与网络安全方面有重大进展的通用模型,并强调会以远比以往更审慎的方式推进发布节奏与客户接入路径。

来源:公开信息

ABAB AI 解读

Mythos的意外泄露,第一次比较清晰地暴露出“攻防不对称版AGI”的轮廓:在推理与编程能力显著跃升的同时,网络攻防能力被内部明确认定为“远超现有模型”,这意味着大模型不再只是通用助手,而开始逼近“自动化安全专家+高级黑客”的能力上限。Anthropic选择优先把这类模型投向「防御场景」而不是开放给公众,本质上是承认了一个现实:在现有互联网与企业技术栈下,进攻端的边际收益极高,而防御端的制度与工程能力远远落后于模型迭代速度。

从全球网络安全结构看,Mythos代表的是一个新威胁门槛:漏洞发现、利用链组合、代码审计与渗透路径搜索可以被极度自动化,而攻击者可以将这类模型作为“放大器”套用在海量目标上。对于大型科技企业与关键基础设施运营者,这会迫使其从“事件响应型安全”转向“模型对模型”的对抗结构——不再只是补丁和规则,而是用自有或采购的高能力防御模型持续扫描自身系统。Anthropic用高成本、限量、聚焦防御场景的发布方式,实际上是在尝试把这种能力优先锁定在防御方的工具栈里,延缓其全面扩散到更广泛的攻击生态中。

从产业与资本视角,这类“越级模型”也在改变AI基础设施的经济学与分层结构。Mythos这类运行成本极高、短期不面向公众的模型,很像“战略级云服务”:只服务少量高价值客户,其商业模式更接近军工或高端安全咨询,而非大众化SaaS。底层是极少数拥有超大模型训练与部署能力的公司,中间层是将这些模型嵌入企业安全与软件供应链的集成商,最上层才是被动接受新安全范式的普通企业。网络安全能力被“模型化”之后,防御能力和攻击能力都会高度集中到控制这类模型的少数主体手中。

更深一层,Anthropic将Mythos定性为“能力阶跃”并主动放慢节奏,标志着AI安全讨论重心的变化:早期争议集中在“对齐是否足够”“是否会产生有害内容”,而现在开始转向“能力分发的节奏与对象”。谁先拿到这类模型、以什么接入形式使用、是否允许转推给下游代理,这些都将构成新的“技术出口管制”和“企业内部合规”问题。Mythos泄露事件等于是提前把这套矛盾摆在台面上:技术路线已经走到这一步,真正关键的决策不再只是“能不能做出来”,而是“在不改造整个数字基础设施的前提下,谁有资格使用这种级别的工具,以及以什么速度扩散”。

AI

来源

·
·
2 分钟阅读
·14 天前
分享: