Anthropic宣布其新前沿模型Claude Mythos Preview能力大幅超越此前模型
Anthropic宣布其新前沿模型Claude Mythos Preview能力大幅超越此前模型,尤其在识别和利用软件漏洞方面表现出色,已发现数千个此前未知的零日漏洞,覆盖各大主流操作系统和浏览器。该模型暂不向公众开放,而是通过Project Glasswing项目向超过40家科技和基础设施企业提供访问,包括Apple、Amazon、Microsoft、Google、NVIDIA等,旨在让防御方率先修补关键软件中的安全隐患。
Anthropic承诺投入最高1亿美元的模型使用额度,并向开源安全组织捐赠400万美元。该项目聚焦于利用模型的编码和推理能力加速漏洞发现与修复,应对AI时代网络攻击风险的结构性升级。公司强调,此举是为关键软件基础设施争取防御准备时间,避免进攻性滥用。
来源:公开信息
ABAB AI 解读
Anthropic此举的核心在于对前沿AI能力失控风险的制度回应。Claude Mythos Preview作为通用模型,其编码与推理跃升直接转化为网络攻防不对称优势:模型能发现长期未被人类或传统工具察觉的漏洞,这暴露了现有软件安全范式的制度惯性。当AI超越最熟练工程师的漏洞挖掘能力时,传统补丁流程已无法跟上,防御必须前置到模型级模拟攻击阶段,否则关键基础设施将面临系统性重估。
从长期结构看,这反映了AI发展进入能力外溢阶段的转折。过去AI主要提升生产率,此刻其副产品——自动化漏洞发现——直接冲击软件供应链的安全定价与分配逻辑。Project Glasswing将竞争对手与基础设施方拉入同一联盟,本质上是资本与技术在权力结构层面的重新配置:通过限制公开访问,将进攻潜力暂时转化为集体防御红利,避免单边释放导致的攻击面扩张,同时为后续模型发布设定安全基准。
这一事件嵌入全球数字基础设施的演变周期中。开源软件与云平台的集中化本就放大单一漏洞的影响范围,AI的出现加速了这一脆弱性的暴露与重估。Anthropic的选择凸显了技术边界对制度约束的倒逼:当模型能力接近或超过人类顶尖水平时,释放决策不再是单纯商业行为,而是涉及国家安全与经济稳定的权力再分配。未来类似限制或联盟可能成为前沿AI治理的常态,推动安全投资从被动响应转向主动重构。