Original Statement
Anthropic 让 16 个 AI 智能体从零开始构建了一个 C 编译器。10 万行代码,可以编译 Linux 内核,成本 2 万美元,用时 2 周。
对比一下背景:GCC 是在 37 年时间里由成千上万名工程师构建出来的。(当然,它始于 1987 年。)
而现在,一名研究员 + 16 个 AI 智能体,就做出了一个编译器,
通过了 GCC 自身 99% 的 torture 测试集
能编译 FFmpeg、Redis、PostgreSQL、QEMU
还能运行 《毁灭战士》(Doom)
他们说自己“(基本上)放手不管了”。但这个“基本上”,分量非常重。
没有任何人类亲自写代码,但这名研究员一直在:不断重新设计测试
当 AI 智能体互相破坏彼此成果时,搭建和维护 CI 管线
当 16 个智能体同时卡在同一个 bug 上时,设计变通方案绕过去
人的角色并没有消失。它只是从“写代码”,转变成了:设计一个能让 AI 写代码的环境。
我实在看不出,你要如何还能说 AI 已经撞墙了。
Anthropic had 16 AI agents build a C compiler from scratch. 100k lines, compiles the Linux kernel, $20k, 2 weeks.
To put that in perspective GCC took thousands of engineers over 37 years to build. (Granted from 1987 - however) One researcher and 16 AI agents just built a compiler that passes 99% of GCC's own torture test suite, compiles FFmpeg, Redis, PostgreSQL, QEMU and runs Doom.
They say they "(mostly) walked away." But that "mostly" is doing heavy lifting.
No human wrote code but the researcher constantly redesigned tests, built CI pipelines when agents broke each other's work, and created workarounds when all 16 agents got stuck on the same bug.
The human role didn't disappear. It shifted from writing code to engineering the environment that lets AI write code.
I don’t know how you could make the point AI is hitting a wall.
ABAB AI Insight
这段话描述的不是一次“工程进步”,而是一次角色与权力结构的断层式迁移。真正值得警惕和理解的,不是 AI 写了多少代码,而是:人类在技术体系中的位置,已经发生了不可逆的移动。
我从最高层拆给你。
一、这不是“AI 会写代码”,而是软件生产函数被重写了
传统软件工程的生产函数是:人类智力 × 时间 × 组织规模
GCC 的历史正是这个函数的极限案例:几十年、成千上万人、不断累积复杂性。
Anthropic 这个实验,第一次实证了一个新函数:环境设计 × 约束系统 × AI 并行推理
注意:人类智力不再直接体现在“代码行数”里,而是体现在“系统结构”里。
这不是效率提升,而是范式切换。
二、真正的突破点:并不是 16 个 AI,而是“失败被系统吸收”
很多人会盯着“16 个 AI agent”,但那是次要的。
真正恐怖的是这句话背后的机制:当 agent 互相破坏、卡 bug、陷入死循环时,系统没有崩溃,而是被重新约束、重定向、继续前进。
这意味着什么?意味着:
* 错误不再是“人类犯错 → 修复”
* 而是“系统犯错 → 系统被重新塑形”
* 这是自我修复式工程流程的雏形。
一旦成立,复杂系统的上限将不再由“人类注意力”决定。
三、“人类没写一行代码”这句话,极具误导性,也极具价值
你必须同时读懂它的真和假。
真相:
* 人类确实没有参与具体实现
* AI 完成了完整的技术闭环
* 编译器这种“硬核基础设施”被直接攻破
但更重要的假象是:
* 代码不再是价值核心
* 决定性劳动发生在代码之外
那位研究员真正做的事情是:
* 定义什么叫“对”
* 决定什么算“完成”
* 在 AI 集体卡死时,改变问题本身
这不是“少写代码”,这是对问题空间的主权控制。
四、角色迁移的本质:从“工程师”到“系统架构师 + 环境导演”
这段话里最重要的一句,其实是:The human role didn’t disappear. It shifted.
这是历史级别的转折点。
未来最稀缺的能力将不再是:
* 写代码
* 背 API
* 调库
而是:
* 设计约束(tests、benchmarks、torture suite)
* 构建反馈回路(CI、失败惩罚、成功放大)
* 识别系统性卡点(不是 bug,是“所有 agent 同时卡住”的地方)
这类能力,本质上是:对复杂系统行为的理解能力
它更接近:
* 架构师
* 总导演
* 首席系统驯化者(system wrangler)
五、为什么“AI 撞墙论”在这里彻底破产
如果 AI 真的“撞墙”,你应该看到的是:
* 能力局限
* 成本指数上升
* 边际收益递减
而这里发生的是相反的三件事:
* 成本骤降($20k vs 数十年人力)
* 时间压缩(2 周 vs 37 年)
* 复杂度跃迁(从 App 级到编译器级)
更关键的是:当 AI 卡住时,人类不是替代它,而是“改变地形”。
这意味着:墙不是障碍,只是一个需要重新定义的约束条件。
六、真正的长期含义:软件行业将发生“去工种化”
这件事的最终结果不是“程序员失业”,而是:“写代码”这个工种被瓦解
软件工程被拆成:
* 问题定义
* 约束设计
* 系统监督
* 结果验证
中间那一大块——实现层——正在被 AI 吞噬。
而历史经验告诉我们:一旦“中间层”消失,行业结构会在 5–10 年内彻底重组。
压轴总结(一句话)
Anthropic 这个实验真正证明的不是 AI 能写编译器,而是:人类已经不再是“生产者”,而是“规则制定者”。
当你能用环境和约束,驱动 16 个非人类智能完成 37 年的人类工程积累时,你面对的不是“工具升级”,而是文明生产方式的迁移。