十六个 AI 代理从头构建 C 编译器
发布: (2026年2月10日 GMT+8 04:00)
2 分钟阅读
原文: Slashdot
Source: Slashdot
概览
Anthropic 研究员 Nicholas Carlini 让 16 个 Claude Opus 4.6 实例在共享代码库上自由工作两周,构建了一个从零开始的 C 编译器。这些 AI 代理产出了一个 基于 Rust 的 100,000 行编译器,能够在 x86、ARM 和 RISC‑V 架构上生成可启动的 Linux 6.9 内核。
方法论
- 项目共运行了近 2,000 次 Claude Code 会话,API 费用约为 $20,000。
- 每个 Claude 实例都在其独立的 Docker 容器 中运行,通过 锁文件 自主领取任务,并将完成的代码推送到 共享 Git 仓库。
- 没有编排代理来指挥流量;代理仅通过锁文件机制相互协调。
- Carlini 投入了大量精力构建 测试框架 和 反馈系统,以保持代理的生产力。
结果
- 编译器在 GCC torture 测试套件上达到了 99 % 的通过率。
- 它能够编译多个大型开源项目,包括 PostgreSQL、SQLite、Redis、FFmpeg 和 Doom。
- 成功为 x86、ARM 和 RISC‑V 架构构建可启动的 Linux 6.9 内核。
局限性
- 编译器缺少 16 位 x86 后端,该步骤仍需回退到 GCC。
- 其 汇编器和链接器仍存在 bug。
- 即使在关闭所有优化的情况下,生成的代码效率仍低于 GCC。
- 模型在约 100,000 行代码 时遇到实际上限,因为错误修复和新功能常常会破坏已有功能。