十六个 AI 代理从头构建 C 编译器

发布: 3天前 (2026年2月10日 GMT+8 04:00)

2 分钟阅读

Source: Slashdot

概览

Anthropic 研究员 Nicholas Carlini 让 16 个 Claude Opus 4.6 实例在共享代码库上自由工作两周，构建了一个从零开始的 C 编译器。这些 AI 代理产出了一个 基于 Rust 的 100,000 行编译器，能够在 x86、ARM 和 RISC‑V 架构上生成可启动的 Linux 6.9 内核。

在 Ars Technica 上阅读完整故事。

方法论

项目共运行了近 2,000 次 Claude Code 会话，API 费用约为 $20,000。
每个 Claude 实例都在其独立的 Docker 容器 中运行，通过 锁文件 自主领取任务，并将完成的代码推送到 共享 Git 仓库。
没有编排代理来指挥流量；代理仅通过锁文件机制相互协调。
Carlini 投入了大量精力构建 测试框架 和 反馈系统，以保持代理的生产力。

结果

编译器在 GCC torture 测试套件上达到了 99 % 的通过率。
它能够编译多个大型开源项目，包括 PostgreSQL、SQLite、Redis、FFmpeg 和 Doom。
成功为 x86、ARM 和 RISC‑V 架构构建可启动的 Linux 6.9 内核。

局限性

编译器缺少 16 位 x86 后端，该步骤仍需回退到 GCC。
其 汇编器和链接器仍存在 bug。
即使在关闭所有优化的情况下，生成的代码效率仍低于 GCC。
模型在约 100,000 行代码 时遇到实际上限，因为错误修复和新功能常常会破坏已有功能。

十六个 AI 代理从头构建 C 编译器

概览

方法论

结果

局限性

相关文章

‘Are You Sure?’问题：为什么你的AI不断改变主意

Siri 的 AI 大改造再次延迟

美国2025年几乎没有就业增长

英国下令删除全国最大的法院报道档案