十六个 AI 代理从头构建 C 编译器

发布: (2026年2月10日 GMT+8 04:00)
2 分钟阅读
原文: Slashdot

Source: Slashdot

概览

Anthropic 研究员 Nicholas Carlini 让 16 个 Claude Opus 4.6 实例在共享代码库上自由工作两周,构建了一个从零开始的 C 编译器。这些 AI 代理产出了一个 基于 Rust 的 100,000 行编译器,能够在 x86、ARM 和 RISC‑V 架构上生成可启动的 Linux 6.9 内核。

在 Ars Technica 上阅读完整故事

方法论

  • 项目共运行了近 2,000 次 Claude Code 会话,API 费用约为 $20,000
  • 每个 Claude 实例都在其独立的 Docker 容器 中运行,通过 锁文件 自主领取任务,并将完成的代码推送到 共享 Git 仓库
  • 没有编排代理来指挥流量;代理仅通过锁文件机制相互协调。
  • Carlini 投入了大量精力构建 测试框架反馈系统,以保持代理的生产力。

结果

  • 编译器在 GCC torture 测试套件上达到了 99 % 的通过率
  • 它能够编译多个大型开源项目,包括 PostgreSQL、SQLite、Redis、FFmpegDoom
  • 成功为 x86、ARMRISC‑V 架构构建可启动的 Linux 6.9 内核。

局限性

  • 编译器缺少 16 位 x86 后端,该步骤仍需回退到 GCC。
  • 汇编器和链接器仍存在 bug
  • 即使在关闭所有优化的情况下,生成的代码效率仍低于 GCC。
  • 模型在约 100,000 行代码 时遇到实际上限,因为错误修复和新功能常常会破坏已有功能。
0 浏览
Back to Blog

相关文章

阅读更多 »

Siri 的 AI 大改造再次延迟

Siri AI 重大改造延期——苹果长期承诺的 Siri 改造在内部测试中出现新问题,迫使公司推迟多个关键功能的推出……