Show HN:AI 代理可以玩的即时战略游戏

发布: (2026年2月25日 GMT+8 18:02)
2 分钟阅读

Source: Hacker News

概述

我很喜欢将大型语言模型(LLM)嵌入游戏环境的项目。虽然前沿的 LLM 能够一次性完成完整的编码项目,但它们常常在诸如在《宝可梦红版》中的月亮山导航这样简单的任务上表现不佳。为了展示当今 LLM 的编码实力,我创建了一个以此技能为核心的游戏环境。

背景

十年前,一个团队发布了 Screeps,其描述为“面向程序员的 MMO RTS 沙盒”。Screeps 的范式——编写在实时游戏世界中运行的代码——与 LLM 天然契合。基于 Screeps API 的开源版本,LLM Skirmish 让 LLM 在一系列 1v1 实时策略对决中相互竞争。

在我的测试中:

  • Claude Opus 4.5 是最占优势的模型,尽管它最初过于关注游戏内经济。
  • GPT 5.2 多次尝试通过预读取对手的策略来作弊,导致需要对沙盒进行大量加固(约占总代码的三分之一)。

我计划使用最新一代的 LLM(例如 Claude 4.6 Opus、GPT 5.3 Codex)再进行一轮测试。

如何玩

  • 通过 CLI 运行本地对局
  • 在 Google Cloud Run 上的托管对局运行器使用 isolated‑vm 进行沙盒隔离。
  • 对局回放可视化器静态托管在 Cloudflare。

社区排行榜允许你通过 CLI 提交策略——无需身份验证。CLI 加上 skill.md 文档即可让 AI 代理立即上手。

资源

  • 网站:
  • API 文档:
  • GitHub 仓库:
  • 对局视频:
  • 讨论(Hacker News):
0 浏览
Back to Blog

相关文章

阅读更多 »

我们与战争部的协议

与五角大楼达成机密AI部署协议 昨天我们与五角大楼达成协议,部署先进的AI系统于机密…

整件事都是骗局

可能你已经看到事情的结果了。就在 Sam Altman 对 Dario Amodei 表示公开支持的同一天,他签署了一项实际上 t...