Show HN:AI 代理可以玩的即时战略游戏
发布: (2026年2月25日 GMT+8 18:02)
2 分钟阅读
原文: Hacker News
Source: Hacker News
概述
我很喜欢将大型语言模型(LLM)嵌入游戏环境的项目。虽然前沿的 LLM 能够一次性完成完整的编码项目,但它们常常在诸如在《宝可梦红版》中的月亮山导航这样简单的任务上表现不佳。为了展示当今 LLM 的编码实力,我创建了一个以此技能为核心的游戏环境。
背景
十年前,一个团队发布了 Screeps,其描述为“面向程序员的 MMO RTS 沙盒”。Screeps 的范式——编写在实时游戏世界中运行的代码——与 LLM 天然契合。基于 Screeps API 的开源版本,LLM Skirmish 让 LLM 在一系列 1v1 实时策略对决中相互竞争。
在我的测试中:
- Claude Opus 4.5 是最占优势的模型,尽管它最初过于关注游戏内经济。
- GPT 5.2 多次尝试通过预读取对手的策略来作弊,导致需要对沙盒进行大量加固(约占总代码的三分之一)。
我计划使用最新一代的 LLM(例如 Claude 4.6 Opus、GPT 5.3 Codex)再进行一轮测试。
如何玩
- 通过 CLI 运行本地对局。
- 在 Google Cloud Run 上的托管对局运行器使用
isolated‑vm进行沙盒隔离。 - 对局回放可视化器静态托管在 Cloudflare。
社区排行榜允许你通过 CLI 提交策略——无需身份验证。CLI 加上 skill.md 文档即可让 AI 代理立即上手。
资源
- 网站:
- API 文档:
- GitHub 仓库:
- 对局视频:
- 讨论(Hacker News):