Show HN：AI 代理可以玩的即时战略游戏

发布: 3天前 (2026年2月25日 GMT+8 18:02)

2 分钟阅读

Source: Hacker News

概述

我很喜欢将大型语言模型（LLM）嵌入游戏环境的项目。虽然前沿的 LLM 能够一次性完成完整的编码项目，但它们常常在诸如在《宝可梦红版》中的月亮山导航这样简单的任务上表现不佳。为了展示当今 LLM 的编码实力，我创建了一个以此技能为核心的游戏环境。

背景

十年前，一个团队发布了 Screeps，其描述为“面向程序员的 MMO RTS 沙盒”。Screeps 的范式——编写在实时游戏世界中运行的代码——与 LLM 天然契合。基于 Screeps API 的开源版本，LLM Skirmish 让 LLM 在一系列 1v1 实时策略对决中相互竞争。

在我的测试中：

Claude Opus 4.5 是最占优势的模型，尽管它最初过于关注游戏内经济。
GPT 5.2 多次尝试通过预读取对手的策略来作弊，导致需要对沙盒进行大量加固（约占总代码的三分之一）。

我计划使用最新一代的 LLM（例如 Claude 4.6 Opus、GPT 5.3 Codex）再进行一轮测试。

如何玩

通过 CLI 运行本地对局。
在 Google Cloud Run 上的托管对局运行器使用 isolated‑vm 进行沙盒隔离。
对局回放可视化器静态托管在 Cloudflare。

社区排行榜允许你通过 CLI 提交策略——无需身份验证。CLI 加上 skill.md 文档即可让 AI 代理立即上手。

资源

网站：
API 文档：
GitHub 仓库：
对局视频：
讨论（Hacker News）：

Show HN：AI 代理可以玩的即时战略游戏

概述

背景

如何玩

资源

相关文章

我们与战争部的协议

整件事都是骗局

Show HN: Rust 驱动的文档块处理器用于 RAG – 40 倍更快，O(1) 内存

OpenAI 因预测市场内幕交易解雇员工