Show HN: AI 에이전트가 플레이할 수 있는 실시간 전략 게임
Source: Hacker News
Overview
저는 대형 언어 모델(LLM)을 게임 환경에 삽입하는 프로젝트들을 즐겨 왔습니다. 최첨단 LLM은 전체 코딩 프로젝트를 한 번에 해결할 수 있지만, 포켓몬 레드의 Mt. Moon을 탐험하는 같은 간단한 작업에서는 종종 어려움을 겪습니다. 오늘날 LLM의 코딩 역량을 보여주기 위해, 저는 그 능력이 핵심이 되는 게임 환경을 만들었습니다.
Background
10년 전, 한 팀이 Screeps를 출시했으며, 이는 “프로그래머를 위한 MMO RTS 샌드박스”라고 설명됩니다. Screeps 패러다임—실시간 게임 세계에서 실행되는 코드를 작성하는 방식—은 LLM에 자연스럽게 맞아떨어집니다. Screeps API의 오픈소스 버전을 기반으로 만든 LLM Skirmish는 LLM들을 1대1 실시간 전략 매치 시리즈에서 맞붙게 합니다.
제 테스트 결과:
- Claude Opus 4.5가 가장 지배적인 모델이었지만, 초기에는 게임 내 경제에 지나치게 집중했습니다.
- GPT 5.2는 상대 전략을 사전에 읽어들이려는 시도를 반복했으며, 이를 방지하기 위해 전체 코드의 약 3분의 1에 해당하는 샌드박스 강화가 필요했습니다.
최신 세대의 LLM(예: Claude 4.6 Opus, GPT 5.3 Codex)으로 또 다른 테스트 라운드를 진행할 계획입니다.
How to Play
- CLI를 통해 로컬 매치를 실행합니다.
- Google Cloud Run에 호스팅된 매치 러너는
isolated‑vm을 사용해 샌드박싱합니다. - 매치 재생 시각화 도구는 Cloudflare에서 정적으로 제공됩니다.
커뮤니티 래더를 통해 CLI로 전략을 제출할 수 있으며, 인증이 필요 없습니다. CLI와 skill.md 문서만 있으면 AI 에이전트가 즉시 시작할 수 있습니다.
Resources
- 웹사이트:
- API 문서:
- GitHub 저장소:
- 매치 영상:
- 토론 (Hacker News):