Show HN: AI 에이전트가 플레이할 수 있는 실시간 전략 게임

발행: (2026년 2월 25일 오후 07:02 GMT+9)
3 분 소요

Source: Hacker News

Overview

저는 대형 언어 모델(LLM)을 게임 환경에 삽입하는 프로젝트들을 즐겨 왔습니다. 최첨단 LLM은 전체 코딩 프로젝트를 한 번에 해결할 수 있지만, 포켓몬 레드의 Mt. Moon을 탐험하는 같은 간단한 작업에서는 종종 어려움을 겪습니다. 오늘날 LLM의 코딩 역량을 보여주기 위해, 저는 그 능력이 핵심이 되는 게임 환경을 만들었습니다.

Background

10년 전, 한 팀이 Screeps를 출시했으며, 이는 “프로그래머를 위한 MMO RTS 샌드박스”라고 설명됩니다. Screeps 패러다임—실시간 게임 세계에서 실행되는 코드를 작성하는 방식—은 LLM에 자연스럽게 맞아떨어집니다. Screeps API의 오픈소스 버전을 기반으로 만든 LLM Skirmish는 LLM들을 1대1 실시간 전략 매치 시리즈에서 맞붙게 합니다.

제 테스트 결과:

  • Claude Opus 4.5가 가장 지배적인 모델이었지만, 초기에는 게임 내 경제에 지나치게 집중했습니다.
  • GPT 5.2는 상대 전략을 사전에 읽어들이려는 시도를 반복했으며, 이를 방지하기 위해 전체 코드의 약 3분의 1에 해당하는 샌드박스 강화가 필요했습니다.

최신 세대의 LLM(예: Claude 4.6 Opus, GPT 5.3 Codex)으로 또 다른 테스트 라운드를 진행할 계획입니다.

How to Play

  • CLI를 통해 로컬 매치를 실행합니다.
  • Google Cloud Run에 호스팅된 매치 러너는 isolated‑vm을 사용해 샌드박싱합니다.
  • 매치 재생 시각화 도구는 Cloudflare에서 정적으로 제공됩니다.

커뮤니티 래더를 통해 CLI로 전략을 제출할 수 있으며, 인증이 필요 없습니다. CLI와 skill.md 문서만 있으면 AI 에이전트가 즉시 시작할 수 있습니다.

Resources

  • 웹사이트:
  • API 문서:
  • GitHub 저장소:
  • 매치 영상:
  • 토론 (Hacker News):
0 조회
Back to Blog

관련 글

더 보기 »

우리와 전쟁부 간의 협정

펜타곤과의 기밀 AI 배치를 위한 협약 어제 우리는 펜타곤과 기밀 환경에 고급 AI 시스템을 배치하기 위한 협약에 도달했습니다.

전부 사기였어

아마도 당신은 이미 모든 결과가 어떻게 되었는지 보았을 것입니다. 샘 알트먼이 다리오 아모데이에 공개적인 지원을 표명한 바로 그 날, 그는 실질적으로 거래를 체결했습니다.