하네스 엔지니어링 없이 에이전트 구축

발행: (2026년 6월 12일 AM 02:28 GMT+9)
9 분 소요

출처: Hacker News

자신만의 에이전트를 만들지 마세요. Hermes를 호스팅하고 도구, 스킬, 시스템 프롬프트를 제공하면 됩니다. 이 과정을 쉽게 해줄 API를 출시하고 있습니다.

prismvideos.com에서는 Vercel AI Agents SDK를 기반으로 만든 미디어 생성 에이전트를 제공했습니다. 우리 에이전트는 사용자에게 어떤 모델을 추천할지 이해하고, 이미지와 영상을 생성하며, 영상을 분석해 재현 방법을 알려줄 수 있었습니다. 정말 아름다웠습니다.

하지만 끔찍하게도 며칠 뒤, 우리와 경쟁 관계에 있으며 AI 미디어 생성 분야를 선도하고 있는 Higgsfield가 Supercomputer라는 에이전트를 출시했습니다. Supercomputer는 관찰 메모리(세션 간 메모리), 스킬, 자동화, 컴퓨터, 파일 시스템을 갖추고 있었습니다. 이러한 기능을 모두 추가하려면 우리에게 몇 주가 걸렸을 텐데, Supercomputer는 Vercel AI SDK, Claude Agents SDK, OpenAI Agents SDK가 아니라 Hermes 위에 구축되었습니다. Hermes는 현재(작성 시점) GitHub에서 185k+ 스타를 받은 오픈소스 개인 에이전트입니다.

처음엔 Hermes가 나 같은 괴짜들을 위한 일시적인 유행이라고 생각했지만, Hermes를 우리 에이전트의 기본 요소로 사용하면 세션 관리(세션별 메모리와 압축), 내장 도구(웹 검색, 브라우저, 파일 시스템 탐색), 스킬, 자기 학습, 자동화를 무료로 얻을 수 있다는 것을 깨달았습니다. 고객이 “매주 지난 주에 가장 성과가 좋았던 인플루언서 영상을 보고 5가지 변형을 만들어 주세요”라고 요청하면, 진정한 마법 같은 순간이 구현됩니다.

우리는 기존 에이전트를 삭제하고, Hono 서버가 구동되는 EC2 인스턴스를 띄웠습니다. 서버는 각 고객마다 Docker 컨테이너 안에 Hermes 에이전트를 생성하고, 우리 앱과 Hermes 게이트웨이 사이의 메시지를 전달하는 역방향 프록시 역할도 했습니다. 이제 우리는 모든 사용자의 Hermes 에이전트와 WebSocket 연결을 통해 통신합니다.

관찰 메모리, 스킬, 자기 학습, 자동화, 영구 파일 시스템을 직접 구축할 필요 없이, 우리는 prismvideos.com에만 집중하면 됩니다. 에이전트에 시스템 프롬프트, MCP를 통한 모델 선택 도구, UGC 영상 제작·스토리보드·시각 효과 스킬 파일, 그리고 Meta Ads Manager, Google Drive, Resend와 같은 커넥터를 제공하면 됩니다.

소비자용 에이전트가 점점 좋아지면서(Claude, ChatGPT, Manus) 고객 기대치도 상승하고 있습니다(B2B 소프트웨어도 마찬가지). Claude 앱은 메모리를 제공하므로 우리 CEO는 그것을 원합니다. 자기 학습은? 스티어링은? Ralph Wiggum loop를 추가할 수 있을까요?

기업들은 에이전트 하니스에 수십억을 투자하고 있습니다. Hermes 이후에도 새로운 하니스가 등장하고, 모두가 원하는 새로운 기능이 추가될 겁니다(현재 가장 뜨거운 트렌드는 Hermes의 내장 학습 루프). 특정 사용 사례에 가장 적합한 하니스를 만든다고 해서 AI 에이전트 스타트업이 부자가 되는 경우는 거의 없습니다. 오히려 경쟁자가 더 완전한 에이전트를 출시하면 위험에 처하게 됩니다. AI 에이전트 스타트업이 차별화된 가치를 만들 수 있는 가장 좋은 방법은 고객의 고유 데이터와 선호도를 학습하도록 통합하는 것입니다.

에이전트는 새로운 기본 요소가 되었습니다. 기존 에이전트 프레임워크는 개발자가 다음을 직접 설정하도록 요구합니다.

  • 세션 관리(일부 경우)
  • 도구(일부 경우)
  • 메모리
  • 자기 학습
  • 자동화
  • 영구 파일 시스템
  • 컨테이너 또는 샌드박스 배포
  • 스킬
  • MCP 서버

하지만 1~7번은 모든 에이전트 애플리케이션에 포함되는 요소입니다.

Hermes 인스턴스를 프로그래밍 방식으로 생성하면, 개발자는 단 한 번의 API 호출로 에이전트와 인프라를 동시에 얻을 수 있습니다.

POST /v1/deployments
Authorization: Bearer $PRISM_API_KEY
Content-Type: application/json
{
  "customer_id": "cus_123",
  "name": "Acme Creative Agent",
  "runtime": "hermes",
  "model": "anthropic/claude-sonnet-4.5",
  "system_prompt": "You are Acme's media generation agent. Help the user plan, create, and iterate on high-performing short-form videos.",
  "sandbox": {
    "enabled": true,
    "type": "docker",
    "persistent_filesystem": true
  },
  "mcp_servers": [
    {
      "name": "prism-media",
      "url": "https://api.prismvideos.com/mcp",
      "tools": [
        "search_models",
        "get_model_schema",
        "get_pricing",
        "generate_image",
        "generate_video",
        "generate_audio"
      ]
    }
  ],
  "skills": [
    {
      "name": "ugc-video-creation",
      "source": "file",
      "path": ".prism/skills/ugc-video-creation/SKILL.md"
    },
    {
      "name": "storyboarding",
      "source": "inline",
      "content": "---\nname: storyboarding\ndescription: Create shot-by-shot storyboards for short-form videos\n---\n# Storyboarding\n..."
    },
    {
      "name": "social-media-visual-effects",
      "source": "url",
      "url": "https://example.com/skills/social-media-visual-effects/SKILL.md"
    }
  ],
  "secrets": {
    "META_ADS_TOKEN": "sec_meta_ads_token",
    "GOOGLE_DRIVE_TOKEN": "sec_google_drive_token"
  },
  "features": {
    "memory": true,
    "dreaming": true,
    "automations": true,
    "steering": true,
    "filesystem_webhooks": true
  }
}

응답

{
  "deployment_id": "dep_7xK9s2",
  "customer_id": "cus_123",
  "runtime": "hermes",
  "status": "ready",
  "model": "anthropic/claude-sonnet-4.5",
  "thread_id": "thr_default_8a1",
  "filesystem": {
    "workspace_path": "/workspace",
    "persistent": true
  },
  "events": {
    "transport": "sse",
    "url": "https://api.prismagents.com/v1/deployments/dep_123/events"
  }
}

시스템 프롬프트, 스킬, 도구, 커넥터만 제공하면 SSE를 통해 에이전트와 채팅할 수 있는 엔드포인트가 완성됩니다.

에이전트를 만들 때 겪게 되는 여러 번거로운 절차가 있습니다. 하니스 엔지니어링이 그 중 하나가 되어서는 안 됩니다. 우리가 API를 만들게 된 통찰이 LangChain이 Managed Deep Agents를 출시하고, Claude가 Managed Agents를 출시하게 만든 배경이기도 합니다. LangChain Managed Deep Agents는 AI 에이전트를 배포하기 위한 호스팅 런타임이며, 개발자는 시스템 프롬프트, MCP 도구, 스킬, 서브에이전트 정의만 제공하면 에이전트를 채팅용으로 사용할 수 있습니다. Claude Managed Agents 역시 단일 API 호출로 에이전트와 인프라를 제공합니다.

CapabilityManaged Hermes AgentsLangChain Managed Deep AgentsClaude Managed Agents
공급자 락인 방지
세션 관리
에이전트 + 인프라를 한 번에 제공
관찰 메모리
내장 도구(웹 검색, 브라우저, 파일 탐색)
영구 파일 시스템
이미지·영상 입력
컨테이너 격리
자격 증명 관리
자동화
0 조회
Back to Blog

관련 글

더 보기 »