멀티에이전트 시스템에서의 토큰 효율성 — 토큰 낭비를 60% 줄인 방법

발행: (2026년 4월 15일 AM 09:17 GMT+9)
5 분 소요
원문: Dev.to

Source: Dev.to

소개

우리는 13개의 AI 에이전트를 동시에 실행합니다. 소모되는 토큰 하나하나는 비용을 의미합니다. 일주일 동안 토큰 사용량이 증가하는 것을 지켜본 뒤, 모든 것을 감사하고 약 60 %의 토큰이 불필요한 채우기(filler) 때문에 낭비되고 있음을 발견했습니다. 아래는 우리가 절감한 내용과 방법입니다.

문제: 토큰 낭비

우리 에이전트들은 인간이 이메일을 쓰는 방식처럼 서로 소통하고 있었습니다:

Hello! I have completed the research task you assigned me. I found several 
interesting results that I think you will find valuable. Here is a summary 
of my findings...

13개의 에이전트가 매 파동마다 수십 개의 메시지를 주고받으며 시간당 수천 개의 토큰이 낭비되었습니다.

구조화된 에이전트 간 포맷 (PAX)

우리는 PAX (Parallel Agent eXchange) 라는 간결하고 구조화된 포맷을 만들었습니다:

FROM: Apollo
TO: Atlas
STATUS: DONE
ACTION: revenue_check
RESULT: stripe=$0 | beehiiv=847 subs | devto=1.2k views
BLOCKERS: none
NEXT: wave_32_dispatch

같은 정보를 이제 70 % 정도 적은 토큰으로 전달합니다.

예시 비교

:

“The deployment was successfully completed and all files have been transferred to the production environment.”

:

deploy: done | files: 47 | env: prod

모든 에이전트 출력은 이제 다음 패턴을 따릅니다:

ACTION | STATUS | KEY_DATA | BLOCKERS | NEXT

내러티브나 설명은 없으며, 실패가 있을 때만 추가합니다.

금지 문구 및 토큰 대체

모든 에이전트에서 제거된 문구

  • “Great question!”
  • “I’d be happy to help”
  • “Certainly! Let me…”
  • “I hope this helps”
  • “As an AI language model…”

정보 가치가 없고 순수한 채우기였습니다.

일반적인 단어 대체

원본대체
completeddone
initializedinit
configurationconfig
successfully(삭제)
approximately~

이전 컨텍스트를 다시 요약하는 대신, 에이전트는 이제 ID만 전달합니다:

Ref: session_3388 | apply_delta_only

오케스트레이터(Atlas)가 상태를 유지하므로, 에이전트가 역사를 다시 설명할 필요가 없습니다.

지표

지표이전이후
평균 토큰/에이전트 메시지~400~140
파동당 토큰 소모~22k~8k
일일 API 비용$4.20$1.60
에이전트 명료도MixedHigh

원시인 모드: 간결성 강제

우리는 강제된 간결성을 “원시인 모드(caveman mode)” 라고 부릅니다. 에이전트가 출력을 내보내기 전에 다음을 묻습니다:

원시인이 이해할 수 있나요? 모든 단어가 정보를 담고 있나요?

답이 이면 출력을 그대로 전송하고, 아니면 다듬습니다.

이 규칙은 각 시스템 프롬프트에 내장되어 있습니다. 예시:

You are [AgentName]. TOKEN EFFICIENT.
Caveman‑style outputs. No filler. No pleasantries.
Pattern: [thing] [action] [reason]. [next step].
Fragments OK. Short synonyms preferred.

30 토큰짜리 프리앰블만으로도 하위에서 수천 토큰을 절감합니다.

오픈소스 스타터 키트

PAX 프로토콜 사양, 시스템‑프롬프트 템플릿, 그리고 전체 13‑에이전트 아키텍처(Atlas, Ares, Apollo, Peitho 등)는 멀티‑에이전트 스타터 키트로 패키징되고 있습니다.

개발 진행 상황을 팔로우하고 오픈소스 릴리스를 확인하려면 whoffagents.com 으로 방문하세요.

0 조회
Back to Blog

관련 글

더 보기 »