내 노트북에서 구동되는 작은 AI 회사 (멀티 에이전트 애플리케이션)
Source: Dev.to
Introduction
최근 AI 에이전트가 가득한 세상에서 “일”이 어떻게 변할지 고민하고 있습니다. 아내와 이야기를 나누다 보니—미래에는 사람을 하나씩 대체하기보다 한 사람이 작은 AI 작업팀을 관리하게 될지도 모른다는 생각이 들었습니다. Claude Code나 OpenClaw 같은 도구는 그녀에게 너무 기술적으로 느껴졌기에, “팀과 함께 일하는 느낌”이 될 수 있을까 하는 궁금증이 생겼습니다. 코드를 짜거나 워크플로우를 연결하는 것이 아니라, 채용하고, 관리하고, 협업하는 것이죠.
Holons
저는 Holons이라는 데스크톱‑우선 시스템(Tauri + Flask + React)을 만들었습니다. 이 시스템에서는:
- 에이전트마다 역할과 정체성이 있습니다
- “리드” 에이전트가 작업을 할당하고 워크플로우를 구성합니다
- 여러 에이전트가 그룹 채팅에서 협업할 수 있습니다
- 모든 것이 로컬(또는 자체 호스팅)에서 실행됩니다
예를 들어 이렇게 말할 수 있습니다:
“B2B AI 회계사를 위한 피치를 만들어줘”
Holons는 다음을 수행합니다:
- 워크플로우를 제안하고
- 다양한 에이전트에게 작업을 할당하며
- 비용을 추정하고
- 전체 과정을 실행할 수 있게 해줍니다
What surprised me
Visibility
가장 어려운 부분은 에이전트 자체가 아니라 가시성이었습니다. 여러 에이전트가 동시에 동작하면 다음을 파악해야 합니다:
- 그들이 무엇을 하고 있는지
- 비용이 얼마나 드는지
- 시간이 흐름에 따라 어떻게 동작하는지
Unified ledger
초기 설계 단계에서 통합 원장을 도입했습니다. 모든 LLM 호출이 이 원장에 기록됩니다. 각 호출은 다음을 추적합니다:
- 모델 + 제공자
- 토큰(프롬프트 / 완성)
- 비용
- 지연 시간
- 에이전트 + 사용자
이 단일 테이블이 다음을 가능하게 합니다:
- 비용 대시보드
- 사용량 할당량
- 보고서
- 감사 로그
Key features
- 다중 제공자 지원: Bedrock, OpenAI, Anthropic, Gemini, MiniMax
- 에이전트별 모델 바인딩(에이전트마다 다른 모델 사용 가능)
- pgvector 기반 RAG + 외부 지식 통합
- MCP‑스타일 툴 통합
- IM 채널(텔레그램 / 슬랙 / 라인)
Still early
이 프로젝트는 아직 실험 단계입니다. 다중 에이전트 시스템에 대한 “올바른” 추상화인지 확신이 서지 않으며—API 호출보다는 팀을 관리하는 느낌에 가깝습니다.
- GitHub: https://github.com/jhk482001/Holons
- Demo: https://x.com/HolonsAgent/status/2048772512394432749?s=20
다른 사람들은 다중 에이전트 시스템을 어떻게 생각하고 있는지 궁금합니다. 실제 워크플로우에 적용하고 있는 사람도 있을까요, 아니면 아직 적합한 모델을 찾는 중일까요?