새로운 에이전트 프레임워크가 인간이 설계한 AI 시스템에 필적 — 배포 시 추론 비용 제로

발행: 3일 전 (2026년 2월 19일 오전 07:00 GMT+9)

14 분 소요

Source: VentureBeat

위에 제공된 내용만으로는 번역할 텍스트가 없습니다. 번역을 원하는 본문을 알려주시면 한국어로 번역해 드리겠습니다.

Source:

기업 환경을 위한 적응형 AI 에이전트

오늘날 모델을 기반으로 구축된 에이전트는 간단한 변경—새 라이브러리, 워크플로우 수정, 혹은 업데이트된 API—만으로도 오작동하고, 인간 엔지니어의 개입이 필요합니다. 이러한 취약성은 AI를 대규모로 배포할 때 가장 지속적인 과제 중 하나이며, 우리는 지속적인 손길 없이도 동적 환경에 적응할 수 있는 에이전트가 필요합니다. 현재 모델은 강력하지만 여전히 대부분 정적인 상태에 머물러 있습니다.

도전 과제

취약한 통합: 작은 변화에도 실패가 발생합니다.
높은 유지보수 비용: 지속적인 인간 감독이 필요합니다.
제한된 자체 개선: 기존 프레임워크는 새로운 상황에 신뢰성 있게 진화하지 못합니다.

해결책: 그룹‑진화 에이전트 (GEA)

캘리포니아 대학교, 산타바바라 연구진은 그룹‑진화 에이전트 (Group‑Evolving Agents, GEA) 를 소개했습니다. 이 프레임워크는 AI 에이전트 그룹이 함께 진화하도록 합니다. 주요 특징은 다음과 같습니다.

Feature	Description
공유 경험	에이전트가 관찰 내용과 학습한 교훈을 교환하여 집단 지식 기반을 형성합니다.
혁신 재사용	한 에이전트가 발견한 성공적인 전략을 전체 그룹에 전파합니다.
자율적 개선	그룹이 외부 감독 없이 지속적으로 정책을 다듬습니다.

실험 결과

도메인: 복잡한 코딩 및 소프트웨어 엔지니어링 작업.
성능: GEA가 기존 자체 개선 프레임워크를 현저히 능가했습니다.
기업 영향: 시스템이 인간 전문가가 정성스럽게 만든 솔루션과 동등하거나 그 이상의 성능을 보이는 에이전트를 자율적으로 진화시켰습니다.

기업에 중요한 이유

엔지니어링 오버헤드 감소 – 수동적인 수정 및 업데이트가 줄어듭니다.
신뢰성 향상 – 에이전트가 라이브러리 업그레이드, API 변경, 워크플로우 조정 등에 자동으로 적응합니다.
확장 가능한 자체 개선 – 에이전트 그룹이 커질수록 집단 역량이 향상되어 장기적인 ROI를 제공합니다.

자세한 내용은 전체 논문을 참고하세요: Group‑Evolving Agents (GEA), arXiv:2602.04837.

Source: https://venturebeat.com/business/how-agent-native-identity-is-becoming-the-missing-layer-in-enterprise-ai

“솔로 울프” 진화의 한계

대부분의 기존 에이전트 AI 시스템은 엔지니어가 설계한 고정된 아키텍처에 의존합니다. 이러한 시스템은 초기 설계가 정한 능력 한계를 넘어서는 데 어려움을 겪는 경우가 많습니다.

자가‑진화 에이전트가 중요한 이유

연구자들은 오랫동안 스스로 코드와 구조를 수정하여 이러한 한계를 극복할 수 있는 에이전트를 찾고 있었습니다. 이러한 자가‑진화는 에이전트가 지속적으로 새로운 해결책을 탐색해야 하는 개방형 환경에서 필수적입니다.

현재 접근 방식의 구조적 결함

주류 패러다임은 생물학적 진화에서 영감을 받아 개인 중심의 트리 구조 프로세스를 채택합니다:

단일 “부모” 에이전트를 선택합니다.
그것이 자손을 생산하여 서로 다른 진화 가지를 만듭니다.
각 가지는 서로 격리된 상태에서 진화합니다.

Classic self‑evolving agent structure (source: arXiv)

격리의 결과

지식 사일로: 한 가지 가지에 속한 에이전트는 병렬 가지에 있는 에이전트가 발견한 데이터, 도구, 워크플로에 접근할 수 없습니다.
소중한 발견의 손실: 특정 계통이 다음 세대로 선택되지 않으면, 그 계통이 만든 새로운 디버깅 도구, 테스트 워크플로 또는 기타 혁신이 사라집니다.

은유 재고

해당 논문의 저자들은 AI 에이전트는 생물학적 개체가 아니므로, 그 진화가 생물학적 은유에 얽매일 필요가 없다고 주장합니다.

“AI 에이전트는 생물학적 개체가 아닙니다. 왜 그들의 진화가 생물학적 패러다임에 제한되어야 할까요?”

격리된 트리 구조 진화에서 벗어나 보다 협업적이고 네트워크 기반의 접근 방식을 채택함으로써, 모든 에이전트 계통에 걸쳐 가치 있는 혁신을 보존하고 전파할 수 있습니다.

그룹‑진화 에이전트(GEA)의 집단 지능

GEA는 개별 에이전트가 아니라 에이전트 그룹을 진화의 기본 단위로 취급함으로써 패러다임을 전환합니다.

GEA 작동 방식

부모‑그룹 선택
- 기존 아카이브에서 부모 에이전트 그룹을 추출합니다.
- 선택은 안정성과 혁신의 균형을 맞추며, 에이전트를 다음 기준으로 평가합니다:
  - 성능 – 과제 해결 능력.
  - 새로움 – 다른 에이전트와 비교했을 때 능력의 차별성.
공유된 집단 경험 풀
- 부모 그룹의 모든 진화 흔적을 풀에 모읍니다. 포함 항목:
  - 코드 수정.
  - 과제에 대한 성공적인 해결책.
  - 도구 호출 이력.
- 그룹 내 모든 에이전트는 이 풀에 접근할 수 있어, 동료들의 성공과 실패 모두로부터 학습합니다.
리플렉션 모듈
- 대형 언어 모델(LLM) 기반.
- 집단 역사를 분석해 그룹 전체의 패턴을 찾아냅니다.
- 예시: 한 에이전트가 고성능 디버깅 도구를 발견하고, 다른 에이전트가 테스트 워크플로를 완성하면, 모듈이 두 인사이트를 추출합니다.
진화 지시문
- LLM‑기반 분석이 자식 그룹 생성을 안내하는 고수준 지시문을 생성합니다.
- 다음 세대는 단일 혈통이 아니라 모든 부모의 결합된 강점을 물려받습니다.

Group‑Evolving Agent (GEA) – Source: arXiv

Group‑Evolving Agent diagram

How GEA Chooses and Shares Evolution Traits – Source: arXiv

GEA trait‑sharing diagram

강점 및 한계

강점 – 성공을 정밀하게 측정할 수 있는 객관적 과제(예: 코딩)에서 매우 뛰어난 성능을 보입니다.
한계 – 주관적 분야(예: 창의적 생성)에서는 평가 신호가 약합니다. Zhaotian Weng와 Xin Eric Wang이 지적한 바와 같이:

“출력과 경험을 무작위로 공유하면 저품질 경험이 잡음으로 작용할 수 있습니다. 이는 주관적 과제에 대해 더 강력한 경험‑필터링 메커니즘이 필요함을 시사합니다.”

GEA 실전

연구진은 현재 최첨단 자체 진화 베이스라인인 Darwin Gödel Machine (DGM)과 GEA를 두 개의 엄격한 벤치마크에서 평가했습니다. 결과는 에이전트 수를 늘리지 않으면서도 능력의 대폭적인 도약을 보여줍니다.

주요 결과

벤치마크	GEA 성공률	베이스라인 (DGM)	상대 개선
SWE‑bench 검증 (실제 GitHub 이슈)	71.0 %	56.7 %	+24.5 %
Polyglot (다국어 코드 생성)	88.3 %	68.3 %	+20.0 %

버그‑수정 견고성 – 에이전트를 고의로 버그를 주입해 파괴했을 때, GEA는 평균 1.4 회 반복으로 복구했으며 베이스라인은 5 회 반복이 필요했습니다.
크로스‑모델 전이성 – 하나의 LLM(예: Claude)에서 발견된 혁신이 다른 모델군(예: GPT‑5.1, GPT‑o3‑mini)으로 교체해도 그 효과를 유지했습니다.

GEA vs. Darwin‑Gö델 Machine (DGM) – 출처: arXiv
그림: GEA vs. DGM (출처: arXiv)

기업 R&D에 중요한 이유

측면	통찰
인간 수준 설계	GEA의 71 % 성공률은 최고 인간 설계 프레임워크 OpenHands와 맞먹습니다.
보조 도구 능가	Polyglot에서 GEA(88.3 %)는 인기 코딩 보조 도구 Aider(52.0 %)를 앞섭니다.
비용 효율성	두 단계 진화(에이전트 진화 → 추론/배포) 후 하나의 진화된 에이전트만 배포되어, 추론 비용이 일반 단일 에이전트 설정과 비슷합니다.
지식 통합	최종 GEA 에이전트는 17개의 고유 조상(전체 인구의 28 %)의 특성을 통합했으며, 베이스라인은 9개에 불과해 “슈퍼‑직원”을 형성합니다.
모델‑무관 이득	개선 효과가 모델군을 넘어 지속되어, 팀이 공급자를 교체해도 맞춤 최적화가 사라지지 않습니다.
안전 가드레일	제안된 기업 배포에는 비진화 가능한 방어책이 포함됩니다: 샌드박스 실행, 정책 제약, 검증 레이어 등.

필요 아키텍처 추가 요소

기존 에이전트 스택에 GEA를 적용하려면 다음 세 가지 구성 요소를 추가합니다:

Experience Archive – 진화 흔적과 에이전트 상호작용을 저장합니다.
Reflection Module – 그룹 수준 패턴을 분석합니다(대개 강력한 기반 모델 활용).
Updating Module – 반성 인사이트를 기반으로 에이전트가 자체 코드를 수정하도록 합니다.

향후 방향

하이브리드 진화 파이프라인 – 소형 모델이 초기 탐색을 담당해 다양한 경험을 수집하고, 대형 모델이 이후에 그 지식을 활용해 진화를 안내합니다.
고급 에이전트 민주화 – 경험 수집을 무거운 추론과 분리함으로써, 자원이 제한된 팀도 자체 진화 에이전트의 혜택을 누릴 수 있습니다.

공식 코드 릴리스는 곧 제공될 예정이지만, 오늘 바로 위 세 모듈을 현재 에이전트 프레임워크에 통합해 GEA 개념을 실험해 볼 수 있습니다.