[Paper] 매트릭스: 피어‑투‑피어 다중‑에이전트 합성 데이터 생성 프레임워크

발행: (2025년 11월 27일 오전 03:59 GMT+9)
3 min read
원문: arXiv

Source: arXiv - 2511.21686v1

Overview

합성 데이터는 실제 데이터가 부족하거나 비용이 많이 들거나 프라이버시‑민감한 경우 대형 언어 모델을 학습시키는 데 점점 더 중요해지고 있습니다. 많은 생성 작업은 고품질, 다양성, 구조적 풍부함을 갖춘 데이터를 만들기 위해 특화된 에이전트들이 협업하는 다중 에이전트 워크플로우를 필요로 합니다. 그러나 기존의 다중 에이전트 합성 프레임워크는 중앙 오케스트레이터에 의존하는 경우가 많아 확장성 병목을 초래하거나 특정 도메인에 하드코딩되어 유연성이 제한됩니다.

우리는 Matrix라는 탈중앙화 프레임워크를 제시합니다. 이 프레임워크는 제어와 데이터 흐름을 분산 큐를 통해 전달되는 직렬화된 메시지로 표현합니다. 피어‑투‑피어 설계는 중앙 오케스트레이터를 제거합니다. 각 작업은 경량 에이전트를 통해 독립적으로 진행되며, LLM 추론이나 컨테이너화된 환경과 같은 연산 집약적 작업은 분산 서비스가 처리합니다. Ray 위에 구축된 Matrix는 수만 개의 동시 에이전트 워크플로우로 확장되며, 모듈식이고 구성 가능한 설계를 제공해 다양한 데이터 생성 워크플로우에 손쉽게 적용할 수 있습니다.

우리는 다중 에이전트 협업 대화, 웹 기반 추론 데이터 추출, 고객 서비스 환경에서의 도구 사용 궤적 생성 등 다양한 합성 시나리오에서 Matrix를 평가했습니다. 모든 경우에서 Matrix는 동일한 하드웨어 자원 하에 출력 품질을 손상시키지 않으면서 데이터 생성 처리량을 $2$–$15\times$ 향상시켰습니다.

Authors

  • Dong Wang
  • Yang Li
  • Ansong Ni
  • Ching‑Feng Yeh
  • Youssef Emad
  • Xinjie Lei
  • Liam Robbins
  • Karthik Padthe
  • Hu Xu
  • Xian Li
  • Asli Celikyilmaz
  • Ramya Raghavendra
  • Lifei Huang
  • Carole‑Jean Wu
  • Shang‑Wen Li

Categories

  • cs.CL
  • cs.AI
  • cs.LG

Paper Information

  • arXiv ID: 2511.21686v1
  • Published: November 27, 2025
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »

[Paper] Multi-LLM 협업을 통한 약물 추천

보건 의료가 확장 가능하고 신뢰할 수 있는 clinical decision support를 위해 AI를 점점 더 활용함에 따라, 모델 추론의 신뢰성을 보장하는 것이 여전히 중요한 과제로 남아 있습니다.