[논문] 비잔틴 저항형 LLM 에이전트 협업을 위한 계층적 인증 의미 약속
Source: arXiv - 2606.07316v1
Overview
대규모 언어 모델(LLM) 에이전트 간의 비잔틴 협업을 위해서는 최종성 제어 프리미티브가 필요합니다. 전달된 확률적이며 구조화된 자연어 제안들을 바탕으로 프로토콜은 라운드가 커밋을 지원하는지, 어떤 종류의 커밋인지, 혹은 타입이 지정된 안전한 중단(abort)인지 판단해야 합니다. 단순 집계는 이 선택을 하나의 평결(verdict) 뒤에 숨기고, 고전적인 비잔틴 결함 허용(BFT) 방식은 바이트 정체성(byte‑identity)에 의존하는데 이는 LLM 제안이 만족하지 못합니다. 우리는 Hierarchical Certified Semantic Commitment (H‑CSC) 라는 BFT 영감을 받은 프로토콜을 제안합니다. 이 프로토콜은 평결에 따라 구분된 제안 그룹에서 임베딩 기반 최종성 신호를 변환하여 세 가지 타입 중 하나의 결과를 산출합니다:
- semantic_commit – 동일 평결 내에서 2f+1개의 핵심이 평결을 뒷받침하고, 양자화된 집계에 대한 파라미터 제한 다이제스트를 출력합니다.
- verdict_commit – 강력한 평결 마진을 갖지만 의미적 근거가 분산되어 있어, 의미적 집계를 주장하지 않고 평결 수준 인증서만 발행합니다.
- explicit abort – 타입이 지정된 이유와 함께 중단합니다.
핵심 기여는 원시 커밋 정확도가 아니라 타입이 지정된 최종성입니다. 제어된 의미 중독(semantic‑poisoning) 진단 실험(BCS_v1, 120 에피소드)에서 H‑CSC는 BFT가 가능한 버킷(각 0.312.04도)의 각도 편차가 낮은 상태로 커밋하고, BFT를 초과하는 라운드(n < 3f+1)에서는 100% 중단합니다. 실제 LLM‑에이전트 주장 검증 벤치마크(MVR‑50, 50 과제)에서 정적 및 급행 비잔틴 공격을 동시에 적용했을 때, H‑CSC는 정직‑참조‑무효 비율이 각각 0.02/0.00인 0.90/0.92의 커밋률을 기록했으며, 이는 강력한 인증을 내보내는 평결‑전용 베이스라인과 통계적으로 동등합니다. 그러나 베이스라인과 달리 H‑CSC는 라운드의 74%/72%에서 임베딩 기반 semantic_commit 다이제스트를 함께 제공해 타입이 지정된 출처를 보증합니다. 엄격 의미(ablation) 버전은 0.54/0.48만 커밋해, 평결‑레벨 폴백이 커버리지를 확보하는 데 필요함을 보여줍니다(+0.36/+0.44)이며 안전성 한계는 ≤0.04를 유지합니다. 네 개 LLM에 걸친 100 과제 교차‑모델 검증에서도 invalid_hmaj는 0.000.03 범위에 머물렀습니다.
Key Contributions
이 논문은 다음 분야의 연구를 다룹니다.
- cs.MA
- cs.AI
- cs.DC
Methodology
자세한 방법론은 전체 논문을 참고하십시오.
Practical Implications
본 연구는 cs.MA 분야의 발전에 기여합니다.
Authors
- Haoran Xu
- Lei Zhang
- Iadh Ounis
- Xianbin Wang
Paper Information
- arXiv ID: 2606.07316v1
- Categories: cs.MA, cs.AI, cs.DC
- Published: 2026년 6월 5일
- PDF: Download PDF