계층적 멀티에이전트에서의 시간적 맥락 어텐션
발행: (2025년 12월 17일 오후 12:09 GMT+9)
4 min read
원문: Dev.to
Source: Dev.to
Challenge Overview
N개의 계층형 다중 에이전트 시스템이 각각 M개의 에이전트로 구성되어 공유 작업 공간에서 동작하는 상황을 고려하십시오. 에이전트들은 각각 고유한 시간적 맥락, 비정상적인 보상 함수, 그리고 다수의 이해관계자를 가진 K개의 별도 작업을 수행해야 합니다.
Constraints
- 각 시스템의 에이전트는 시간이 지남에 따라 진화하는 공통 지식 그래프와 상호작용합니다.
- 각 작업에 대한 보상 함수는 비정상적이며, 그 매개변수는 사전 정의되었지만 알 수 없는 확률 분포에 따라 변합니다.
- 각 이해관계자는 고유한 보상 함수를 가지고 있으며, 이는 서로 다른 작업이나 에이전트를 우선시할 수 있습니다.
- 작업의 시간적 맥락은 의사결정에 영향을 미치며, 그 보상 함수는 다른 에이전트의 행동에 의해 영향을 받습니다.
- 에이전트는 지식 그래프, 보상 함수, 그리고 모든 작업 및 이해관계자의 시간적 맥락을 고려하여 전역 상태에 대해 추론해야 합니다.
Evaluation Metrics
AI 에이전트는 다음 능력에 대해 평가됩니다:
- 누적 보상 최대화 – 모든 작업 및 이해관계자에 걸쳐.
- 적응력 – 보상 함수, 지식 그래프, 시간적 맥락의 변화에 대응.
- 전역 상태에 대한 효과적인 추론 – 개별 목표와 집단 목표의 균형을 맞추는 의사결정.
Dataset
합성 데이터셋이 제공되며, 다음을 포함합니다:
- 작업 설명: 시간적 맥락, 보상 함수, 지식 그래프.
- 에이전트 상호작용: 관찰, 행동, 보상.
- 이해관계자 설명: 보상 함수와 우선순위.
Submission Guidelines
제출물에는 다음이 포함되어야 합니다:
- 제안된 AI 에이전트 아키텍처에 대한 상세 설명(추론 메커니즘, 지식 표현, 의사결정 과정).
- 공개적으로 접근 가능한 저장소에 호스팅된 구현 코드.
- 결과 재현을 위한 명확한 실행 지침.
Evaluation Criteria
- 성능: 평가 지표(누적 보상, 적응력, 전역 추론)에서의 결과.
- 아키텍처 품질: 확장성, 견고성, 유지보수성.
- 제출물의 명료성 및 간결성: 문서화, 코드 구조, 테스트.
최우수 제출자는 권위 있는 상을 받게 되며, 계층형 다중 에이전트 시스템 분야의 향후 AI 연구를 위한 벤치마크가 됩니다.