[Paper] Humans' ALMANAC: 에이전트 협업을 위한 행동 수준 정신 모델 주석 인간 협업 데이터셋

발행: 6일 전 (2026년 6월 5일 AM 01:56 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2606.06388v1

Overview

최근 LLM 에이전트의 발전으로 다단계 추론, 계획 수립, 도구 활용 등 복잡한 인지 능력이 가능해졌으며, 이러한 에이전트는 점점 인간 협업 파트너로 자리매김하고 있습니다. 그러나 효과적인 협업을 위해서는 협업 과정 동안 자신들의 추론, 파트너의 의도, 그리고 공동 목표에 대한 정신 모델을 지속적으로 유지하고 정렬해야 합니다. 현재의 에이전트는 주로 과제 수행에 최적화되어 있어 이러한 능력을 거의 갖추지 못하고 있으며, 행동 수준의 정신 모델 주석이 포함된 실제 인간 협업 데이터가 부족해 에이전트가 과정 수준의 협업 역량을 학습하기 어렵습니다.

이 격차를 메우기 위해, 우리는 ALMANAC을 제시합니다. 이는 사회 과학에서 고전적인 이인 라우팅 과제인 Map Task를 기반으로 만든 Action‑Level Mental model ANnotations for Agent Collaboration 데이터셋입니다. ALMANAC은 2,987개의 협업 행동을 포함하며, 각 행동마다 참여자의 자기 추론, 파트너 의도 인식, 팀 목표 인식을 기록한 이론 기반 정신 모델 주석이 짝지어져 있습니다. 우리는 여섯 개의 LLM을 대상으로 인간의 다음 턴 행동 및 정신 모델을 예측하는 벤치마크를 수행했습니다. 결과는 ALMANAC이 모델이 인간 협업 행동을 시뮬레이션하고 그 근본적인 정신 모델을 추론하는 능력을 평가하는 데 유용함을 보여줍니다.

Key Contributions

cs.AI
cs.CL

Methodology

자세한 방법론은 전체 논문을 참고하십시오.

Practical Implications

이 연구는 cs.AI 분야의 발전에 기여합니다.

Authors

Jiaju Chen
Yuxuan Lu
Jiayi Su
Chaoran Chen
Songlin Xiao
Zheng Zhang
Yun Wang
Yunyao Li
Jian Zhao
Tongshuang Wu
Toby Jia‑Jun Li
Dakuo Wang
Bingsheng Yao

Paper Information

arXiv ID: 2606.06388v1
Categories: cs.AI, cs.CL
Published: June 4, 2026
PDF: Download PDF

[Paper] Humans' ALMANAC: 에이전트 협업을 위한 행동 수준 정신 모델 주석 인간 협업 데이터셋

Overview

Key Contributions

Methodology

Practical Implications

Authors

Paper Information

관련 글

[논문] LLM은 주사위 굴리기에서 얼마나 신뢰할 수 있을까?

[논문] MemDreamer: 계층 그래프 메모리와 에이전트형 검색으로 긴 비디오 이해의 지각·추론 분리

[논문] 다중어 표현 분류: 감독 학습 vs 시연 기반 인컨텍스트 학습

[논문] TEVI: 희소 오토인코더를 활용한 텍스트 조건부 시각 표현 편집으로 비전‑언어 정렬 개선