[논문] 필요한 것만 추적한다: 구조 인식형 온디맨드 하이퍼그래프 메모리를 활용한 장문 문서 질문 답변

발행: (2026년 6월 9일 PM 11:29 GMT+9)
3 분 소요
원문: arXiv

Source: arXiv - 2606.10921v1

개요

긴 문서에 흩어져 있는 증거들을 추론해야 하는 장문 질문 응답(Question Answering, QA)에는 대형 언어 모델(LLM)이 필요합니다. 답변은 종종 사건 순서, 섹션 수준의 맥락, 그리고 문서 내 여러 부분 간의 증거 연결에 의존합니다. 검색 기반 생성(Retrieval‑Augmented Generation, RAG)은 관련 증거를 검색해 입력 컨텍스트를 줄여주지만, 기존 구조화된 RAG 방법은 여전히 세 가지 한계에 직면합니다: 쿼리와 무관한 지식 조직 비용이 높음, 원본 문서 구조를 충분히 활용하지 못함, 그리고 과거 추론 경험을 재사용하지 못함. 이러한 문제를 해결하기 위해 우리는 DocTrace를 제안합니다. DocTrace는 장문 QA를 위한 다중 에이전트 RAG 프레임워크로, 쿼리 기반 지식 조직, 문서 구조 인식 및 경험 기반 추론을 지원합니다. DocTrace는 가벼운 문서 구조 트리 인덱스로 문서 계층을 보존하고, 추론 중 필요에 따라 에이전트가 공유하는 하이퍼그래프 형태의 작업 메모리를 구축합니다. 또한 성공적인 추론 계획을 그래프 구조의 경험 메모리에 저장해 향후 재사용함으로써 관련 장문 질문들 사이에서 적응적인 탐색을 가능하게 합니다. 네 개의 장문 QA 데이터셋에 대한 실험 결과, DocTrace는 세 데이터셋에서 최고 성능을 기록했으며, 가장 강력한 베이스라인인 ComoRAG를 F1 점수 기준 최대 8.85%, EM 기준 4.40% 능가하면서 전체 계산 비용을 53.32% 절감했습니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

  • cs.CL

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.CL 분야의 발전에 기여합니다.

저자

  • Xiangjun Zai
  • Xingyu Tan
  • Chen Chen
  • Xiaoyang Wang
  • Wenjie Zhang

논문 정보

  • arXiv ID: 2606.10921v1
  • Categories: cs.CL
  • 출판일: 2026년 6월 9일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »