[논문] 필요한 것만 추적한다: 구조 인식형 온디맨드 하이퍼그래프 메모리를 활용한 장문 문서 질문 답변

발행: 3일 전 (2026년 6월 9일 PM 11:29 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2606.10921v1

개요

긴 문서에 흩어져 있는 증거들을 추론해야 하는 장문 질문 응답(Question Answering, QA)에는 대형 언어 모델(LLM)이 필요합니다. 답변은 종종 사건 순서, 섹션 수준의 맥락, 그리고 문서 내 여러 부분 간의 증거 연결에 의존합니다. 검색 기반 생성(Retrieval‑Augmented Generation, RAG)은 관련 증거를 검색해 입력 컨텍스트를 줄여주지만, 기존 구조화된 RAG 방법은 여전히 세 가지 한계에 직면합니다: 쿼리와 무관한 지식 조직 비용이 높음, 원본 문서 구조를 충분히 활용하지 못함, 그리고 과거 추론 경험을 재사용하지 못함. 이러한 문제를 해결하기 위해 우리는 DocTrace를 제안합니다. DocTrace는 장문 QA를 위한 다중 에이전트 RAG 프레임워크로, 쿼리 기반 지식 조직, 문서 구조 인식 및 경험 기반 추론을 지원합니다. DocTrace는 가벼운 문서 구조 트리 인덱스로 문서 계층을 보존하고, 추론 중 필요에 따라 에이전트가 공유하는 하이퍼그래프 형태의 작업 메모리를 구축합니다. 또한 성공적인 추론 계획을 그래프 구조의 경험 메모리에 저장해 향후 재사용함으로써 관련 장문 질문들 사이에서 적응적인 탐색을 가능하게 합니다. 네 개의 장문 QA 데이터셋에 대한 실험 결과, DocTrace는 세 데이터셋에서 최고 성능을 기록했으며, 가장 강력한 베이스라인인 ComoRAG를 F1 점수 기준 최대 8.85%, EM 기준 4.40% 능가하면서 전체 계산 비용을 53.32% 절감했습니다.

주요 기여

이 논문은 다음 분야의 연구를 제시합니다:

cs.CL

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.CL 분야의 발전에 기여합니다.

저자

Xiangjun Zai
Xingyu Tan
Chen Chen
Xiaoyang Wang
Wenjie Zhang

논문 정보

arXiv ID: 2606.10921v1
Categories: cs.CL
출판일: 2026년 6월 9일
PDF: Download PDF

[논문] 필요한 것만 추적한다: 구조 인식형 온디맨드 하이퍼그래프 메모리를 활용한 장문 문서 질문 답변

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] 완전 무작위 마스킹을 넘어: 어텐션 기반 디노이징 및 최적화, 확산 언어 모델을 위한.

[논문] 폴란드 의학 시험에서 고성능 LLM 재평가: 진정한 실력인가, 편향에 의한 성과인가?

[논문] 제3자 감사를 넘어: 사용자 중심 LLM 편향 연구를 위한 상황적 상호작용 감사

[논문] VIA‑SD: 추측 디코딩을 위한 모델 내부 라우팅 기반 검증