[논문] X+Slides: 청중 조건별 슬라이드 생성 벤치마크

발행: (2026년 6월 18일 AM 01:30 GMT+9)
4 분 소요
원문: arXiv

출처: arXiv - 2606.19256v1

개요

자동으로 원본 문서에서 슬라이드 데크를 생성하는 것은 대형 언어 모델(LLM)의 중요한 응용 분야입니다. 기존 벤치마크는 주로 슬라이드 완성도와 기술 깊이를 평가하며, 실제 세계에서 핵심적인 대상 청중을 간과합니다. 예를 들어, 전문가들은 엄격한 증명을 요구하고, 의사 결정자는 실행 가능한 결론을 우선시합니다.

이 격차를 메우기 위해, 우리는 청중 조건부 슬라이드 생성 전용으로 설계된 X+Slides라는 벤치마크를 도입했습니다.

다양한 주제(113개)와 일곱 가지 발표 장면을 포괄하는 풍부한 코퍼스를 기반으로, X+Slides는 8,133개의 복제되지 않은 원본 기반 프로브로 구성된 동적 평가 프레임워크를 사용합니다.

같은 원본 기반 프로브에 청중별 유용성 가중치를 부여함으로써, X+Slides는 네 개의 보완적인 지표를 보고합니다: Audience Coverage(청중이 필수적으로 전달하는 정보의 양을 측정), Domain‑wise Coverage(제공되는 정보 유형을 보여줌), Efficiency(단위 주의 비용당 제공된 유틸리티를 측정), and Correctness(슬라이드 주장이 원본에 의해 지지되는지 검증).

DeepPresenter, SlideTailor 및 NotebookLM에 대한 실험 결과, 현재 시스템은 청중 필수 정보의 상당한 부분만 회수할 뿐이며, 불완전함을 보이고 있습니다: $τ_A=0.7$에서 DeepPresenter는 최적 Audience Coverage 0.714를, SlideTailor는 0.594를, NotebookLM 파생 모델은 0.853을 달성하면서 명백한 근원 차이를 보입니다.

이 결과는 시각적 품질과 광범위한 주제 커버리지가 원본 기반 평가를 수행하지 않은 채 증거로 간주되어서는 안 된다는 것을 의미합니다.

주요 공헌

이 논문은 다음과 같은 분야를 다룹니다:

  • cs.AI

방법론

자세한 방법については 전체 논문을 참고하십시오.

실제 적용 가능성

이 연구는 cs.AI의 발전에 기여합니다.

저자

  • Haodong Chen
  • Xuanhe Zhou
  • Wei Zhou
  • Xinyue Shao
  • Yanbing Zhu
  • Bo Wang
  • Jiawei Hong
  • Anya Jia
  • Fan Wu

논문 정보

  • arXiv ID: 2606.19256v1
  • 카테고리: cs.AI
  • 발행일: 2026년 6월 17일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »