[논문] 모델 해석에서 간과된 기준선

발행: 2주 전 (2026년 5월 21일 PM 09:40 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2605.22417v1

개요

우리는 기존 모델 해석 방법들이 일반적으로 베이스라인을 무시하고 있으며, 이러한 무시는 종종 부정확하거나 심지어 잘못된 해석을 초래한다는 점을 관찰한다. 본 논문에서는 모델 해석 작업과 해석 결과에 대한 해석 원칙을 재정의하여 베이스라인의 중요성을 입증한다. 또한 그래디언트 기반 방법, Integrated Gradients(IG) 방법, 그리고 테일러 전개를 통합하여 이들 간의 연결 고리를 명확히 하고 각 방법에 대한 베이스라인을 명시적으로 식별한다. 이를 바탕으로 관련 모델 해석 방법들(IG, LayerCAM, ODAM, Difference Map)의 결함과 오류를 분석한다. 우리는 모델 해석 결과의 품질을 주변 효과나 완벽한 모델 성능 가정에 기반한 결함 있는 평가 방법이 아니라, 귀속 결과와 귀속 목표 사이의 귀속 오류를 통해 정확히 평가할 것을 주장한다. IG를 수정하고 명확하고 합리적인 베이스라인을 갖는 모델 해석 방법을 개발하여 더 나은 결과를 달성한다. 우리의 방법은 어떤 레이어의 특징을 기반으로 한 모델 해석도 지원한다. 서로 다른 레이어의 특징을 기반으로 한 해석은 모두 합리적이며, 이러한 결과들 간의 차이는 서로 다른 특징 추출 단계에서의 추출 정도 차이를 반영한다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

cs.CV
cs.SE

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.CV 분야의 발전에 기여한다.

저자

Yongjin Cui
Xiaohui Fan

논문 정보

arXiv ID: 2605.22417v1
Categories: cs.CV, cs.SE
발행일: 2026년 5월 21일
PDF: Download PDF

[논문] 모델 해석에서 간과된 기준선

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[Paper] Geo-Align: Metric Geometry Reward를 통한 비디오 생성 정렬

[Paper] PiD: 빠르고 고해상도 잠재 디코딩 with Pixel Diffusion

[Paper] ETCHR: 편집을 통한 명확화 및 추론 활용

[Paper] 활성화에서 인과성으로: 인간 뇌에서 Causal Visual Representations 발견