[논문] 자기지도 원칙을 통한 확산 모델 표현 공간 평가

발행: 3일 전 (2026년 6월 9일 AM 01:44 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2606.09718v1

개요

확산 모델은 놀라운 생성 능력을 보여주었을 뿐만 아니라 강력한 자기지도 표현 학습기로도 부상했지만, 이 두 능력 사이의 연결 고리는 아직 충분히 탐구되지 않았다. 자기지도 학습(SSL)에서 영감을 받아, 우리는 확산 모델의 표현 및 생성 능력을 동시에 평가할 수 있는 프레임워크를 제안한다. 구체적으로, 특징을 불변 성분과 잔차 성분으로 분해하고, 피셔 기반 메트릭인 **불변 오염 비율(Invariant Contamination Ratio, ICR)**을 도출한다. ICR은 잔차 변동이 특징 공간에서 불변 신호를 얼마나 오염시키는지를 정량화한다. 우리는 이 프레임워크를 이용해 확산 모델의 판별적 행동과 생성적 행동을 모두 분석한다. 표현 측면에서는 불변성이 중간 수준의 노이즈에서 정점에 이르며, 이때가 다운스트림 분류 성능이 가장 좋은 지점임을 발견했다. 생성 측면에서는 데이터가 제한된 상황에서 훈련이 진정한 일반화에서 기억으로 전이되는 과정을 조사하고, ICR이 초기 학습을 감지하는 민감한 훈련 시점 지표임을 보였다: 피셔 방향을 따라 잔차 에너지가 증가하면 기억이 시작됨을 나타내며, 이는 외부 평가자나 보류된 테스트 세트 없이도 훈련 특징만으로 탐지할 수 있다. 전반적으로 우리의 결과는 확산 모델을 학습된 표현의 기하학을 통한 자기지도 관점에서 모니터링할 수 있음을 보여준다.

주요 기여

이 논문은 다음 분야의 연구를 제시한다:

cs.LG
cs.CV

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.LG 분야의 발전에 기여한다.

저자

Xiao Li
Yixuan Jia
Zekai Zhang
Xiang Li
Lianghe Shi
Jinxin Zhou
Zhihui Zhu
Liyue Shen
Qing Qu

논문 정보

arXiv ID: 2606.09718v1
Categories: cs.LG, cs.CV
Published: June 8, 2026
PDF: Download PDF

[논문] 자기지도 원칙을 통한 확산 모델 표현 공간 평가

개요

주요 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[Paper] 한 시간짜리 영상에서 자연어 시간 정합은 검색 문제: 벤치마크와 실증적 분해

[논문] 점진적 크기 기반 프루닝으로 한 번의 학습 사이클에서 희소 서브네트워크 찾기

[논문] 다중 GPU 가우시안 스플래팅을 위한 확장 가능한 PyTorch 추상화

[논문] FADA: 선택적으로 증류된 통합 비전‑언어 모델을 통한 접근 가능한 태아 초음파 해석 및 주석