[논문] 연속시간 생존 분석을 위한 서바이벌 디퓨전 확률 모델 (SDPM)

발행: (2026년 5월 22일 AM 02:33 GMT+9)
4 분 소요
원문: arXiv

Source: arXiv - 2605.22776v1

개요

생존 분석은 검열된 관측값을 포함한 데이터로부터 사건 발생 시간 분포를 추정하는 것을 목표로 합니다. 기존 방법들은 위험 함수에 구조적 가정을 두거나 시간 축을 이산화하는데, 이는 유연성을 제한하고 근사 오차를 초래할 수 있습니다. 우리는 연속 시간 생존 분석을 위한 생성적 접근법인 **Survival Diffusion Probabilistic Model (SDPM)**을 제안합니다. SDPM은 관측된 시간과 검열 지표의 쌍으로 표현되는 생존 결과의 조건부 분포 $\mathbb{P}(T,δ\mid \mathbf{x})$를 디노이징 확산 모델을 이용해 모델링합니다. 조건부 독립 검열이라는 가정 하에, 모델이 생성한 조건부 샘플은 Kaplan‑Meier 추정기를 사용해 생존 함수 추정치로 변환될 수 있습니다. 이 형식은 사건 시간 분포에 대한 파라메트릭 가정을 피하고 출력 시간 공간을 이산화할 필요도 없습니다. 모델은 표준화된 로그 시간과 검열 지표의 연속적인 가우시안 혼합 표현을 사용하는 변환된 목표 공간에서 작동합니다. 우리는 10개의 실제 생존 데이터셋에 대해 SDPM을 평가하고, 트리 기반, 부스팅 기반, 신경망 기반 생존 모델을 포함한 5개의 강력한 베이스라인과 비교했습니다. 결과는 SDPM이 C‑index, 통합 시점 의존 AUC, 통합 Brier 점수 측면에서 경쟁력 있는 예측 성능을 보임을 보여줍니다. 합성 Cox‑Weibull 데이터에 대한 연구에서는 충분히 많은 샘플을 생성할 경우, SDPM이 강력한 비모수 베이스라인보다 기본 연속 생존 분포의 형태를 더 정확히 복원할 수 있음을 확인했습니다. 또한, 제안된 목표 공간 변환이 사건 비율 보정성을 향상시키고, 잘못된 생성 시간의 발생을 감소시키며, 예측 구별력에서 일관된 향상을 제공한다는 것을 확인하는 소거 실험도 수행했습니다. 제안 모델을 구현한 코드는 공개되어 있습니다.

핵심 기여

이 논문은 다음 분야의 연구를 다룹니다:

  • cs.LG
  • cs.AI
  • stat.CO
  • stat.ML

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

이 연구는 cs.LG 분야의 발전에 기여합니다.

저자

  • Stanislav R. Kirpichenko
  • Andrei V. Konstantinov
  • Lev V. Utkin

논문 정보

  • arXiv ID: 2605.22776v1
  • 분류: cs.LG, cs.AI, stat.CO, stat.ML
  • 출판일: 2026년 5월 21일
  • PDF: Download PDF
0 조회
Back to Blog

관련 글

더 보기 »