[논문] Cranio-Diff: 2D X‑ray 두개골 가이드와 구조 정체성 제약을 이용한 확산 기반 교차 도메인 두개안면 복원
개요
CycleGAN, Pix2Pix, 그리고 확산 모델과 같은 최신 생성 모델들은 얼굴 생성 작업에서 놀라운 성능을 보여주었습니다. 그러나 두개골(x‑ray)에서 얼굴(광학) 영역으로 변환할 때, 모달리티 간 구조적 정체성 정렬이 맞지 않아 두개안면 재구성에서 교차 모달리티 의미 정보를 효과적으로 포착하지 못합니다. 이 문제를 해결하기 위해 우리는 2D X‑ray 두개골 이미지로부터 교차 도메인 두개‑안면 재구성을 수행하는 확산 기반 프레임워크 Cranio‑Diff를 제안합니다. 제안 방법은 ControlNet을 통한 두개골 조건부 구조 가이드를 바이오메트릭 텍스트 조건과 결합하여, 주어진 두개골과 의미·구조적으로 더 잘 정렬된 얼굴을 생성합니다. Cranio‑Diff는 측면 및 정면 뷰에서 120명의 피험자를 X‑ray 스캔하여 만든 두개골‑얼굴 데이터셋을 사용해 평가했습니다. 통제된 평가를 위해 각 얼굴 이미지는 25·45·65세의 세 연령대와 -10 %, 기준, +10 %의 세 BMI 변형으로 합성되어 총 4,320개의 짝을 이룹니다. 현재까지 이 규모의 X‑ray‑얼굴 데이터셋은 유일합니다. 광범위한 실험 결과, 제안 방법이 최신 기존 접근법보다 생성 이미지 품질 및 검색 작업 모두에서 우수함을 확인했습니다. 마지막으로 제안 방법의 성능을 평가하기 위해 생성 이미지 품질을 FID, IS, SSIM, LPIPS, PSNR, ArcFace 점수로 측정했으며, 검색 성능은 recall@k, mAP@k, MRR@k로 평가했습니다. 실험 결과는 본 방법이 법과학 조사에서 보조 도구로 활용될 수 있음을 보여줍니다.
핵심 기여
이 논문은 다음 분야의 연구를 다룹니다.
- cs.CV
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.CV 분야의 발전에 기여합니다.
저자
- Ravi Shankar Prasad
- Naresh Gurjar
- Shashank Baghel
- Chirag
- Dinesh Singh
논문 정보
- arXiv ID: 2606.09699v1
- 분류: cs.CV
- 발표일: 2026년 6월 8일
- PDF: PDF 다운로드