[논문] 합성 데이터만으로 충분할까? 소아 희귀 질환 인식에서 데이터 부족 재고
Source: arXiv - 2605.22767v1
개요
희귀 유전 질환을 가진 아동은 종종 독특한 안면 표현형을 보이지만, 극도로 제한된 데이터, 개인정보 보호 제약, 소아 의료 현장에서의 데이터 공유 제한 때문에 조기 진단을 위한 컴퓨터 비전 시스템 개발은 여전히 어려운 과제입니다. 이러한 문제는 자동 진단을 방해할 뿐만 아니라 임상 유전 상담을 위한 시각 자료의 확보도 제한합니다. 기존 연구에서는 합성 데이터가 실제 데이터셋을 보강하고 표현형 수준의 의미를 유지할 수 있음을 보여주었지만, 초저자원 소아 환경에서 합성 데이터만으로 학습이 충분한지 여부는 명확하지 않았습니다. 본 연구에서는 소아 희귀 질환 인식을 위한 합성 전용 학습 방식을 조사합니다. 통제된 실험 설정 하에, 모델을 표현형을 고려한 합성 안면 이미지만으로 점진적으로 규모를 늘려 학습시켰습니다. 그 결과, 충분한 규모에서 합성 전용 학습이 여러 백본에 걸쳐 실제 데이터 전용 베이스라인과 비슷한 성능을 달성함을 확인했으며, 이는 고품질 합성 데이터가 임상적으로 의미 있는 분포를 근사할 수 있음을 시사합니다. 이러한 발견은 합성 소아 안면 이미지를 개인정보 보호가 가능한 유전 교육 및 상담 자료로 활용할 수 있는 가능성을 열어주어, 임상의 교육 및 환자와의 소통을 지원합니다. 우리의 결과는 컴퓨터 비전이 데이터 효율성을 높이고 아동 의료 분야에서 접근 가능한 시각 도구를 확대할 잠재력을 강조합니다.
주요 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.CV
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
본 연구는 cs.CV 분야의 발전에 기여합니다.
저자
- Ganlin Feng
- Yuxi Long
- Erin Lou
- Lianghong Chen
- Zihao Jing
- Pingzhao Hu
- Wei Xu
논문 정보
- arXiv ID: 2605.22767v1
- Categories: cs.CV
- Published: 2026년 5월 21일
- PDF: PDF 다운로드