[논문] 감지기 제한 판독 하에 분류를 위한 비상관 영상의 종단 간 최적화
개요
광학 프론트엔드(예: 메타표면)와 신경망 백엔드의 엔드‑투‑엔드 공동 최적화는 이미지 작업에 널리 적용되어 왔지만, 이러한 시스템이 기존 렌즈 기반 이미징보다 언제, 왜 성능이 뛰어난지를 설명하는 형식은 아직 부족합니다. 본 논문은 이미지 작업의 중심인 객체 분류에 초점을 맞추어, 비코히런트 이미징을 위한 위상 마스크의 엔드‑투‑엔드 최적화가 기존 초점 렌즈에 비해 언제 성능을 향상시키는지를 묻습니다. 우리는 이러한 이득이 주로 제한된 검출기 읽기 출력 하에서 발생하고, 전체 검출기 읽기 출력에서는 제한적임을 발견했습니다. 후자의 경우, 우리는 어떠한 비코히런트 위상 마스크도 검출기 측정값과 클래스 레이블 사이의 이상 채널 상호 정보량을 초과하지 않음을 증명합니다; 기존 초점 렌즈가 이 상한에 근접하고, 공동 최적화는 실험적으로 이득을 제공하지 않습니다. 검출기 읽기 출력이 제한될 때—예를 들어 거친 공간 샘플링이나 측정 수 제한—최적화된 광학은 검출기 측정값에서 클래스 구분성을 높여 분류를 크게 향상시킬 수 있습니다. 이러한 이득은 검출기 노이즈가 낮을 때 가장 크며, 노이즈가 증가함에 따라 감소합니다. 이는 광학이 신호가 검출기에 도달하기 전에 형태를 바꾸지만, 이후에 추가되는 노이즈는 제거할 수 없기 때문입니다. 이 장점은 작업의 스펙트럼 구조에도 의존합니다: 클래스 구분에 중요한 내용이 클래스 내부 변동보다 낮은 공간 주파수에 집중될 때 공동 설계가 가장 큰 도움이 됩니다. 우리는 이러한 구분을 형식화한 이론적 프레임워크를 개발하고, 합성 데이터와 표준 벤치마크(MNIST, FashionMNIST, SVHN)에서 예측을 검증합니다.
핵심 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.CV
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 함의
이 연구는 cs.CV 분야의 발전에 기여합니다.
저자
- Archer Wang
- Joshua Chen
- Sachin Vaidya
- Marin Soljačić
논문 정보
- arXiv ID: 2606.09792v1
- 분류: cs.CV
- 출판일: 2026년 6월 8일
- PDF: PDF 다운로드