[Paper] 相位复用光学计算:利用照明相位多样性重新配置多任务衍射光学处理器
发布: (2025年12月7日 GMT+8 13:07)
7 min read
原文: arXiv
Source: arXiv - 2512.06658v1
Overview
一种新的光学计算架构使单个衍射处理器仅通过改变照明光的相位图案,就能执行数百种不同的线性变换。通过将每个期望的操作编码为不同的二维“相位钥”,同一硬件可以即时重新编程,为信号处理和机器视觉任务提供多功能、低功耗的光学加速器。
Key Contributions
- 相位复用可重构性: 引入一种仅通过照明相位即可在 (T) 个不同复值线性映射之间切换的方法,无需更换物理元件。
- 紧凑单色设计: 在单一波长带内实现与波长复用系统相同的功能,显著降低色差和制造复杂度。
- 可扩展网络规模: 证明具有 (N = 2 \times T \times N_i \times N_o) 个优化特征的衍射层能够忠实实现任意输入场的 (T) 种变换。
- 大规模概念验证: 数值演示 (T = 512) 种不同的复变换可以在误差可忽略的情况下实现。
- 相较于波长复用的误差降低: 量化相位复用如何产生更低的变换误差,使单芯片上更大规模的光学处理成为可能。
Methodology
- 网络架构: 单个平面衍射光学元件(DOE)位于输入孔径(像素化场 (N_i))和输出平面(像素化场 (N_o))之间。
- 相位钥: 对于每个目标变换,预先计算的二维相位掩模(即“相位钥”)被放置在空间光调制器(SLM)或类似装置上,用于照亮输入孔径。
- 联合优化: 通过基于梯度的波传播仿真,同时优化DOE的表面结构和所有 (T) 个相位钥,使得在显示特定钥时,DOE能够对输入进行解复用并在输出处再现相应的线性映射。
- 复值线性映射: 系统被建模为每个任务 (t) 的矩阵 (H_t \in \mathbb{C}^{N_o \times N_i})。训练损失对每个任务以及一组随机输入的实际输出场与期望的 (H_t)·输入之间的差异进行惩罚。
- 数值验证: 使用真实的衍射物理(菲涅尔传播、量化相位级别和噪声)进行仿真,验证同一DOE能够在 512 项任务之间切换,均方误差远低于 (10^{-4})。
Results & Findings
- 跨任务高保真度: 512 种变换的平均归一化均方误差(NMSE)小于 0.001,表明对任意复数输入的几乎完美重建。
- 相位钥正交性: 不同的相位钥产生的输出场分离良好,证实了有效的复用且无串扰。
- 与波长复用的比较: 对于相同数量的任务,基于相位的复用设计在 NMSE 上降低了 3–5 倍,主要因为避免了色散和宽带衍射设计的需求。
- 可扩展性: 所需的衍射特征数量随任务数和输入/输出分辨率线性增长,表明硬件扩展具有可预测性。
Practical Implications
- 可重构光学加速器: 单个DOE可作为可编程线性算子,用于傅里叶变换、卷积核或矩阵‑向量乘法等任务——这些是光学神经网络和信号处理流水线的关键构件。
- 低功耗、高吞吐量推理: 计算以光速完成且几乎没有电子开销,适用于对延迟敏感的应用(如实时视频分析、激光雷达预处理)。
- 简化硬件堆栈: 采用单色方案可避免昂贵的多激光源、二向色光学元件以及波长分复用所需的复杂对准过程。
- 快速原型制作: 在SLM上更新相位钥本质上是软件层面的更改,使得新算法能够在不重新制造衍射元件的情况下即时部署。
- 集成路径: 该方法可与现有硅光子或超表面平台结合,实现面向边缘设备的紧凑芯片级实现。
Limitations & Future Work
- 物理实现挑战: 本研究目前为数值模拟;实际制造公差、SLM刷新率和相位量化可能引入额外误差。
- 可扩展性权衡: 虽然特征计数呈线性增长,但极大 (T) 或高分辨率输入可能需要难以实现的细微衍射图案或大孔径。
- 动态范围与噪声: 系统假设理想相干照明;非相干或部分相干光源可能降低性能。
- 未来方向: 实验验证、探索混合幅度‑相位钥、用于设备校准的自适应学习,以及与电子控制回路的集成,以闭环实现光学计算流水线。
Authors
- Xiao Wang
- Aydogan Ozcan
Paper Information
- arXiv ID: 2512.06658v1
- Categories: physics.optics, cs.NE, physics.app-ph
- Published: December 7, 2025
- PDF: Download PDF