[论文] 部分软匹配距离用于具有部分单元对应的神经表征比较
发布: (2026年2月23日 GMT+8 04:31)
8 分钟阅读
原文: arXiv
Source: arXiv - 2602.19331v1
Overview
本文介绍了 Partial Soft‑Matching Distance (PSMD),这是一种在仅有部分单元(神经元、体素或特征图)实际对应的情况下比较神经表征(无论是来自脑成像数据还是深度学习模型)的新方法。通过允许部分单元不匹配,PSMD 既 对噪声/异常单元具有鲁棒性,又 对几何变换(例如旋转)敏感,这对于可解释性非常重要。
Key Contributions
- Partial optimal‑transport formulation 对经典的 soft‑matching distance 的部分最优传输形式化,放宽了 “所有单元必须匹配” 的约束。
- Theoretical guarantees:在放弃严格质量守恒的同时,保留可解释的传输成本,从而在理论上实现更好的鲁棒性。
- Efficient ranking algorithm:对每个单元的对齐质量进行评分,无需为每个子集重新求解完整的传输问题。
- Empirical validation 在三个方面进行验证:(1) 含异常值的合成模拟,(2) 人类 fMRI 数据集,(3) 深度卷积网络。
- Demonstrated practical benefits:自动排除低可靠性体素,提高同源脑区之间的对齐精度,并在匹配的深度网络单元之间呈现更清晰的视觉相似性。
方法论
- 表示为点云 – 每个神经群体(例如,一组体素或层的特征向量)被视为高维特征空间中的加权点云。
- 软匹配距离 – 传统上解决一个最优传输问题,迫使一个点云中的每个点都匹配到另一个点云中的某个点,使用平滑的(熵正则化的)代价。
- 部分扩展 – PSMD 添加了一个 松弛 变量,允许一部分总“质量”保持未匹配。实际上,这意味着求解一个 部分最优传输 问题,传输计划可以将部分概率质量留在一个虚拟的“未匹配”节点上。
- 高效单元排序 – 在一次求解传输后,双对偶变量提供每个单元的得分,指示该单元对最优计划贡献了多少质量。对这些得分进行排序即可得到从“高置信匹配”到“可能的异常值”的排名。
- 实现细节 – 作者使用带有可调未匹配质量参数 ε 的 Sinkhorn‑Knopp 算法,该算法在 GPU 上运行仅需几秒钟,适用于典型的 fMRI 或深度网络层规模。
结果与发现
| 设置 | 测试内容 | 关键结果 |
|---|---|---|
| 合成模拟 | 向本来相同的表征中注入随机异常单元 | PSMD 保持了正确匹配不变,而完整的软匹配导致了虚假的对齐。 |
| fMRI 数据(视觉皮层) | 比较不同受试者以及同源脑区之间的体素模式 | PSMD 自动降低低可靠性体素的权重,产生的体素排名与通过穷举暴力搜索得到的结果高度吻合(≈ 99 % 相关),并将受试者间对齐精度提升约 12 %。 |
| 深度卷积神经网络(AlexNet,ResNet) | 对独立训练的网络层进行对齐 | 高 PSMD 分数的单元产生几乎相同的最大激活图像;未匹配的单元显示出不同的视觉偏好,证实 PSMD 能隔离出“核心”对齐子群。 |
| 模型选择任务 | 从噪声观测中识别正确的生成模型 | PSMD 选出真实模型的比例为 85 %,而标准软匹配距离为 62 %。 |
总体而言,该方法在更抗噪声、更快计算排名以及在解释哪些单元在系统间真正对应方面更具可解释性。
实际意义
- 神经科学流水线:研究人员可以将 PSMD 插入现有的表征相似性分析(RSA)工具包,自动剔除不可靠的体素,节省数小时的手动质量控制。
- 模型到大脑对齐:在将深度网络层映射到大脑区域时,PSMD 突出显示真正共享表征几何的单元子集,从而能够对“类脑”特征提出更严密的假设。
- 跨模型诊断:工程师在比较模型的两个版本(例如剪枝或量化后)时,可使用 PSMD 量化原始表征保留了多少,以便将调试工作集中在不匹配的单元上。
- 迁移学习与领域适应:通过识别高置信度对齐的子空间,只转移这些特征,可能在面对系统性噪声的数据集切换时提升鲁棒性。
- 可扩展分析:由于排序仅来源于一次传输求解,PSMD 能够扩展到数万单元——完全在现代 GPU 的能力范围内——因此适用于大规模模型层面的审计。
限制与未来工作
- 未匹配质量的选择 (ε):该方法需要用户定义一个未匹配质量的预算;如果设定得过低或过高,可能导致欠剪或过剪。自适应方案是一个待研究的方向。
- 欧氏成本的假设:传输成本基于表示空间中的欧氏距离;对于某些嵌入,其他度量(例如余弦相似度)可能更合适。
- 计算开销与暴力搜索的比较:虽然比穷举搜索便宜得多,PSMD 仍然需要一次 Sinkhorn 迭代,对于极高维数据(例如全脑体素网格)而言,这并非微不足道。
- 向时间动态的扩展:当前公式处理静态快照;将 PSMD 扩展到比较随时间变化的神经轨迹(例如 MEG、RNN 隐状态)仍有待探索。
结论:Partial Soft‑Matching Distance 提供了一种原理明确、易于集成的工具,适用于在完美一对一对应不现实的情况下比较神经表征——无论是对齐脑部扫描、审计深度网络层,还是构建更稳健的模型比较流水线。
作者
- Chaitanya Kapoor
- Alex H. Williams
- Meenakshi Khosla
论文信息
- arXiv ID: 2602.19331v1
- 分类: cs.LG, cs.NE, stat.ML
- 发表时间: 2026年2月22日
- PDF: 下载 PDF