[Paper] 突触激活与双液体动力学用于可解释的仿生模型

发布: 3天前 (2026年2月13日 GMT+8 23:23)

6 分钟阅读

原文: arXiv

Source: arXiv - 2602.13017v1

概述

本文提出了一个统一的、生物启发的框架，用于构建和解释循环神经网络（RNN）控制器。通过在经典 RNN 中加入 液体电容动力学 和 化学突触机制，作者实现了在苛刻的车道保持任务上表现出色且远比典型黑箱策略更透明的模型。

关键贡献

Unified modeling language：捕获一系列生物启发的 RNN 变体（纯液体动力学、化学突触及其组合）。
Liquid‑capacitance extension：为密集全连接 RNN 赋予可解释的内部动力学，同时不牺牲表达能力。
Chemical synapse integration：进一步阐明网络活动与控制决策之间的因果关系。
Comprehensive evaluation suite（包括加权损失、神经活动轨迹相关性、显著性图鲁棒性），用于真实的车道保持控制基准。
Empirical evidence：混合的 “chemical + activation” 模型在准确性和可解释性之间提供了最佳的权衡。

方法论

模型族

作者从标准的全连接 RNN 出发，并在三个方面进行增强：

液体动力学：每个神经元表现为带电容项的泄漏积分器，模拟类似流体的信息流动。
化学突触：连接方式模拟神经递质释放，加入可开关的非线性门控。
双重激活：同时结合液体和化学机制，产生更丰富的状态空间。

训练方案

所有变体均通过强化学习在模拟的自动驾驶环境中端到端训练，要求车辆在处理不同锐度的弯道时保持车道居中。

可解释性指标

转向加权验证损失 – 对急转弯的错误给予更高惩罚，突出控制器最关键的部分。
神经活动与轨迹相关性 – 衡量隐藏状态与道路曲率的匹配程度。
显著性图 – 基于梯度的可视化，展示每个时间步哪些神经元影响转向指令。
结构相似性指数（SSIM） – 量化相似驾驶场景下显著性图的稳定性。

结果与发现

Model	Lane‑keeping error (↓)	Activity‑trajectory corr. (↑)	Saliency SSIM (↑)
Baseline RNN	0.42	0.31	0.58
Liquid‑only	0.35	0.44	0.71
Chemical‑only	0.33	0.48	0.74
Dual (Liquid + Chemical)	0.27	0.61	0.82

双模型相较于普通 RNN 将车道保持误差降低约 35 %。
隐状态活动与道路曲率的相关性显著提升，表明网络“思考”的特征与人类驾驶员更为一致。
显著图（Saliency maps）更加清晰且一致性更高（SSIM 更高），使得事后审计控制器决策成为可能。

实际意义

Safer autonomous systems – 工程师现在可以部署具有内置可解释性的 RNN‑based 控制器，促进监管批准和调试。
Debug‑first development – Saliency‑map 稳定性使开发者能够在故障出现之前定位失效模式（例如在急转弯时注意力丢失）。
Transferable design patterns – liquid‑capacitance 和 chemical‑synapse 模块是轻量级插件，可在最少代码修改的情况下添加到现有 RNN 库（PyTorch、TensorFlow）中。
Explainable AI for control – 该框架弥合了高性能强化学习策略与人类可读推理之间的差距，这是机器人、航空航天和医疗设备等领域的关键需求。

限制与未来工作

可扩展性 – 实验仅限于单车道保持场景；尚需验证该方法在多任务或高维感知流水线中的扩展能力。
计算开销 – 添加液体和化学动力学会适度增加运行时间和内存占用，这可能成为实时嵌入式系统的瓶颈。
生物忠实度与工程实用性 – 虽然模型受神经科学启发，作者仍承认其抽象化较为简化，可能未能捕捉所有相关的神经动力学。

未来的研究方向包括将框架扩展到基于视觉的输入、为边缘硬件优化生物启发模块，以及探索利用新获得的可解释性进行形式化验证的技术。

作者

Mónika Farsang
Radu Grosu

论文信息

arXiv ID: 2602.13017v1
分类: cs.NE, cs.AI, cs.LG
发布时间: 2026年2月13日
PDF: 下载 PDF

相关文章

阅读更多 »

[Paper] 模仿有效方法：Simulation-Filtered Modular Policy Learning 来自人类视频

通过观看人类视频来学习操作技能的能力有望为机器人学习打开一个高度可扩展的新数据来源。在这里，…

[Paper] 语义分块与自然语言的熵

印刷英文的熵率被广泛估计约为每字符一比特，这一基准是现代大型语言模型（LLMs）仅仅……

[Paper] CoPE-VideoLM：用于高效视频语言模型的 Codec 原语

Video Language Models (VideoLMs) 使 AI 系统能够理解视频中的 temporal dynamics。为了适应最大 context window 限制，当前的方法……

[Paper] CMIP6模型在Jhelum和Chenab流域区域降水预测与气候变化评估中的选择

有效的水资源管理取决于对水道流量的准确预测。对于投射的气候数据，使用不同的General Circulation…