CRAM-Net:通过重连进行思考的网络
Source: Dev.to
引言:超越静态模型
CRAM‑Net(Conversational Reasoning & Memory Network)代表了神经架构的根本转变——从静态权重模型走向 Memory‑Native (MN) 系统。传统 AI 将对话历史视为存放在临时缓存中的外部文本,而 CRAM‑Net 将每一次交互视为突触变化的物理催化剂:
“对话即网络。”
该模型会在对话进行时实时重连自身。CRAM‑Net 属于 Memory‑Native Neural Network (MNNN) 家族,代码已在 GitHub 上公开:👉
双重记忆轨道
CRAM‑Net 使用两条内部记忆轨道来映射人脑同时处理短暂上下文和永久逻辑的能力。
对话层
机制: Hebbian Trace Neurons
功能: 捕获即时对话上下文(例如姓名、当前话题)
动态特性
- 高学习率
- 快速衰减
实现短期记忆而不永久修改核心逻辑,使网络能够在没有传统上下文窗口的情况下保持上下文感知。
推理层
机制: Differentiable Logic Manifolds
功能: 发现并固化逻辑不变式(例如 (A \Rightarrow B))
动态特性
- 低学习率
- 高稳定性
逻辑结构会在对话结束后仍然保留,形成持久的推理图谱。
全局工作空间瓶颈
信息并非自由流动;所有内部表征必须通过 全局工作空间瓶颈。
- 压缩率: 约 12.5 % 的原始思维向量
- 认知压力: 强迫系统挑选真正重要的内容
- 推理触发: 为了在压缩中存活,逻辑抽象变得必需
该瓶颈自然会激活推理轨道,因为结构化的逻辑比原始数据更易压缩。
后端实现
CRAM‑Net 由高性能 C 后端 (cram‑net.c) 驱动,对每个处理的 token 执行一次突触更新。
/* Synaptic update rule */
W_new = W_old + eta * (h_t ⊗ h_{t-1}) - lambda * W_old;
/* Association Step */
// Links the current thought with the previous one, preserving continuity.
/* Decay Step */
// Prevents runaway memory growth and gradually removes conversational noise.
效率
- 每次交互仅有 25–30 % 的突触保持活跃。
- 在最小计算开销下保持高水平的上下文保留。
总结
CRAM‑Net 将智能重新定义为一种活的、可适应的结构,其中:
- 对话直接改变网络。
- 记忆与推理是内生的,而非后加的。
- 逻辑在压力下自然出现,而非通过显式指令。
这不是一个带记忆的聊天机器人;它是一个 通过自我重连进行思考 的网络。