1周前 · ai [Paper] Gated KalmaNet:通过测试时岭回归实现的衰减记忆层 作为对 softmax Attention 的高效替代方案,线性状态空间模型(SSMs)实现了常数内存和线性计算,但仅保持一种有损的、衰减的 s...