[Paper] 时序 Kolmogorov‑Arnold 网络 (T‑KAN) 用于高频限价订单簿预测：效率、可解释性与 Alpha 衰减

发布: 2周前 (2026年1月6日 GMT+8 01:59)

6 min read

原文: arXiv

Source: arXiv - 2601.02310v1

概述

本文介绍了 Temporal Kolmogorov‑Arnold Networks (T‑KAN)，这是一种用于预测高频限价订单簿（LOB）动态的新型深度学习架构。通过将传统 LSTM 的静态线性激活函数替换为可学习的 B‑样条函数，T‑KAN 能捕捉市场信号的形状，显著降低了像 DeepLOB 等现有模型所面临的“alpha 衰减”问题。

关键贡献

可学习的样条激活函数： 用 B‑样条函数取代固定的 LSTM 权重，使网络能够更灵活地建模非线性市场模式。
显著的性能提升： 在 FI‑2010 数据集上，100‑tick 预测范围（k = 100）实现了 19.1 % 的相对 F1‑score 提升。
稳健的盈利能力： 在考虑 1 bps 交易成本后，产生 132.48 % 的回报，而 DeepLOB 则出现 ‑82.76 % 的回撤。
可解释性： 样条曲线揭示了“死区”（低灵敏度区域），为交易员提供了模型认为不相关的价格变动的直观视觉信息。
FPGA‑就绪设计： 架构经过简化，适合通过高层次综合（HLS）实现低延迟，实现硬件加速交易系统。
开源可复现性： 完整代码和实验脚本已在 GitHub 上公开发布。

方法论

数据预处理 – 作者使用 FI‑2010 高频订单簿（LOB）数据集，提取前 10 个价位（买/卖）以及标准技术特征（价格差、成交量等）。
时序 KAN 层 – 每个 LSTM 单元都加入了 Kolmogorov‑Arnold 网络（KAN） 激活函数：一种分段 B‑样条，其控制点在训练过程中学习得到。这使得激活函数能够根据底层市场动态自适应曲率。
网络堆叠 – 一系列 T‑KAN 层的输出传入全连接头部，输出对下 k 个 tick 的多分类预测（价格上升、下降或中性）。
训练方案 – 使用标准交叉熵损失、Adam 优化器、提前停止，以及类平衡的 mini‑batch，以缓解高频交易数据中常见的严重类别不平衡。
硬件映射 – 样条函数的求值被表达为一系列简单的算术运算，能够通过 HLS 指令（循环展开、流水线化）高效映射到 FPGA 流水线。

结果与发现

指标	DeepLOB（基线）	T‑KAN（提议）
F1‑score @ k = 100	0.421	0.501 (+19.1 % rel.)
累计回报（1 bps 成本）	–82.76 %	+132.48 %
延迟（FPGA 仿真）	~1.2 µs	~0.4 µs (≈3× faster)

Alpha 衰减缓解： 当 k ≈ 30 以上时，DeepLOB 的预测能力急剧下降，而 T‑KAN 在 k = 100 仍保持稳定的 F1‑score，表明其在更长时域上能够更好地保留信号。
可解释性演示： 学到的样条可视化显示出平坦区域（死区），模型在这些区域会忽略噪声微幅波动；以及陡峭区域，模型会对决定性价格变动作出强烈响应。
硬件效率： 基于样条的激活函数减少了乘加运算次数，从而降低了 FPGA 板上的功耗和推理延迟。

Practical Implications

低延迟交易机器人： 开发者可以将 T‑KAN 直接嵌入基于 FPGA 的市场数据适配器，实现亚微秒级的决策时间——这对延迟敏感的策略至关重要。
降低模型漂移： 形状学习能力帮助模型保持更长时间的相关性，降低重新训练周期的频率和运营开销。
合规的可解释 AI： 可见的死区为合规团队提供了审计模型为何忽略特定价格波动的直观依据，缓解了对黑箱高频交易模型的监管担忧。
成本效益的扩展： 由于 T‑KAN 用样条评估取代了大量矩阵乘法，它可以在普通硬件（如边缘设备或低成本 FPGA）上运行而不牺牲准确性，为小型公司与大型竞争者竞争打开了大门。

限制与未来工作

数据集范围: 实验仅限于 FI‑2010 数据集；在其他交易所、资产类别或更近期的市场微观结构上的表现可能有所不同。
超参数敏感性: 样条结点的数量和位置需要仔细调节；自动结点选择尚未研究。
模型复杂度与可解释性权衡: 虽然样条比深层 ReLU 更具可解释性，但整体网络深度仍可能使非常深的堆叠的决策路径变得模糊。
未来方向: 作者建议将 T‑KAN 扩展到多资产交叉相关预测，整合基于强化学习的执行策略，并开发自动结点优化算法。

作者

Ahmad Makinde

论文信息

arXiv ID: 2601.02310v1
分类: cs.LG
出版日期: 2026年1月5日
PDF: Download PDF

[Paper] 时序 Kolmogorov‑Arnold 网络 (T‑KAN) 用于高频限价订单簿预测：效率、可解释性与 Alpha 衰减

概述

关键贡献

方法论

结果与发现

Practical Implications

限制与未来工作

作者

论文信息

相关文章

[Paper] 解释在大型推理模型中是否具有泛化性？

[论文] 为 Gemini 构建生产就绪探针

[Paper] ShapeR：从随意捕获中实现稳健的条件3D形状生成

[Paper] MetaboNet：最大公开可用的综合数据集，用于1型糖尿病管理