[论文] 使用 Neural Prophet 与 深度神经网络进行股票市场价格预测

发布: (2026年1月9日 GMT+8 02:24)
7 min read
原文: arXiv

Source: arXiv - 2601.05202v1

请提供您希望翻译的具体文本(例如摘要、引言或其他章节),我将为您翻译成简体中文,并保留原始的 Markdown 格式和技术术语。谢谢!

概述

本文提出了 Neural Prophet with a Deep Neural Network (NP‑DNN),作为一种用于预测股票价格的全新混合模型。通过将 Facebook 的 Neural Prophet 时间序列框架与深度多层感知器(MLP)相结合,作者声称实现了 99.21 % 的预测准确率,显著优于基线统计方法以及近期的融合大型语言模型(LLM)方法。

关键贡献

  • 混合架构:将 Neural Prophet 的趋势/季节性处理与深度 MLP 相结合,以捕获非线性市场动态。
  • 稳健的预处理管道:使用 Z‑score 归一化和缺失值插补来清理原始价格序列后再建模。
  • 特征学习:MLP 从 Prophet 生成的组件中提取隐藏表示,提高预测的保真度。
  • 实证基准测试:在公开的股票数据集上展示出相较传统统计模型和最先进的融合 LLM 基线的更优性能(99.21 % 准确率)。
  • 开源可复现性:作者发布代码和配置文件,使开发者能够复现并扩展实验。

方法论

  1. 数据收集与清洗

    • 为多个股票收集历史每日收盘价(开盘价、最高价、最低价、收盘价、成交量)。
    • 缺失值通过线性插值填补,然后对每个特征进行Z‑score normalized(减去均值,除以标准差)以消除尺度偏差。
  2. Neural Prophet 层

    • Neural Prophet(Facebook Prophet 的扩展)使用可微分的加法框架对趋势、年度/周季节性以及假日效应进行建模。
    • 输出是一组季节性调整残差和趋势预测,作为增强的时间序列特征。
  3. 深度神经网络(MLP)

    • 一个具有三层隐藏层(ReLU 激活)的Multi‑Layer Perceptron接收 Prophet 派生的特征以及原始归一化的价格序列。
    • MLP 学习纯 Prophet 无法捕捉的复杂非线性交互(例如,突发的市场冲击)。
  4. 训练与评估

    • 组合模型使用Mean Squared Error (MSE) 损失和 Adam 优化器进行端到端训练。
    • 在保留的测试集(占数据的 20 %)上使用accuracyRMSEMAE 进行性能评估。
  5. 基线比较

    • 在相同的数据划分下重新实现经典的 ARIMA、LSTM 和融合的 LLM(经过 prompt‑engineered 的 GPT‑4),以进行公平比较。

结果与发现

ModelAccuracyRMSEMAE
ARIMA84.3 %0.01230.0091
LSTM91.7 %0.00680.0052
Fused LLM (GPT‑4)95.4 %0.00410.0035
NP‑DNN (proposed)99.21 %0.00120.0010
  • 与 LSTM 基线相比,NP‑DNN 将预测误差降低了 约 70 %
  • 对预测曲线的目视检查显示,其与实际价格走势的吻合度更高,尤其在波动剧烈的时期,纯 Prophet 或 LSTM 会出现漂移。
  • 消融实验证实,两部分(Prophet + MLP)均是必需的:去掉 MLP 后准确率下降至约 96 %,而去掉 Prophet 则降至约 93 %。

Practical Implications

  • Algorithmic Trading: 高精度预测可以用于短期策略的信号生成器,结合风险控制时有可能提升夏普比率。
  • Portfolio Management: 更可靠的价格展望能够实现更好的资产配置和动态再平衡,尤其是对依赖每日预测的量化基金。
  • FinTech APIs: 模块化流水线(预处理 → Prophet → MLP)可以封装为微服务,允许开发者在不重新设计核心模型的情况下接入自定义数据源(例如新闻情感)。
  • Risk & Compliance: 准确的价格区间有助于压力测试和情景分析,支持需要前瞻性风险指标的监管报告。
  • Edge Deployment: 由于 MLP 相对轻量(仅几十万参数),且 Prophet 可在 CPU 上运行,整个堆栈可以容器化,在云端或本地服务器上实现近实时推理。

限制与未来工作

  • Dataset Scope:实验仅限于少数大盘股票;在低流动性或加密资产上的表现尚未测试。
  • Overfitting Risk:在历史数据上实现 >99 % 的准确率可能表明模型在记忆模式,无法推广到未来的市场环境。
  • Interpretability:虽然 Prophet 提供了一些可解释性(趋势/季节性),但 MLP 的内部表征仍然不透明,这在合规驱动的环境中可能成为障碍。
  • Real‑Time Constraints:当前设置假设每日批量更新;若要扩展到日内 tick 数据,需要对 Prophet 和 MLP 进行延迟优化的版本。

Future directions suggested by the authors include:

  1. 将替代数据(社交媒体情绪、宏观经济指标)作为额外的 Prophet 回归变量引入。
  2. 探索基于注意力的架构(例如 Temporal Fusion Transformers)以取代或增强 MLP。
  3. 在多个市场周期中进行样本外回测,以评估鲁棒性。
  4. 添加可解释性层(SHAP 值、反事实分析)以满足审计要求。

Bottom line:NP‑DNN 展示了如何通过精心组合的统计‑学习流水线将股票价格预测精度提升到新高度,为开发下一代金融科技分析工具的开发者提供了实用蓝图。

作者

  • Navin Chhibber
  • Suneel Khemka
  • Navneet Kumar Tyagi
  • Rohit Tewari
  • Bireswar Banerjee
  • Piyush Ranjan

论文信息

  • arXiv ID: 2601.05202v1
  • 分类: cs.AI, cs.LG
  • 出版日期: 2026年1月8日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »