[论文] 使用 Neural Prophet 与 深度神经网络进行股票市场价格预测
发布: (2026年1月9日 GMT+8 02:24)
7 min read
原文: arXiv
Source: arXiv - 2601.05202v1
请提供您希望翻译的具体文本(例如摘要、引言或其他章节),我将为您翻译成简体中文,并保留原始的 Markdown 格式和技术术语。谢谢!
概述
本文提出了 Neural Prophet with a Deep Neural Network (NP‑DNN),作为一种用于预测股票价格的全新混合模型。通过将 Facebook 的 Neural Prophet 时间序列框架与深度多层感知器(MLP)相结合,作者声称实现了 99.21 % 的预测准确率,显著优于基线统计方法以及近期的融合大型语言模型(LLM)方法。
关键贡献
- 混合架构:将 Neural Prophet 的趋势/季节性处理与深度 MLP 相结合,以捕获非线性市场动态。
- 稳健的预处理管道:使用 Z‑score 归一化和缺失值插补来清理原始价格序列后再建模。
- 特征学习:MLP 从 Prophet 生成的组件中提取隐藏表示,提高预测的保真度。
- 实证基准测试:在公开的股票数据集上展示出相较传统统计模型和最先进的融合 LLM 基线的更优性能(99.21 % 准确率)。
- 开源可复现性:作者发布代码和配置文件,使开发者能够复现并扩展实验。
方法论
-
数据收集与清洗
- 为多个股票收集历史每日收盘价(开盘价、最高价、最低价、收盘价、成交量)。
- 缺失值通过线性插值填补,然后对每个特征进行Z‑score normalized(减去均值,除以标准差)以消除尺度偏差。
-
Neural Prophet 层
- Neural Prophet(Facebook Prophet 的扩展)使用可微分的加法框架对趋势、年度/周季节性以及假日效应进行建模。
- 输出是一组季节性调整残差和趋势预测,作为增强的时间序列特征。
-
深度神经网络(MLP)
- 一个具有三层隐藏层(ReLU 激活)的Multi‑Layer Perceptron接收 Prophet 派生的特征以及原始归一化的价格序列。
- MLP 学习纯 Prophet 无法捕捉的复杂非线性交互(例如,突发的市场冲击)。
-
训练与评估
- 组合模型使用Mean Squared Error (MSE) 损失和 Adam 优化器进行端到端训练。
- 在保留的测试集(占数据的 20 %)上使用accuracy、RMSE 和 MAE 进行性能评估。
-
基线比较
- 在相同的数据划分下重新实现经典的 ARIMA、LSTM 和融合的 LLM(经过 prompt‑engineered 的 GPT‑4),以进行公平比较。
结果与发现
| Model | Accuracy | RMSE | MAE |
|---|---|---|---|
| ARIMA | 84.3 % | 0.0123 | 0.0091 |
| LSTM | 91.7 % | 0.0068 | 0.0052 |
| Fused LLM (GPT‑4) | 95.4 % | 0.0041 | 0.0035 |
| NP‑DNN (proposed) | 99.21 % | 0.0012 | 0.0010 |
- 与 LSTM 基线相比,NP‑DNN 将预测误差降低了 约 70 %。
- 对预测曲线的目视检查显示,其与实际价格走势的吻合度更高,尤其在波动剧烈的时期,纯 Prophet 或 LSTM 会出现漂移。
- 消融实验证实,两部分(Prophet + MLP)均是必需的:去掉 MLP 后准确率下降至约 96 %,而去掉 Prophet 则降至约 93 %。
Practical Implications
- Algorithmic Trading: 高精度预测可以用于短期策略的信号生成器,结合风险控制时有可能提升夏普比率。
- Portfolio Management: 更可靠的价格展望能够实现更好的资产配置和动态再平衡,尤其是对依赖每日预测的量化基金。
- FinTech APIs: 模块化流水线(预处理 → Prophet → MLP)可以封装为微服务,允许开发者在不重新设计核心模型的情况下接入自定义数据源(例如新闻情感)。
- Risk & Compliance: 准确的价格区间有助于压力测试和情景分析,支持需要前瞻性风险指标的监管报告。
- Edge Deployment: 由于 MLP 相对轻量(仅几十万参数),且 Prophet 可在 CPU 上运行,整个堆栈可以容器化,在云端或本地服务器上实现近实时推理。
限制与未来工作
- Dataset Scope:实验仅限于少数大盘股票;在低流动性或加密资产上的表现尚未测试。
- Overfitting Risk:在历史数据上实现 >99 % 的准确率可能表明模型在记忆模式,无法推广到未来的市场环境。
- Interpretability:虽然 Prophet 提供了一些可解释性(趋势/季节性),但 MLP 的内部表征仍然不透明,这在合规驱动的环境中可能成为障碍。
- Real‑Time Constraints:当前设置假设每日批量更新;若要扩展到日内 tick 数据,需要对 Prophet 和 MLP 进行延迟优化的版本。
Future directions suggested by the authors include:
- 将替代数据(社交媒体情绪、宏观经济指标)作为额外的 Prophet 回归变量引入。
- 探索基于注意力的架构(例如 Temporal Fusion Transformers)以取代或增强 MLP。
- 在多个市场周期中进行样本外回测,以评估鲁棒性。
- 添加可解释性层(SHAP 值、反事实分析)以满足审计要求。
Bottom line:NP‑DNN 展示了如何通过精心组合的统计‑学习流水线将股票价格预测精度提升到新高度,为开发下一代金融科技分析工具的开发者提供了实用蓝图。
作者
- Navin Chhibber
- Suneel Khemka
- Navneet Kumar Tyagi
- Rohit Tewari
- Bireswar Banerjee
- Piyush Ranjan
论文信息
- arXiv ID: 2601.05202v1
- 分类: cs.AI, cs.LG
- 出版日期: 2026年1月8日
- PDF: 下载 PDF