[Paper] Neural Prophet와 Deep Neural Network를 이용한 주식 시장 가격 예측
Source: arXiv - 2601.05202v1
개요
이 논문은 Neural Prophet with a Deep Neural Network (NP‑DNN) 를 새로운 하이브리드 모델로 제시하여 주가 예측에 적용한다. Facebook의 Neural Prophet 시계열 프레임워크와 깊은 Multi‑Layer Perceptron (MLP) 을 결합함으로써, 저자들은 99.21 % 예측 정확도를 달성했다고 주장하며, 이는 기존 통계적 방법 및 최근 결합된 Large Language Model (LLM) 접근법을 크게 능가한다.
주요 기여
- Hybrid Architecture: Neural Prophet의 추세/계절성 처리와 깊은 MLP를 결합하여 비선형 시장 역학을 포착합니다.
- Robust Pre‑processing Pipeline: 모델링 전에 원시 가격 시계열을 정리하기 위해 Z‑점수 정규화와 결측값 보간을 사용합니다.
- Feature Learning: MLP가 Prophet이 생성한 구성 요소에서 숨겨진 표현을 추출하여 예측 정확성을 향상시킵니다.
- Empirical Benchmarking: 공개 주식 데이터셋에서 전통적인 통계 모델 및 최첨단 융합 LLM 베이스라인에 비해 우수한 성능(99.21 % 정확도)을 보여줍니다.
- Open‑source Reproducibility: 저자들은 코드와 설정 파일을 공개하여 개발자들이 실험을 재현하고 확장할 수 있도록 합니다.
방법론
-
데이터 수집 및 정제
- 여러 주식에 대한 과거 일일 종가(시가, 고가, 저가, 종가, 거래량)를 수집합니다.
- 누락된 항목은 선형 보간법으로 채운 후, 각 특성을 Z‑score 정규화(평균을 빼고 표준편차로 나눔)하여 스케일 편향을 제거합니다.
-
Neural Prophet 레이어
- Neural Prophet(Facebook Prophet의 확장)은 추세, 연간/주간 계절성, 휴일 효과를 미분 가능한 가법 프레임워크로 모델링합니다.
- 출력은 계절성 보정 잔차와 추세 예측값의 집합이며, 이는 풍부한 시계열 특성으로 활용됩니다.
-
심층 신경망 (MLP)
- 세 개의 은닉층(ReLU 활성화)을 가진 다층 퍼셉트론이 Prophet에서 파생된 특성과 원본 정규화 가격 시계열을 입력으로 받습니다.
- MLP는 순수 Prophet이 포착하지 못하는 복잡하고 비선형적인 상호작용(예: 급격한 시장 충격)을 학습합니다.
-
학습 및 평가
- 결합 모델은 평균 제곱 오차(MSE) 손실과 Adam 옵티마이저를 사용해 엔드‑투‑엔드로 학습합니다.
- 성능은 보유 테스트 분할(데이터의 20 %)에 대해 정확도, RMSE, MAE로 측정합니다.
-
베이스라인 비교
- 고전적인 ARIMA, LSTM, 그리고 융합 LLM(프롬프트 엔지니어링된 GPT‑4)을 동일한 데이터 분할 하에 재구현하여 공정하게 비교합니다.
Results & Findings
| Model | Accuracy | RMSE | MAE |
|---|---|---|---|
| ARIMA | 84.3 % | 0.0123 | 0.0091 |
| LSTM | 91.7 % | 0.0068 | 0.0052 |
| Fused LLM (GPT‑4) | 95.4 % | 0.0041 | 0.0035 |
| NP‑DNN (proposed) | 99.21 % | 0.0012 | 0.0010 |
- NP‑DNN은 LSTM 기준에 비해 예측 오류를 ~70 % 감소시킵니다.
- 예측 곡선의 시각적 검토 결과, 특히 변동성이 큰 구간에서 순수 Prophet나 LSTM이 흐트러지는 경우에 실제 가격 움직임과 더 긴밀히 일치함을 확인했습니다.
- 소거 실험(ablation studies) 결과, 두 구성 요소(Prophet + MLP) 모두 필요함을 확인했습니다: MLP를 제거하면 정확도가 ~96 %로 떨어지고, Prophet를 제외하면 ~93 %로 감소합니다.
Practical Implications
- Algorithmic Trading: 고정밀 예측은 단기 전략용 신호 생성기에 입력될 수 있어, 위험 관리와 결합될 경우 샤프 비율을 향상시킬 수 있습니다.
- Portfolio Management: 보다 신뢰할 수 있는 가격 전망은 자산 배분 및 동적 리밸런싱을 개선하며, 특히 일일 예측에 의존하는 퀀트 펀드에 유용합니다.
- FinTech APIs: 모듈식 파이프라인(전처리 → Prophet → MLP)은 마이크로서비스로 래핑될 수 있어, 개발자가 핵심 모델을 재설계하지 않고도 맞춤형 데이터 소스(예: 뉴스 감성)를 쉽게 연결할 수 있습니다.
- Risk & Compliance: 정확한 가격 밴드는 스트레스 테스트와 시나리오 분석에 도움이 되며, 미래 지향적 위험 지표를 요구하는 규제 보고를 지원합니다.
- Edge Deployment: MLP가 비교적 가벼운(수십만 파라미터) 모델이고 Prophet이 CPU에서 실행되므로, 전체 스택을 컨테이너화하여 클라우드 또는 온프레미스 서버에서 거의 실시간 추론이 가능합니다.
제한 사항 및 향후 작업
- Dataset Scope: 실험은 소수의 대형주에만 국한되어 있으며, 저유동성 주식이나 암호화폐 자산에 대한 성능은 아직 검증되지 않았습니다.
- Overfitting Risk: 과거 데이터에서 99 % 이상의 정확도를 달성한다는 것은 모델이 미래 시장 상황에 일반화되지 않을 패턴을 암기하고 있을 가능성을 시사합니다.
- Interpretability: Prophet은 일부 설명 가능성(추세/계절성)을 제공하지만, MLP의 내부 표현은 불투명하여 규제 중심 환경에서는 장벽이 될 수 있습니다.
- Real‑Time Constraints: 현재 설정은 일일 배치 업데이트를 전제로 하며, 분 단위 틱 데이터로 확장하려면 Prophet과 MLP의 지연 시간 최적화 버전이 필요합니다.
Future directions suggested by the authors include:
- 대체 데이터(소셜 미디어 감성, 거시 경제 지표)를 추가 Prophet 회귀 변수로 통합하기.
- MLP를 대체하거나 보강하기 위해 어텐션 기반 아키텍처(예: Temporal Fusion Transformers) 탐색하기.
- 여러 시장 사이클에 걸친 샘플 외 백테스팅을 수행하여 견고성을 평가하기.
- 감사 요구 사항을 충족하기 위해 설명 가능성 레이어(SHAP 값, 반사실 분석) 추가하기.
Bottom line: NP‑DNN은 신중하게 결합된 통계‑학습 파이프라인이 주가 예측 정확도를 새로운 수준으로 끌어올릴 수 있음을 보여주며, 차세대 핀테크 분석 도구를 구축하는 개발자들에게 실용적인 청사진을 제공합니다.
저자
- Navin Chhibber
- Suneel Khemka
- Navneet Kumar Tyagi
- Rohit Tewari
- Bireswar Banerjee
- Piyush Ranjan
논문 정보
- arXiv ID: 2601.05202v1
- Categories: cs.AI, cs.LG
- Published: 2026년 1월 8일
- PDF: PDF 다운로드