[Paper] DeePM: Regime-Robust 딥러닝 기반 체계적 매크로 포트폴리오 관리
Source: arXiv - 2601.05975v1
개요
이 논문은 **DeePM (Deep Portfolio Manager)**을 소개한다. DeePM은 다양한 매크로‑선물 계약에 자본을 배분하도록 설계된 딥러닝 시스템으로, 변화하는 시장 체제에도 견고하게 작동한다. 데이터‑타이밍 문제, 잡음이 섞인 신호, 그리고 위험을 고려한 목표 설정의 필요성을 해결함으로써, DeePM은 전통적인 추세‑추종 규칙의 약 두 배에 달하는 위험‑조정 수익을 제공하며 최근 Momentum‑Transformer 벤치마크조차 능가한다.
주요 기여
- Causal Sieve (Directed Delay) layer – “ragged filtration” 문제를 해결하여 모델이 미래 데이터를 우연히 엿보는 것이 아니라 실제로 지연된 인과적으로 유효한 정보를 학습하도록 강제합니다.
- Macroeconomic Graph Prior – 경제 지식(예: 상품‑통화‑금리 연계)을 정규화 항으로 주입하여 신호‑대‑잡음 비가 낮은 환경에서 교차 자산 신호 추출을 향상시킵니다.
- Distributionally robust utility – Entropic Value‑at‑Risk (EVaR)를 근사하는 부드러운 최악‑윈도우 페널티를 구현하여 가장 어려운 과거 하위 기간 동안에도 강력한 성과를 장려합니다.
- End‑to‑end training with realistic transaction‑cost modeling – 비용 모델이 손실 함수에 내장되어 있어 네트워크가 처음부터 효율적으로 거래하도록 학습합니다.
- Empirical validation on 50 diversified futures (2010‑2025) – 여러 레짐 전환(CTA 겨울, 팬데믹, 2020년 이후 인플레이션 환경)에서도 일관된 초과 수익을 입증합니다.
- Ablation study – 각 아키텍처 구성 요소의 영향을 분리 분석하여 lag‑only attention, graph prior, cost‑aware loss, 그리고 robust optimization이 일반화 성능의 주요 동인임을 확인합니다.
방법론
- Data pipeline – 50개 선물의 일일 종가를 지연 수익률, 거시‑경제 지표, 그리고 알려진 경제 관계(예: 석유 ↔ USD, 채권 수익률 ↔ 주가지수)를 인코딩한 희소 인접 행렬로 변환합니다.
- Model architecture
- Directed Delay (Causal Sieve): 구성 가능한 지연보다 오래된 정보만 어텐션 메커니즘으로 흐르도록 허용하는 맞춤형 마스킹 레이어로, 인과성을 보장합니다.
- Cross‑sectional attention with graph regularization: 어텐션 점수가 거시‑그래프에 따라 페널티를 부여받아, 네트워크가 경제적으로 타당한 공동 움직임을 존중하도록 유도합니다.
- Portfolio head: 원시 포지션 가중치를 출력하고, 이를 소프트맥스와 유사한 정규화와 거래‑비용 레이어(턴오버에 비례)로 전달합니다.
- Training objective – 손실은 위험‑조정 효용(예상 수익률에서 위험 회피 항을 뺀 값)의 음수와 부드러운 최악‑윈도우 페널티(EVaR을 근사) 를 결합합니다. 이는 최소‑최대 문제를 형성하여, 모델이 가장 불리한 과거 윈도우에서도 잘 작동하는 가중치를 찾도록 합니다.
- Optimization – 시간적 구조를 보존하기 위해 롤링 윈도우의 미니‑배치를 사용한 Adam 기반 확률적 경사 하강법을 적용합니다. 조기 종료는 검증 기간(2018‑2019) 동안의 샘플 외 효용을 기준으로 합니다.
Results & Findings
| 지표 (연간) | DeePM | Momentum‑Transformer | Classic Trend‑Follow (CT) | S&P 500 Index |
|---|---|---|---|---|
| 순수익 | 14.2 % | 9.3 % | 6.8 % | 7.1 % |
| 샤프 비율 | 1.68 | 1.12 | 0.95 | 0.78 |
| 최대 손실 | ‑12 % | ‑18 % | ‑21 % | ‑24 % |
| EVaR (95 %) | ‑4.1 % | ‑7.3 % | ‑9.5 % | ‑11.2 % |
- 레짐 전반에 걸친 견고성: 2014‑2016년 CTA 겨울, 2020년 3월 COVID‑19 급락, 2022‑2023년 인플레이션‑구동 변동성 급증 등에서 성과가 2010‑2025년 평균 샤프 비율의 ±1 % 이내에 머물렀습니다.
- 제거 실험 인사이트: 그래프 사전 정보를 제거하면 샤프 비율이 약 0.3 감소했으며, 인과 체를 표준 선행 마스크로 교체하면 누수가 발생해 성능이 30 % 급락했습니다.
- 거래 비용 민감도: 계약당 0.5 bps의 현실적인 슬리피지와 5 bps의 회전 비용을 적용해도 DeePM은 샤프 비율이 1.5 이상을 유지했으며, 이는 모델이 저회전, 고신뢰 신호를 학습했음을 나타냅니다.
Practical Implications
- For quant teams: DeePM은 플러그‑앤‑플레이 아키텍처를 제공하며, 유동성이 높은 선물이나 ETF 어떤 조합에도 학습시킬 수 있고, 매크로 그래프를 거래하는 자산에 맞게 쉽게 맞춤 설정할 수 있습니다.
- Risk‑aware portfolio construction: EVaR 스타일의 최악 윈도우 페널티는 손실에 꼬리 위험 고려를 직접 삽입할 수 있는 미분 가능한 방법을 제공하여 사후 위험 오버레이의 필요성을 줄여줍니다.
- Regime‑agnostic deployment: 모델이 지연된 인과적으로 유효한 신호에 의존하도록 학습하고 경제적 연계를 고려하기 때문에, 단일 시장 환경에 과적합될 가능성이 낮아집니다—이는 딥러닝 트레이더에게 흔히 겪는 문제점입니다.
- Cost‑efficient execution: 명시적인 회전율 페널티를 적용해 학습함으로써, 결과 전략은 불필요한 거래를 자연스럽게 제한하고, 이는 실제 운영 시 실행 비용을 낮추는 효과로 이어집니다.
- Extensibility: Directed Delay 개념은 비동기 데이터 스트림으로 인해 “불규칙한” 입력이 발생하는 다른 시계열 분야(예: 수요 예측, 에너지 부하 균형)에도 적용할 수 있습니다.
제한 사항 및 향후 연구
- 데이터 범위: 이 연구는 일일 종가만을 사용합니다; 주문서 깊이, 거래량 급증과 같은 초단기 정보는 성능을 더욱 향상시킬 수 있지만, 동시에 누수 위험을 다시 초래할 수 있습니다.
- 그래프 사전 고정성: 매크로 그래프는 수작업으로 만든 고정된 형태입니다; 데이터에서 동적으로 그래프를 학습하는 방법(예: 그래프 신경망)을 적용하면 변화하는 경제 관계를 포착할 수 있습니다.
- 계산 비용: 15년 동안 50개의 자산에 대해 전체 모델을 학습하는 데 여러 GPU‑일이 필요합니다; 빠른 프로토타이핑을 위해 경량 버전이 필요할 수 있습니다.
- 규제 및 해석 가능성 문제: 그래프 사전이 어느 정도 설명 가능성을 제공하지만, 내부 어텐션 가중치는 여전히 블랙박스입니다; 향후 작업에서는 규제 보고를 위한 어텐션 시각화 도구를 통합할 수 있습니다.
핵심 요점: DeePM은 인과성을 존중하고, 경제 구조를 내재화하며, 견고한 위험 지표를 최적화하는 신중하게 설계된 딥러닝 파이프라인이 실제로 레짐에 강인한 매크로 포트폴리오 성과를 제공할 수 있음을 보여줍니다. 이는 생산 환경에서 보다 회복력 있는 AI 기반 트레이딩 시스템의 문을 열어줍니다.
저자
- Kieran Wood
- Stephen J. Roberts
- Stefan Zohren
논문 정보
- arXiv ID: 2601.05975v1
- 분류: q-fin.TR, cs.LG, stat.ML
- 발행일: 2026년 1월 9일
- PDF: PDF 다운로드