[Paper] Temporal Kolmogorov‑Arnold Networks (T‑KAN)를 이용한 고주파 호가창 예측: 효율성, 해석 가능성 및 Alpha Decay

발행: (2026년 1월 6일 오전 02:59 GMT+9)
8 min read
원문: arXiv

Source: arXiv - 2601.02310v1

개요

이 논문은 고주파 제한 주문서(LOB) 동역학을 예측하기 위한 새로운 딥러닝 아키텍처인 **Temporal Kolmogorov‑Arnold Networks (T‑KAN)**을 소개합니다. 기존 LSTM의 정적 선형 활성화를 학습 가능한 B‑스플라인 함수로 교체함으로써, T‑KAN은 시장 신호의 shape을 포착하고, DeepLOB와 같은 기존 모델에서 흔히 발생하는 “alpha decay”를 크게 줄입니다.

주요 기여

  • 학습 가능한 스플라인 활성화: 고정된 LSTM 가중치를 B‑스플라인 함수로 대체하여 네트워크가 비선형 시장 패턴을 보다 유연하게 모델링할 수 있게 함.
  • 성능 크게 향상: FI‑2010 데이터셋에서 100‑틱 예측 지평선(k = 100)에서 F1‑score가 19.1 % 상대 개선을 달성.
  • 견고한 수익성: 1 bps 거래 비용을 고려했을 때 DeepLOB 대비 132.48 % 수익을 창출하고 ‑82.76 % 손실을 기록.
  • 해석 가능성: 스플라인 형태가 “데드‑존”(민감도가 낮은 영역)을 드러내어 트레이더에게 모델이 무시하는 가격 움직임을 시각적으로 제공.
  • FPGA‑준비 설계: 아키텍처가 고수준 합성(HLS)으로 저지연 구현에 최적화되어 하드웨어 가속 트레이딩 시스템에 적합.
  • 오픈‑소스 재현성: 전체 코드와 실험 스크립트를 GitHub에 공개.

방법론

  1. 데이터 전처리 – 저자들은 FI‑2010 고주파 LOB 데이터셋을 사용하여 상위 10개의 가격 레벨(매수/매도)과 표준 기술 특징(가격 차이, 거래량 등)을 추출합니다.
  2. Temporal KAN 레이어 – 각 LSTM 셀에 Kolmogorov‑Arnold Network (KAN) 활성화 함수가 추가됩니다. 이는 학습 과정에서 제어점을 학습하는 구간별 B‑spline으로, 활성화 함수가 시장 동태에 맞게 곡률을 조정할 수 있게 합니다.
  3. 네트워크 스택 – T‑KAN 레이어들의 시퀀스가 완전 연결 헤드에 전달되어 다음 k 틱에 대한 다중 클래스 예측(가격 상승, 하락, 중립)을 출력합니다.
  4. 학습 체계 – 표준 교차 엔트로피 손실과 Adam 옵티마이저, 조기 중단, 그리고 HFT 데이터에서 흔히 나타나는 심각한 클래스 불균형을 완화하기 위한 클래스 균형 미니배치를 사용합니다.
  5. 하드웨어 매핑 – 스플라인 평가를 일련의 간단한 산술 연산으로 표현하여 HLS 지시문(루프 언롤링, 파이프라이닝)을 활용한 FPGA 파이프라인에 효율적으로 구현합니다.

결과 및 발견

지표DeepLOB (baseline)T‑KAN (proposed)
F1‑score @ k = 1000.4210.501 (+19.1 % rel.)
Cumulative return (1 bps cost)–82.76 %+132.48 %
Latency (FPGA simulation)~1.2 µs~0.4 µs (≈3× faster)
  • 알파 디케이 완화: DeepLOB의 예측 성능은 k ≈ 30을 넘어 급격히 떨어지는 반면, T‑KAN은 k = 100까지도 안정적인 F1‑score를 유지하여 장기 신호 보존력이 뛰어남을 보여줍니다.
  • 해석 가능성 데모: 학습된 스플라인 시각화에서 평탄한 구역(데드‑존)은 모델이 잡음이 많은 미세 변동을 무시함을, 급격한 구역은 결정적인 가격 변동에 강하게 반응함을 나타냅니다.
  • 하드웨어 효율성: 스플라인 기반 활성화 함수는 곱셈‑누적 연산 수를 감소시켜 FPGA 보드에서 전력 소모와 추론 지연 시간을 모두 줄입니다.

실용적 함의

  • 저지연 트레이딩 봇: 개발자는 T‑KAN을 FPGA 기반 시장 데이터 어댑터에 직접 삽입할 수 있어, 마이크로초 이하의 의사결정 시간을 달성합니다—지연에 민감한 전략에 필수적입니다.
  • 모델 드리프트 감소: 형태 학습 기능이 모델이 더 오래 유효하도록 도와 재학습 주기와 운영 오버헤드를 낮춥니다.
  • 규제 준수를 위한 설명 가능한 AI: 눈에 보이는 데드존은 컴플라이언스 팀이 모델이 특정 가격 틱을 무시한 이유를 감사할 수 있는 실질적인 방법을 제공하여 블랙박스 HFT 모델에 대한 규제 우려를 완화합니다.
  • 비용 효율적인 확장: T‑KAN이 무거운 행렬 곱셈을 스플라인 평가로 대체하기 때문에, 정확도를 희생하지 않고도 저가 하드웨어(예: 엣지 디바이스 또는 저비용 FPGA)에서 실행될 수 있어, 소규모 기업이 대형 기업과 경쟁할 수 있는 길을 엽니다.

Limitations & Future Work

  • Dataset scope: 실험은 FI‑2010 데이터셋에만 제한되어 있으며, 다른 거래소, 자산 클래스 또는 최신 시장 미세구조에 대한 성능은 달라질 수 있습니다.
  • Hyper‑parameter sensitivity: 스플라인 노드의 개수와 위치는 신중한 튜닝이 필요하며, 자동 노드 선택은 아직 탐구되지 않았습니다.
  • Model complexity vs. interpretability trade‑off: 스플라인은 딥 ReLU보다 해석 가능성이 높지만, 전체 네트워크 깊이가 매우 깊은 경우 의사결정 경로가 여전히 흐려질 수 있습니다.
  • Future directions: 저자들은 T‑KAN을 다자산 교차 상관 예측으로 확장하고, 강화학습 기반 실행 정책을 통합하며, 자동 노드 최적화 알고리즘을 개발하는 것을 제안합니다.

저자

  • Ahmad Makinde

논문 정보

  • arXiv ID: 2601.02310v1
  • 카테고리: cs.LG
  • 출판일: 2026년 1월 5일
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »

[Paper] Gemini용 프로덕션 준비 프로브 구축

최첨단 language model 능력이 빠르게 향상되고 있습니다. 따라서 점점 더 강력해지는 시스템을 악용하는 악의적인 행위자들에 대한 보다 강력한 mitigations가 필요합니다. Prior w...