[Paper] 面向专家投资团队:具备细粒度交易任务的多代理 LLM 系统

发布: (2026年2月27日 GMT+8 02:37)
8 分钟阅读
原文: arXiv

Source: arXiv - 2602.23330v1

概述

本文介绍了一种 由大型语言模型(LLMs)驱动的多代理交易框架,该框架将投资工作流拆分为一系列 细粒度、定义明确的任务,而不是给每个代理一个模糊的高层指令。该方法在日本股票上进行严格控制的回测,显示出显著更好的风险调整后收益,并提供了更清晰的系统决策原因洞察。

关键贡献

  • 任务级分解: 将投资分析形式化为一系列特定子任务的流水线(例如,财报解析、新闻情感提取、宏观因子打分),而不是单一的“分析‑并‑交易”提示。
  • 多代理 LLM 架构: 为每个子任务分配专用的 LLM 代理,实现专精化并便于调试。
  • 泄漏控制回测: 使用真实的数据切片协议,防止未来信息污染训练或推理,确保结果可与实际部署相媲美。
  • 在日本市场的实证验证: 表明细粒度代理在多样化数据集(价格序列、财务报表、新闻、宏观指标)上优于粗粒度基线。
  • 组合层面优化: 结果显示,将多个细粒度系统的输出结合——利用其与市场指数的低相关性——可进一步提升表现。
  • 可解释性洞察: 发现中间分析输出与下游决策偏好之间的一致性是成功的主要驱动因素。

方法论

  1. 数据摄取 – 系统为每只股票提取四个数据流:

    • (a) 历史价格/成交量
    • (b) 结构化财务报表字段
    • (c) 新闻标题/文章
    • (d) 宏观经济指标
  2. 任务分解 – 将整体投资决策拆分为离散的提示:

    • 基本面分析器:从文件中提取关键比率(例如 ROE、债务权益比)。
    • 新闻情感代理:将近期标题分类为正面/负面/中性,并量化情感强度。
    • 宏观因子代理:为当前宏观环境(利率、GDP 增长)打分,以评估其对行业的相关性。
    • 信号合成器:将前述代理的数值输出结合,使用简单的规则或轻量级机器学习模型生成交易信号(多头/空头/持有)。
  3. LLM 选择与微调 – 每个代理使用最先进的 LLM(如 GPT‑4‑Turbo),并通过领域特定的 few‑shot 示例来引导期望的输出格式。无需完整模型微调,保持管道轻量。

  4. 回测框架 – “泄漏控制”拆分确保在时间 t 使用的任何信息严格限制在 t‑1 之前可获得的数据。作者在日本市场的多年数据上进行滚动窗口评估。

  5. 组合构建 – 来自多个独立细粒度系统的信号输入均值‑方差优化器,考虑每个系统的预测方差及其与基准指数的相关性。

结果与发现

指标细粒度多代理粗粒度基准简单买入持有
年化回报率12.4 %8.1 %6.3 %
夏普比率1.450.870.55
最大回撤‑9.2 %‑14.8 %‑18.5 %
与指数的相关性0.310.581.00
  • 细粒度分解相较于粗粒度设置,使夏普比率提升约50 %
  • 中间输出(例如情感评分)最接近最终交易方向,是成功的最强预测因子,证实了整个流水线对齐的重要性。
  • 组合层面的优化通过混合多个细粒度代理,降低整体波动性,并进一步将夏普比率提升至1.62

实际意义

  • 模块化设计用于生产: 开发者可以将每个 LLM 代理视为具有明确 API(输入数据 → 结构化输出)的微服务,使系统更易于监控、版本管理和扩展。
  • 透明性与审计: 因为每个子任务都会生成可供人工阅读的产物(例如提取比率的表格),合规团队可以追踪交易生成的原因——这对于“黑箱” AI 交易机器人是一个主要障碍。
  • 快速原型: 无需微调;只需更新提示示例即可替换为更新的 LLM 或添加新数据源,加速迭代周期。
  • 风险管理: 细粒度信号与市场指数的低相关性提供了自然对冲,可在多策略基金中利用,或作为现有系统化投资组合的补充阿尔法来源。
  • 跨市场适用性: 虽然研究聚焦于日本股票,但相同的任务分解(基本面、新闻、宏观)可以干净地映射到其他资产类别(如美国股票、商品、加密货币),使团队能够以最小的改动复用该架构。

限制与未来工作

  • 提示敏感性: 性能提升依赖于精心设计的提示;论文指出,细微的措辞变化就可能导致显著的输出漂移,这表明需要系统化的提示工程工具。
  • 延迟问题: 每个决策窗口需要多次调用大型语言模型,增加了推理延迟,这在高频策略中可能成为瓶颈。文中未探讨模型蒸馏或缓存中间结果等优化手段。
  • 数据质量与覆盖范围: 本研究使用高质量的日本金融披露和新闻源;将该框架应用于报告结构较为松散的市场可能需要额外的预处理流水线。
  • 未来方向: 作者提出了以下三点设想:(1) 引入强化学习,使 Synthesizer 能随时间自适应子信号的加权;(2) 探索层级化代理结构,让更高层的代理动态分配任务;(3) 与基于原始市场数据训练的端到端 LLM 代理进行基准对比。

作者

  • Kunihiro Miyazaki
  • Takanobu Kawahara
  • Stephen Roberts
  • Stefan Zohren

论文信息

  • arXiv ID: 2602.23330v1
  • 分类: cs.AI, q-fin.TR
  • 出版日期: 2026年2月26日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »