[Paper] 面向专家投资团队：具备细粒度交易任务的多代理 LLM 系统

发布: 3天前 (2026年2月27日 GMT+8 02:37)

8 分钟阅读

原文: arXiv

Source: arXiv - 2602.23330v1

概述

本文介绍了一种 由大型语言模型（LLMs）驱动的多代理交易框架，该框架将投资工作流拆分为一系列 细粒度、定义明确的任务，而不是给每个代理一个模糊的高层指令。该方法在日本股票上进行严格控制的回测，显示出显著更好的风险调整后收益，并提供了更清晰的系统决策原因洞察。

数据摄取 – 系统为每只股票提取四个数据流：
- (a) 历史价格/成交量
- (b) 结构化财务报表字段
- (c) 新闻标题/文章
- (d) 宏观经济指标
任务分解 – 将整体投资决策拆分为离散的提示：
- 基本面分析器：从文件中提取关键比率（例如 ROE、债务权益比）。
- 新闻情感代理：将近期标题分类为正面/负面/中性，并量化情感强度。
- 宏观因子代理：为当前宏观环境（利率、GDP 增长）打分，以评估其对行业的相关性。
- 信号合成器：将前述代理的数值输出结合，使用简单的规则或轻量级机器学习模型生成交易信号（多头/空头/持有）。
LLM 选择与微调 – 每个代理使用最先进的 LLM（如 GPT‑4‑Turbo），并通过领域特定的 few‑shot 示例来引导期望的输出格式。无需完整模型微调，保持管道轻量。
回测框架 – “泄漏控制”拆分确保在时间 t 使用的任何信息严格限制在 t‑1 之前可获得的数据。作者在日本市场的多年数据上进行滚动窗口评估。
组合构建 – 来自多个独立细粒度系统的信号输入均值‑方差优化器，考虑每个系统的预测方差及其与基准指数的相关性。

指标	细粒度多代理	粗粒度基准	简单买入持有
年化回报率	12.4 %	8.1 %	6.3 %
夏普比率	1.45	0.87	0.55
最大回撤	‑9.2 %	‑14.8 %	‑18.5 %
与指数的相关性	0.31	0.58	1.00

模块化设计用于生产: 开发者可以将每个 LLM 代理视为具有明确 API（输入数据 → 结构化输出）的微服务，使系统更易于监控、版本管理和扩展。
透明性与审计: 因为每个子任务都会生成可供人工阅读的产物（例如提取比率的表格），合规团队可以追踪交易生成的原因——这对于“黑箱” AI 交易机器人是一个主要障碍。
快速原型: 无需微调；只需更新提示示例即可替换为更新的 LLM 或添加新数据源，加速迭代周期。
风险管理: 细粒度信号与市场指数的低相关性提供了自然对冲，可在多策略基金中利用，或作为现有系统化投资组合的补充阿尔法来源。
跨市场适用性: 虽然研究聚焦于日本股票，但相同的任务分解（基本面、新闻、宏观）可以干净地映射到其他资产类别（如美国股票、商品、加密货币），使团队能够以最小的改动复用该架构。

提示敏感性： 性能提升依赖于精心设计的提示；论文指出，细微的措辞变化就可能导致显著的输出漂移，这表明需要系统化的提示工程工具。
延迟问题： 每个决策窗口需要多次调用大型语言模型，增加了推理延迟，这在高频策略中可能成为瓶颈。文中未探讨模型蒸馏或缓存中间结果等优化手段。
数据质量与覆盖范围： 本研究使用高质量的日本金融披露和新闻源；将该框架应用于报告结构较为松散的市场可能需要额外的预处理流水线。
未来方向： 作者提出了以下三点设想：(1) 引入强化学习，使 Synthesizer 能随时间自适应子信号的加权；(2) 探索层级化代理结构，让更高层的代理动态分配任务；(3) 与基于原始市场数据训练的端到端 LLM 代理进行基准对比。