[Paper] ReusStdFlow:一个用于 Agentic AI 中动态工作流构建的标准化可重用性框架

发布: (2026年2月17日 GMT+8 00:56)
7 分钟阅读
原文: arXiv

Source: arXiv - 2602.14922v1

概述

本文介绍了 ReusStdFlow,一个新框架,旨在解决困扰企业级 Agentic AI 系统的“reusability dilemma”。通过将混乱、平台特定的工作流 DSL 转化为干净、可重用的构件,作者展示了一种能够高保真自动重建复杂自动化流水线的方法——这一进展有望在众多行业中简化 AI 驱动的流程自动化。

关键贡献

  • Extraction‑Storage‑Construction paradigm: 一个三阶段流水线,(1) 从异构 DSL 中提取模块化工作流片段,(2) 将其存储在统一知识库中,(3) 按需重构新工作流。
  • Dual knowledge architecture: 将 graph database(捕获结构/拓扑关系)与 vector database(捕获语义/功能)相结合,实现更丰富、上下文感知的检索。
  • Retrieval‑Augmented Generation (RAG) for workflow assembly: 利用检索到的片段指导语言模型拼接出有效、可执行的工作流。
  • Empirical validation on real‑world data: 在 200 条 n8n 自动化工作流上进行测试,片段提取和端到端工作流重构的准确率均超过 90 %。
  • Open‑ended standardization: 提出一种供应商无关的表示方法,可扩展至其他工作流平台(如 Zapier、Airflow、Prefect)。

方法论

  1. 提取 – 系统解析传入的 DSL 脚本(例如 n8n JSON 定义),并识别可复用的子图,如 API 调用、条件分支和数据转换。这些子图被规范化为 标准片段模式
  2. 存储 – 每个片段进行双重索引:
    • 图存储(例如 Neo4j)记录节点/边关系,保留工作流的拓扑结构。
    • 向量存储(例如 FAISS)对片段的文本描述和代码片段进行嵌入,以实现语义相似性搜索。
  3. 构建 – 当收到新的自动化请求时,检索步骤会基于结构线索(图查询)和功能意图(向量相似度)拉取最相关的片段。随后语言模型(例如 GPT‑4)执行 检索增强生成,在遵循平台特定语法规则的前提下将片段拼接起来。
  4. 评估 – 作者对 200 条 n8n 工作流进行手动整理的真值集,测量了提取的精确率/召回率以及重构的正确性。

结果与发现

指标提取构建
准确率 (top‑1)92 %91 %
精确率94 %90 %
召回率90 %92 %
端到端成功率(工作流运行无错误)88 %
  • 双库检索在重建准确率上比单库基线高约 7 %,验证了结合拓扑和语义的优势。
  • 错误分析显示,大多数失败源于缺乏明确语义注释的模糊 DSL 构造,而非模型幻觉。

Practical Implications

  • 快速自动化原型 – 开发者可以用自然语言描述所需流程,ReusStdFlow 将从现有资产中组装出可直接运行的工作流,从而显著缩短开发时间。
  • 企业知识保留 – 即使原平台已淘汰,仍可收集、标准化并复用旧有自动化脚本,保护宝贵的数字资产。
  • 跨平台可移植性 – 由于片段存储在平台无关的模式中,同一仓库即可为 n8n、Zapier 或自研编排器等工作流生成器提供素材,简化迁移和多云策略。
  • 降低“结构幻觉” – 通过基于检索到的图结构进行生成,系统降低了 AI 模型编造无效工作流步骤的风险,这在当前 AI 辅助编码工具中是常见痛点。
  • 开发者工具 – 该框架可封装为 VS Code 插件或 CLI,提供工作流 DSL 的自动补全和代码片段插入,类似于 LLM 驱动的代码助手在通用编程语言中的工作方式。

限制与未来工作

  • Domain coverage – 评估仅聚焦于 n8n;扩展到其他 DSL 可能需要额外的规范化规则。
  • Semantic ambiguity – 缺乏明确文档的片段仍会导致提取错误;未来工作可以结合程序分析或开发者在环注释来改进标注。
  • Scalability of the graph store – 随着片段库增长到数百万节点,查询延迟可能成为瓶颈;探索更具可扩展性的图数据库或混合索引策略是一个开放的方向。
  • User feedback loop – 将开发者的明确修正反馈回知识库可以进一步提升准确性,并使系统适应不断演进的企业标准。

ReusStdFlow 指向一个未来:AI 驱动的自动化不仅聪明,而且 可复用,将分散的工作流脚本转化为共享的、可搜索的构件库,开发者可以即时重新使用。

作者

  • Gaoyang Zhang
  • Shanghong Zou
  • Yafang Wang
  • He Zhang
  • Ruohua Xu
  • Feng Zhao

论文信息

  • arXiv ID: 2602.14922v1
  • 类别: cs.AI, cs.SE
  • 出版日期: 2026年2月16日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »