[Paper] 用于多框架通信编码的 Agentic AI 系统

发布: 2个月前 (2025年12月9日 GMT+8 22:46)

7 分钟阅读

原文: arXiv

Source: arXiv - 2512.08659v1

概览

本文提出了 MOSAIC，一种模块化 AI 系统，能够使用多种沟通框架自动标注临床对话。通过在 LangGraph 工作流中串联专门的代理，MOSAIC 在保持对不同医学专科和编码方案的适应性的同时，实现了接近人类的准确度。

计划代理 – 接收用户指定的沟通框架（如 “患者行为”），选择相应的码本，并为下游代理制定逐步工作流程。
更新代理 – 定期刷新临床文献、指南和已标注对话的向量库，确保检索组件始终使用最新证据。
标注代理 – 对对话的每个片段执行 检索增强生成：
- 从向量库检索 top‑k 相关段落。
- 构建包含码本定义和检索片段的 动态少样本提示。
- 使用大语言模型（LLM）为该片段生成标签（或标签集合）。
验证代理 – 对整个转录本进行一致性检查（如不存在冲突标签、遵守码本约束），并将纠正反馈返回给标注代理。

整个流水线由 LangGraph 编排，每个代理被视为有向图中的节点，便于调试、并行执行以及组件的即插即用替换。

消融实验表明，去除任意一个代理都会导致性能下降 3–7 个百分点，验证了计划、最新检索和验证三个环节的必要性。与单任务 LLM 基线相比，MOSAIC 的平均 F1 提升约 0.12。

可扩展标注：健康技术平台可以自动对大量医患对话进行编码，用于质量改进仪表盘、合规监控或研究数据集，而无需雇佣标注团队。
快速适配：想要加入新沟通框架（如共享决策）？只需接入新的码本，计划代理即可生成相应工作流，无需完整模型再训练。
持续学习：更新代理的检索数据库可每日刷新最新临床指南，确保系统与不断演进的最佳实践保持一致。
开发者友好：基于 LangGraph，开发者可以轻松替换底层 LLM（例如从 OpenAI GPT‑4 换成本地部署的 Llama 2）或更换向量库（FAISS、Milvus 等），改动代码极少。
合规与可审计：验证代理提供可追溯的一致性检查，可记录用于合规审计或生成对 AI 决策的可读解释。

核心结论：MOSAIC 证明了基于代理的检索增强方法能够将临床沟通编码质量提升至接近人类水平，为健康技术生态系统提供了可扩展、可适配的 AI 工具。