Anthropic 想掌控你的智能体记忆、evals 和编排——这应让企业感到紧张

发布: 3天前 (2026年5月9日 GMT+8 01:51)

5 分钟阅读

Source: VentureBeat

新功能：Dreaming、Outcomes 与多代理编排

Anthropic 为 Claude Managed Agents 增加了三项新特性，这些特性将记忆、评估和多代理编排等基础设施层合并为单一运行时。

这些新增功能旨在让 Claude Managed Agents 中的代理在最少干预的情况下处理更复杂的任务，使该平台直接与 LangGraph、CrewAI、外部评估框架、RAG 记忆架构以及 QA 循环等工具竞争。

企业现在面临一个战略性问题：是否要用“一体化”代理平台取代灵活、模块化的 AI 堆栈？

供应商锁定 – Claude Managed Agents 将上下文、状态和可追溯性集中在一起，这意味着平台能够看到代理的每一次决策。虽然这简化了架构，但也将控制权集中在 Anthropic 生态系统中。
合规性顾虑 – 完全托管的运行时在企业不拥有的基础设施上运行记忆和编排，这可能导致数据驻留和合规性挑战。
已有投资 – 深度参与 AI 转型的组织通常依赖于最佳组件的拼接（例如用于路由的 LangGraph、用于向量存储的 Pinecone、用于评估的 DeepEval）。切换到单体平台并非对所有工作流都容易实现。

大多数企业目前采用的是碎片化的方法：

Anthropic 的新特性旨在取代这一整套：

Dreaming 在会话之间重写记忆，使代理能够从错误中学习，而不再仅依赖静态嵌入和增量状态更新。
Outcomes 将评估标准嵌入编排层，减少对独立质量检查流水线的需求。
Multi‑Agent Orchestration 通过将控制权移至模型层，与 Microsoft、LangChain、CrewAI 等公司的编排框架竞争。

企业必须权衡自身的代理成熟度阶段：

早期实验 – 尚未在生产环境部署大量代理的团队，可能会发现带有 Dreaming 和 Outcomes 功能的 Claude Managed Agents 更易于采用和配置。
高级部署 – 拥有成熟、生产级流水线的组织需要进行更细致的评估，考虑灵活性、供应商锁定和合规性之间的权衡。

即使公司决定不采用 Claude Managed Agents，Anthropic 的路线图也表明其他模型和平台提供商很可能会跟随类似的“一体化”方式。虽然模型本身可能会变得可互换，但工具链和编排基础设施可能会在单一供应商生态系统中日益集中。