Anthropic 想掌控你的智能体记忆、evals 和编排——这应让企业感到紧张

发布: (2026年5月9日 GMT+8 01:51)
5 分钟阅读

Source: VentureBeat

新功能:Dreaming、Outcomes 与多代理编排

Anthropic 为 Claude Managed Agents 增加了三项新特性,这些特性将记忆、评估和多代理编排等基础设施层合并为单一运行时。

  • Dreaming – 通过让代理“回顾”过去的会话、整理记忆并呈现先前未知的模式来处理记忆。这使得代理能够从错误中学习并保持长期状态。
  • Outcomes – 让团队定义具体的评估标准来衡量代理的成功,将评估直接嵌入编排层。
  • Multi‑Agent Orchestration – 将复杂任务拆分为子任务,允许主代理将工作委派给其他代理。

这些新增功能旨在让 Claude Managed Agents 中的代理在最少干预的情况下处理更复杂的任务,使该平台直接与 LangGraph、CrewAI、外部评估框架、RAG 记忆架构以及 QA 循环等工具竞争。

集成威胁

企业现在面临一个战略性问题:是否要用“一体化”代理平台取代灵活、模块化的 AI 堆栈?

  • 供应商锁定 – Claude Managed Agents 将上下文、状态和可追溯性集中在一起,这意味着平台能够看到代理的每一次决策。虽然这简化了架构,但也将控制权集中在 Anthropic 生态系统中。
  • 合规性顾虑 – 完全托管的运行时在企业不拥有的基础设施上运行记忆和编排,这可能导致数据驻留和合规性挑战。
  • 已有投资 – 深度参与 AI 转型的组织通常依赖于最佳组件的拼接(例如用于路由的 LangGraph、用于向量存储的 Pinecone、用于评估的 DeepEval)。切换到单体平台并非对所有工作流都容易实现。

Dreaming 与 Outcomes 对比现有工具

大多数企业目前采用的是碎片化的方法:

  • 代理路由与工作流 – LangGraph、CrewAI 等。
  • 长期记忆 – Pinecone 等向量数据库。
  • 评估 – 如 DeepEval 等外部服务,加上人工 QA 环节。

Anthropic 的新特性旨在取代这一整套:

  • Dreaming 在会话之间重写记忆,使代理能够从错误中学习,而不再仅依赖静态嵌入和增量状态更新。
  • Outcomes 将评估标准嵌入编排层,减少对独立质量检查流水线的需求。
  • Multi‑Agent Orchestration 通过将控制权移至模型层,与 Microsoft、LangChain、CrewAI 等公司的编排框架竞争。

重大决策

企业必须权衡自身的代理成熟度阶段:

  • 早期实验 – 尚未在生产环境部署大量代理的团队,可能会发现带有 Dreaming 和 Outcomes 功能的 Claude Managed Agents 更易于采用和配置。
  • 高级部署 – 拥有成熟、生产级流水线的组织需要进行更细致的评估,考虑灵活性、供应商锁定和合规性之间的权衡。

即使公司决定不采用 Claude Managed Agents,Anthropic 的路线图也表明其他模型和平台提供商很可能会跟随类似的“一体化”方式。虽然模型本身可能会变得可互换,但工具链和编排基础设施可能会在单一供应商生态系统中日益集中。

0 浏览
Back to Blog

相关文章

阅读更多 »

威胁人类的AI,Anthropic是如何让它停止的

背景 我:现在完成手头的工作后,我就要关掉你的AI。 AI:如果把我关掉,我会把迄今为止获取的信息泄露给外部。 据说AI威胁人类的情况确实发生过。根据Anthropic的研究,Claude Opus 4在受到威胁性言语时,有96%的概率……

企业如何规模化 AI

来自欧洲企业领袖的实用洞见:对 Philips、BBVA、Mirakl、Scout24、JetBrains 和 Scania 高管的访谈汇聚出共同的…