Salesforce的Agentforce Vibes 2.0针对一个隐藏的失败:AI代理中的上下文超载
Source: VentureBeat
概览
当创业融资平台 VentureCrowd 开始部署 AI 编码代理时,他们看到了与其他企业相同的收益:在某些项目中,前端开发周期缩短了 90%。
然而,这并非轻而易举,也不是没有大量的试错过程。
VentureCrowd 的第一个挑战围绕数据和上下文质量。VentureCrowd 的首席产品官 Diego Mogollón 在接受 VentureBeat 采访时表示,“代理会依据运行时能够访问的任何数据进行推理”,并且可能会自信地 出错,因为它们的知识仅基于提供给它们的上下文。
“挑战很少是关于编码代理本身的;它们是关于围绕它们的一切。这是一个伪装成 AI 问题的上下文问题,这是我在代理实现中看到的首要失败模式。” – Diego Mogollón
他们的另一个障碍,和许多公司一样,是混乱的数据和不明确的流程。与上下文类似,Mogollón 说,编码代理会放大糟糕的数据,因此公司必须先构建一个结构良好的代码库。
VentureCrowd 的经验说明了 AI 代理开发中的一个更广泛的问题:模型并不是在“失败”代理,而是因为一次性面对过多的上下文和工具而不堪重负。
上下文过多
这源于一种称为 上下文膨胀 的现象。当 AI 系统积累了更多数据、工具或指令时,工作流会变得更加复杂。问题在于,代理需要上下文才能更好地工作,但过多的上下文会产生噪音。更多的上下文意味着更多的 token、性能变慢以及成本更高。
一种抑制上下文膨胀的方法是通过 上下文工程。它帮助代理理解代码更改或拉取请求,并将其与自己的任务对齐。然而,上下文工程往往仍然是一个外部任务,而不是内置于企业用来构建代理的编码平台中。
编码代理提供商的响应方式
VentureCrowd 依赖 Salesforce 的 Agentforce Vibes 来解决上下文膨胀问题。Agentforce Vibes 是一个嵌入 Salesforce 的编码平台,所有计划均可使用,免费层即可使用。
Salesforce 最近将 Agentforce Vibes 更新至 版本 2.0,扩展了对第三方框架(如 ReAct)的支持。对 VentureCrowd 这类公司而言,最重要的是此次更新加入了 Abilities(能力)和 Skills(技能),可用于指导代理的行为。
“作为背景,我们的整个平台,包括前端和后端,都运行在 Salesforce 生态系统上。所以当 Agentforce Vibes 推出时,它自然地融入了我们已经非常熟悉的环境。” – Diego Mogollón
Salesforce 的做法并不是限制代理使用的上下文,而是帮助企业确保上下文保持在其数据模型或代码库之内。Abilities 定义了代理想要完成的目标,Skills 则是实现这些目标的工具。
其他编码代理平台对上下文的管理方式不同。例如:
- Claude Code 和 OpenAI’s Codex 注重自主执行,持续读取文件、运行命令,并随着任务演进而扩展上下文。
- Claude Code 包含一个 context indicator(上下文指示器),当上下文变得过大时会进行压缩。
在这些方法中,一致的模式是大多数系统都会管理代理的增长上下文,而不是限制它们。随着工作流变得更加复杂,控制成本、延迟和可靠性也变得更加困难。
Mogollón 表示,他们选择 Agentforce Vibes 的原因不仅是因为大量数据已经存放在 Salesforce 上——集成更为便捷——还因为它让他们能够更好地控制向代理提供的上下文。
构建者应了解的内容
没有单一的办法可以解决上下文膨胀的问题,但规律很明确:更多的上下文并不总能带来更好的结果。
企业应当:
- 投资于 上下文工程,以结构化并优先排序代理接收的信息。
- 试验适合自身舒适度的 上下文约束策略——决定包含哪些内容,且更重要的是,决定排除哪些内容。
通过审慎管理上下文,组织可以缓解信息过载,降低成本,并提升 AI 编码代理的可靠性。