Show HN: Airbyte Agents – 跨多个数据源的 agents 上下文

发布: (2026年5月5日 GMT+8 23:03)
4 分钟阅读

Source: Hacker News

介绍

我是 Michel,Airbyte(airbyte.com)的联合创始人兼 CEO。经过六年的数据连接器构建,我们推出了 Airbyte Agentsdocs.airbyte.com/ai-agents),这是一层统一的数据层,使代理能够在运营系统之间发现信息并采取行动。

快速演示:YouTube 视频

问题

随着代理进入真实工作流,它们需要与众多工具交互(例如 Slack、Salesforce、Linear)。这会产生大量 API 细节工作:身份验证、分页、过滤、模式处理以及跨系统的实体匹配。

大多数托管云平台(MCP)只是 API 的薄包装,因此代理只能使用弱化的原语,且经常出错,尤其是在跨工具工作时。

更深层的问题在于,API 假设你已经知道要查询什么(端点、对象 ID、字段)。而代理通常需要提前一步:它们必须先发现哪些信息是重要的,才能进行推理。

Airbyte Agents:上下文层

Airbyte Agents 充当 上下文存储,这是一个针对代理搜索优化的数据索引,由我们的复制连接器填充。这为代理提供了一种结构化的方式来发现数据,同时在需要时仍可直接读写上游系统。

为什么重要

  • 减少代理必须发出的 API 调用次数。
  • 提供预先索引的数据视图,提高答案质量和响应速度。
  • 在中心位置处理实体匹配和模式转换。

示例用例

  • “显示本月即将成交的所有企业交易以及未解决的支持工单。”
  • “找出所有没有对应 GitHub Issue 的支持工单。”

这些查询听起来很简单,但当代理不必在运行时自行组装所有上下文时,答案的质量会显著提升。

基准测试

我构建了一个基准测试框架(公开在 GitHub: airbytehq/airbyte-agents-benchmarks),用于比较调用 Airbyte Agent MCP 与直接调用供应商 MCP 的效果。

指标: 令牌消耗(代理效率的代理指标)。

结果

供应商与原生 MCP 相比的令牌减少率
Gong最多减少 80% 令牌
Zendesk最多减少 90% 令牌
Linear最多减少 75% 令牌
Salesforce最多减少 16% 令牌(Salesforce 的 SOQL 本身已很高效)

该基准测试故意简化,使用令牌使用量作为代理达到正确答案的效率代理。

征求反馈

我们仍处于早期开发阶段,部分功能尚不完善,但期待社区的意见:

  • 你是提前索引数据,还是让代理实时调用 API?
  • 你是如何在系统之间匹配实体的?

欢迎尝试基准测试框架,并分享任何想法、评论或改进 Airbyte Agents 的建议。

我们对继续构建充满期待!

0 浏览
Back to Blog

相关文章

阅读更多 »