Show HN: Airbyte Agents – 跨多个数据源的 agents 上下文

发布: 5天前 (2026年5月5日 GMT+8 23:03)

4 分钟阅读

Source: Hacker News

介绍

我是 Michel，Airbyte（airbyte.com）的联合创始人兼 CEO。经过六年的数据连接器构建，我们推出了 Airbyte Agents（docs.airbyte.com/ai-agents），这是一层统一的数据层，使代理能够在运营系统之间发现信息并采取行动。

快速演示：YouTube 视频

随着代理进入真实工作流，它们需要与众多工具交互（例如 Slack、Salesforce、Linear）。这会产生大量 API 细节工作：身份验证、分页、过滤、模式处理以及跨系统的实体匹配。

大多数托管云平台（MCP）只是 API 的薄包装，因此代理只能使用弱化的原语，且经常出错，尤其是在跨工具工作时。

更深层的问题在于，API 假设你已经知道要查询什么（端点、对象 ID、字段）。而代理通常需要提前一步：它们必须先发现哪些信息是重要的，才能进行推理。

Airbyte Agents 充当 上下文存储，这是一个针对代理搜索优化的数据索引，由我们的复制连接器填充。这为代理提供了一种结构化的方式来发现数据，同时在需要时仍可直接读写上游系统。

这些查询听起来很简单，但当代理不必在运行时自行组装所有上下文时，答案的质量会显著提升。

我构建了一个基准测试框架（公开在 GitHub： airbytehq/airbyte-agents-benchmarks），用于比较调用 Airbyte Agent MCP 与直接调用供应商 MCP 的效果。

指标： 令牌消耗（代理效率的代理指标）。

供应商	与原生 MCP 相比的令牌减少率
Gong	最多减少 80% 令牌
Zendesk	最多减少 90% 令牌
Linear	最多减少 75% 令牌
Salesforce	最多减少 16% 令牌（Salesforce 的 SOQL 本身已很高效）

该基准测试故意简化，使用令牌使用量作为代理达到正确答案的效率代理。

我们仍处于早期开发阶段，部分功能尚不完善，但期待社区的意见：

欢迎尝试基准测试框架，并分享任何想法、评论或改进 Airbyte Agents 的建议。

我们对继续构建充满期待！