Show HN: Airbyte Agents – 다중 데이터 소스에 걸친 에이전트용 컨텍스트
Source: Hacker News
소개
저는 Michel이며 Airbyte(airbyte.com)의 공동 창업자이자 CEO입니다. 6년 동안 데이터 커넥터를 구축한 뒤, 이제 Airbyte Agents(docs.airbyte.com/ai-agents)를 출시합니다. 이는 에이전트가 운영 시스템 전반에 걸쳐 정보를 탐색하고 행동을 취할 수 있게 해주는 통합 데이터 레이어입니다.
간단한 시연: YouTube 영상
문제
에이전트가 실제 워크플로우에 들어가면 Slack, Salesforce, Linear 등 다양한 도구와 상호작용해야 합니다. 이때 인증, 페이지네이션, 필터링, 스키마 처리, 시스템 간 엔터티 매칭 등 많은 API 작업이 필요합니다.
대부분의 Managed Cloud Platform(MCP)은 API 위에 얇은 래퍼만 제공하므로, 에이전트는 약한 기본 기능을 물려받아 특히 여러 도구를 넘나들 때 오류가 발생하기 쉽습니다.
더 근본적인 문제는 API가 이미 어떤 엔드포인트, 객체 ID, 필드를 조회할지 알고 있다고 가정한다는 점입니다. 에이전트는 보통 한 단계 앞서서, 먼저 무엇이 중요한지 탐색해야 합니다.
Airbyte Agents: 컨텍스트 레이어
Airbyte Agents는 컨텍스트 스토어 역할을 하며, 복제 커넥터가 채워 넣는 데이터 인덱스를 제공합니다. 이를 통해 에이전트는 구조화된 방식으로 데이터를 탐색하면서도 필요할 경우 상위 시스템에 직접 읽기/쓰기 할 수 있습니다.
왜 중요한가
- 에이전트가 수행해야 하는 API 호출 수를 줄여줍니다.
- 사전 인덱싱된 데이터 뷰를 제공해 답변 품질과 속도를 향상시킵니다.
- 엔터티 매칭 및 스키마 변환을 중앙에서 처리합니다.
사용 사례 예시
- “이번 달에 마감되는 모든 엔터프라이즈 딜 중 아직 해결되지 않은 지원 티켓을 보여줘.”
- “GitHub 이슈가 열리지 않은 모든 지원 티켓을 찾아줘.”
이러한 질의는 겉보기엔 간단하지만, 에이전트가 런타임에 모든 컨텍스트를 직접 조합하지 않아도 되므로 답변 품질이 크게 향상됩니다.
벤치마크
GitHub에 공개된 벤치마크 하네스(airbytehq/airbyte-agents-benchmarks)를 사용해 Airbyte Agent MCP 호출과 벤더 MCP를 직접 호출했을 때를 비교했습니다.
측정 지표: 토큰 소비(에이전트 효율성의 대리 지표).
결과
| Vendor | Token reduction vs. native MCP |
|---|---|
| Gong | 최대 80% 토큰 감소 |
| Zendesk | 최대 90% 토큰 감소 |
| Linear | 최대 75% 토큰 감소 |
| Salesforce | 최대 16% 토큰 감소 (Salesforce의 SOQL이 이미 효율적) |
벤치마크는 의도적으로 단순하게 구성했으며, 토큰 사용량을 에이전트가 올바른 답을 도출하는 효율성의 대리 지표로 활용했습니다.
피드백 요청
우리는 아직 초기 개발 단계이며 일부 부분은 거칠지만, 커뮤니티의 의견을 듣고 싶습니다:
- 데이터를 미리 인덱싱하고 있나요, 아니면 에이전트가 실시간으로 API를 호출하도록 하고 있나요?
- 시스템 간 엔터티 매칭을 어떻게 처리하고 있나요?
벤치마크 하네스를 자유롭게 살펴보고, 생각, 의견, 아이디어 등을 공유해 주세요. Airbyte Agents를 계속 발전시켜 나가고 싶습니다!