Show HN: Airbyte Agents – 다중 데이터 소스에 걸친 에이전트용 컨텍스트

발행: (2026년 5월 6일 AM 12:03 GMT+9)
5 분 소요

Source: Hacker News

소개

저는 Michel이며 Airbyte(airbyte.com)의 공동 창업자이자 CEO입니다. 6년 동안 데이터 커넥터를 구축한 뒤, 이제 Airbyte Agents(docs.airbyte.com/ai-agents)를 출시합니다. 이는 에이전트가 운영 시스템 전반에 걸쳐 정보를 탐색하고 행동을 취할 수 있게 해주는 통합 데이터 레이어입니다.

간단한 시연: YouTube 영상

문제

에이전트가 실제 워크플로우에 들어가면 Slack, Salesforce, Linear 등 다양한 도구와 상호작용해야 합니다. 이때 인증, 페이지네이션, 필터링, 스키마 처리, 시스템 간 엔터티 매칭 등 많은 API 작업이 필요합니다.

대부분의 Managed Cloud Platform(MCP)은 API 위에 얇은 래퍼만 제공하므로, 에이전트는 약한 기본 기능을 물려받아 특히 여러 도구를 넘나들 때 오류가 발생하기 쉽습니다.

더 근본적인 문제는 API가 이미 어떤 엔드포인트, 객체 ID, 필드를 조회할지 알고 있다고 가정한다는 점입니다. 에이전트는 보통 한 단계 앞서서, 먼저 무엇이 중요한지 탐색해야 합니다.

Airbyte Agents: 컨텍스트 레이어

Airbyte Agents는 컨텍스트 스토어 역할을 하며, 복제 커넥터가 채워 넣는 데이터 인덱스를 제공합니다. 이를 통해 에이전트는 구조화된 방식으로 데이터를 탐색하면서도 필요할 경우 상위 시스템에 직접 읽기/쓰기 할 수 있습니다.

왜 중요한가

  • 에이전트가 수행해야 하는 API 호출 수를 줄여줍니다.
  • 사전 인덱싱된 데이터 뷰를 제공해 답변 품질과 속도를 향상시킵니다.
  • 엔터티 매칭 및 스키마 변환을 중앙에서 처리합니다.

사용 사례 예시

  • “이번 달에 마감되는 모든 엔터프라이즈 딜 중 아직 해결되지 않은 지원 티켓을 보여줘.”
  • “GitHub 이슈가 열리지 않은 모든 지원 티켓을 찾아줘.”

이러한 질의는 겉보기엔 간단하지만, 에이전트가 런타임에 모든 컨텍스트를 직접 조합하지 않아도 되므로 답변 품질이 크게 향상됩니다.

벤치마크

GitHub에 공개된 벤치마크 하네스(airbytehq/airbyte-agents-benchmarks)를 사용해 Airbyte Agent MCP 호출과 벤더 MCP를 직접 호출했을 때를 비교했습니다.

측정 지표: 토큰 소비(에이전트 효율성의 대리 지표).

결과

VendorToken reduction vs. native MCP
Gong최대 80% 토큰 감소
Zendesk최대 90% 토큰 감소
Linear최대 75% 토큰 감소
Salesforce최대 16% 토큰 감소 (Salesforce의 SOQL이 이미 효율적)

벤치마크는 의도적으로 단순하게 구성했으며, 토큰 사용량을 에이전트가 올바른 답을 도출하는 효율성의 대리 지표로 활용했습니다.

피드백 요청

우리는 아직 초기 개발 단계이며 일부 부분은 거칠지만, 커뮤니티의 의견을 듣고 싶습니다:

  • 데이터를 미리 인덱싱하고 있나요, 아니면 에이전트가 실시간으로 API를 호출하도록 하고 있나요?
  • 시스템 간 엔터티 매칭을 어떻게 처리하고 있나요?

벤치마크 하네스를 자유롭게 살펴보고, 생각, 의견, 아이디어 등을 공유해 주세요. Airbyte Agents를 계속 발전시켜 나가고 싶습니다!

0 조회
Back to Blog

관련 글

더 보기 »