Launch HN: Spine Swarm (YC S23) – 시각 캔버스에서 협업하는 AI 에이전트
Source: Hacker News
번역할 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다.
안녕 HN!
우리는 Spine AI의 Ashwin과 Akshay입니다 – https://www.getspine.ai
Spine Swarm이란?
Spine Swarm은 무한 시각 캔버스 위에서 동작하는 멀티‑에이전트 시스템으로, 다음과 같은 복잡하고 코딩이 필요 없는 프로젝트를 완수합니다:
- 경쟁 분석
- 재무 모델링
- SEO 감사
- 피치덱 제작
- 인터랙티브 프로토타입
- …그 외 다수
▶️ 데모 영상: https://youtu.be/R_2-ggpZz0Q
우리 이야기
- 13년 이상 친구 관계 – NTU의 ML 강좌에서 만나 (우리 이름의 영감이 된 “North Spine” 캠퍼스 지역).
- Y Combinator S23을 통과.
- 약 3년 동안 여러 제품 버전을 거쳐 Spine을 반복 개발.
핵심 인사이트
채팅은 복잡한 AI 작업에 적합한 인터페이스가 아니다.
- 채팅은 선형 스레드이지만 실제 프로젝트는 비선형입니다.
- 챗봇에 컨텍스트를 암묵적으로 맡기면 다음이 불가능해집니다:
- 요소들이 어떻게 연결되는지 파악하기.
- 전체를 다시 실행하지 않고 단일 단계만 수정하기.
- 여러 전략을 나란히 탐색하기 위해 분기하기.
우리는 작업 구조가 명시적이고 사용자가 제어할 수 있는 워크스페이스가 필요했습니다. 컨텍스트 창 안에 숨겨져 있지 않아야 했습니다.
Canvas + Blocks 모델
| Concept | Description |
|---|---|
| Infinite visual canvas | 스레드 대신 블록으로 생각하세요. |
| Blocks | AI 모델 위에 추상화된 레이어(LLM 호출, 이미지 생성, 웹 브라우징, 앱, 슬라이드, 스프레드시트 등). |
| Lego‑brick analogy | 각 블록은 특정 작업을 수행하며, 서로 맞물려 무한히 조합될 수 있습니다. |
| Connections | 어떤 블록이든 다른 블록에 연결될 수 있어, 타입에 관계없이 컨텍스트 전달이 보장됩니다. |
| Model‑agnostic | 하나의 워크플로우 안에서 OpenAI LLM, Nano Banana Pro 이미지 생성, Claude 인터랙티브 앱 등 다양한 모델을 혼합 사용할 수 있습니다. |
| Fan‑out | 동일 입력에서 여러 블록이 분기해 다른 모델로 분석하고, 결과를 하위 합성기로 전달할 수 있습니다. |
UI 진화
수동 캔버스 (v1) – 사용자가 프롬프트를 입력하고, 모델을 선택하고, 블록을 실행하고, 연결을 직접 설정합니다.
- 창업자와 제품 매니저에게 인기: 공유된 상위 컨텍스트에서 프로토타입, PRD, 경쟁 분석, 피치덱 등을 쉽게 분기할 수 있음.
채팅 레이어 요청 – 신규 사용자는 블록을 생성·연결해 주는 채팅 인터페이스를 원했습니다.
자율 에이전트 – 채팅 레이어를 구축하면서 에이전트가 시간이 오래 걸리는 자율 워크플로우를 실행하고, 블록에 작업을 위임하며 캔버스에 중간 결과를 저장해 컨텍스트를 깔끔하게 유지한다는 것을 발견했습니다.
현재 작동 방식
- 작업 제출 → 중앙 오케스트레이터가 작업을 하위 작업으로 분해합니다.
- 페르소나 에이전트(하위 작업별 특화)는 캔버스 블록에서 작업합니다:
- 필요에 따라 기본 설정(모델, 프롬프트)을 재정의합니다.
- 각 블록에 가장 적합한 모델을 선택하고, 경우에 따라 같은 블록을 여러 모델로 실행해 비교합니다.
- 병렬 실행 – 독립적인 하위 작업이 동시에 진행되며, 하위 에이전트는 자동으로 상위 컨텍스트를 받습니다.
- 인간‑인‑루프 – 어느 에이전트든 진행 중에 사용자에게 명확화·피드백을 요청하고 멈출 수 있습니다.
- 반복적 정제 – 출력 후, 블록의 일부만 선택해 전체 워크플로우를 다시 실행하지 않고 채팅을 통해 반복할 수 있습니다.
캔버스가 중요한 이유
- 전체 프로젝트를 지속적이고 구조화된 형태로 제공해 어느 에이전트든 언제든 읽고 쓸 수 있습니다.
- 다중 에이전트 파이프라인에서 흔히 발생하는 컨텍스트 손실을 방지합니다(에이전트가 모든 정보를 메모리에 보관할 필요가 없음).
- 에이전트 간 명시적 핸드오프를 가능하게 해 효율성과 감사 가능성을 높입니다.
- Eve
ry step is 완전하게 감사 가능하며, 각 결론에 도달한 과정을 정확히 추적할 수 있습니다.
Benchmarks
| Benchmark | Scope | Result |
|---|---|---|
| DeepMind DeepSearchQA | 17개 분야에 걸친 900개의 질문으로, 각각 인과 관계 단계가 필요합니다. | 87.6 % 정확도, 인간 개입 없이. |
| GAIA Level 3 | 많은 실제 정답 오류를 발견한 이전 벤치마크. | 1.0 % 적중률 (벤치마크 문제를 수정한 후). |
- DeepSearchQA에서는 관련 블록 유형(LLM 호출, 웹 브라우징, 테이블)만 사용하고 인간 명확화를 비활성화하여 에이전트가 완전히 독립적으로 실행되도록 했습니다.
- 감사 가능성 덕분에 이전 GAIA 벤치마크의 실제 오류(잘못되었거나 모호한 정답) 를 발견했으며, 이는 블랙박스 파이프라인에서는 놓치기 쉬운 부분입니다.
전체 방법론, 아키텍처 세부 사항 및 벤치마크 오류 분석은 우리의 글에서 확인할 수 있습니다:
https://blog.getspine.ai/spine-swarm-hits-1-on-gaia-level-3-…
멀티‑에이전트, 캔버스 기반 AI 워크플로우의 한계를 계속해서 확장해 나가게 되어 기쁩니다. 피드백과 질문을 언제든 환영합니다!
Overview
폐쇄형 질문에 대한 정확도를 측정합니다. 같은 아키텍처가 최소한의 감독으로도 프레젠테이션 자료, 보고서, 프로토타입과 같은 개방형 결과물을 더 잘 만들게 된다는 것이 밝혀졌습니다.
우리는 초기 사용자들이 두 그룹으로 나뉘는 것을 보았습니다:
- Live observers – 에이전트가 작업하는 모습을 보고 흐름 중간에 개입하여 방향을 전환합니다.
- Task queue users – 작업을 대기열에 넣고 나중에 완성된 결과물을 확인합니다.
두 접근 방식 모두 캔버스가 작업 전체 흐름을 보존하기 때문에 언제든지 감시하거나 개입할 수 있어 효과적입니다.
빠른 시작 과제
시도해 보기: 시스템에 웹사이트 URL을 제공하고 다음을 요청하세요:
- 전체 SEO 분석
- 경쟁 환경 개요
- 슬라이드 덱이 포함된 우선순위 성장 로드맵
캔버스에서 여러 에이전트가 동시에 실행되는 것을 보게 됩니다.
일반적인 사용 사례
- 재무 모델이 포함된 투자 유치 피치덱
- 스크린샷 및 PRD(제품 요구사항 문서)에서 기능 프로토타이핑
- 경쟁 분석 보고서
- 다양한 관점에서 주제를 연구하고, 추가 탐색이 가능한 구조화된 자료를 생성하는 심층 학습 계획
가격
- 사용량 기반 크레딧은 블록 사용량 및 사용된 기본 모델에 연결됩니다.
- 에이전트는 일반적으로 수동 워크플로보다 더 많은 크레딧을 소비합니다. 이는 최상의 결과를 얻도록 조정되어 있기 때문이며(최적의 블록을 선택하고 더 많은 작업을 수행합니다).
세부 사항:
- 무료 티어 이용 가능.
- 주의: 실제 작업을 시도해볼 수 있도록 무료 티어를 설정했지만 작업마다 복잡도가 다릅니다. 탐색할 충분한 기회를 갖기 전에 크레딧이 소진되면 founders@getspine.ai 로 이메일을 보내 주세요. 함께 해결 방안을 찾아드리겠습니다.
피드백 요청
우리는 여러분의 경험에 대한 피드백을 듣고 싶습니다:
- 무엇이 잘 작동했나요?
- 무엇이 안 되었나요?
- 어디가 부족했나요?
또한 여기서 다른 사람들은 코딩을 넘어 복잡하고 다단계 AI 작업을 어떻게 접근하는지 궁금합니다.
- 어떤 도구를 사용하고 있나요?
- 가장 먼저 무엇이 깨지나요?
우리는 하루 종일 댓글에 있을 예정입니다.
Comments URL:
Points: 8
# Comments: 3