왜 나는 프롬프트 작성을 멈추고 그것들을 수집하기 시작했는가
I’m happy to help translate the article, but I need the actual text you’d like translated. Could you please paste the content you want converted to Korean (excluding the source line you already provided)? Once I have the text, I’ll keep the source link at the top unchanged and translate the rest while preserving the original formatting.
AI와의 모든 상호작용은 제로부터 시작됩니다
새 대화를 열고, 시스템 프롬프트를 붙여넣고, 상황을 설명하고, 유용한 무언가를 중간까지 진행한 뒤, 모델이 방향을 잃는 것을 보고, 컨텍스트 한도에 도달하고, 다시 시작합니다.
한 달 동안 내 사용량을 추적한 결과, ≈ 40 %의 토큰이 컨텍스트를 재구성하는 데 사용되었습니다.
그것은 모델 문제가 아닙니다. 그것은 아키텍처 문제입니다.
우리는 프롬프트를 일회용 메시지처럼 다루고 있지만, 실제로는 소프트웨어처럼 다루어야 합니다.
“프롬프트를 소프트웨어처럼” 실제 의미
프롬프트에 부족한 코드와 같은 특성
| 코드 특징 | 프롬프트 대응 |
|---|---|
| 타입 – 구조 강제 | 없음 |
| 테스트 – 동작 검증 | 없음 |
| 모듈 – 더 큰 시스템으로 구성 | 없음 |
| 오류 처리 – 실패를 조기에 포착 | 없음 |
프롬프트는 텍스트 상자에 붙여넣고 동작하기를 기대하는 단순 문자열에 불과합니다. 출력에 대한 타입 체크도, 테스트 스위트도 없으며, 두 프롬프트를 계약을 맺은 채로 함께 구성할 방법도 없습니다. 출력이 엉망이면 다시 시도하고 토큰을 더 소모하게 됩니다.
Brainboot 소개
나는 그 격차를 메우기 위해 Brainboot을 만들었다. 핵심 원시 요소는 “brain” — 실제 엔지니어링으로 감싸진 프롬프트이다.
Brain의 구조
-
Typed inputs and outputs
- brain은 받아들이고 반환하는 데이터의 형태를 선언한다.
- 런타임은 양쪽 방향을 모두 검증한다.
- 예시: JSON을 요청 → 모델이 Markdown을 반환하면, 런타임이 이를 잡아내고 자동으로 재시도한다. 따라서 다운스트림에서 형식이 잘못된 출력을 처리하느라 토큰을 낭비하지 않는다.
-
Invariants
- 래퍼 레이어에서 매 실행마다 적용되는 규칙(시스템 프롬프트의 지시사항만이 아니다).
- 예시: “플레이스홀더 텍스트를 절대 포함하지 말 것”, “모든 URL은 유효해야 함”, “출력은 유효한 TypeScript여야 함”.
- 모델이 이러한 가드레일을 벗어나지 못한다.
-
Test suites
- 모든 brain은 여러 모델(GPT‑5, Claude Opus, Gemini Ultra)에 대해 실행되는 테스트와 함께 제공된다.
- 통과율은 공개되어 있어, 프로덕션에 사용하기 전에 해당 brain이 신뢰할 수 있는지 확인할 수 있다.
구성은 흥미로워지는 곳
작은 뇌들이 파이프라인으로 연결됩니다:
Research brain → Outline brain → Drafting brain → Quality gate
- 각 뇌는 필요한 컨텍스트만 정확히 받습니다—전체 대화 기록이 아니라.
- 뇌 A의 출력은 타입 검증을 거친 뒤 뇌 B의 입력이 됩니다.
장점
- 토큰 효율성 – 50 K 토큰의 히스토리를 담은 단일 대화는, 각각 ~2–5 K 토큰의 정확히 범위가 지정된 컨텍스트를 사용하는 집중된 뇌들의 체인으로 대체됩니다. 같은 결과를 얻으면서 토큰 비용은 훨씬 적고, 불변 조건이 매 단계에서 오류를 잡아주기 때문에 드리프트가 없습니다.
- 저비용 실패 복구 – 6‑뇌 파이프라인 중 뇌 4가 실패하면, 해당 뇌와 그 입력만 다시 시도하면 됩니다. 단일 대화에서는 어떤 실패든 전체를 다시 시작해야 합니다.
컴파일러
가장 흥미로운 기능은 컴파일러입니다. 원하는 것을 평범한 영어로 설명하면(예: “B2B SaaS를 위한 주간 콘텐츠 파이프라인”) 네 단계 프로세스를 실행합니다.
| 단계 | 수행 내용 |
|---|---|
| 1️⃣ 분해 | 의도를 원자적 역량(키워드 조사, 주제 클러스터링, 개요 생성, 초안 작성, SEO 최적화, 품질 검토)으로 분해합니다. |
| 2️⃣ 매핑 | 각 역량에 맞는 브레인을 찾기 위해 브레인 카탈로그를 검색합니다(예: “키워드 조사 브레인”, “클러스터 아키텍처 브레인”). |
| 3️⃣ 합성 | 매칭된 브레인을 타입이 지정된 연결이 있는 구성 그래프에 연결합니다. 각 브레인의 출력 스키마는 다음 브레인의 입력 스키마와 검증됩니다. |
| 4️⃣ 감사 | 전체 구성을 품질 검사에 통과시켜 A–F 등급을 매기고 배포 권고를 제공합니다. |
출력은 프롬프트가 아니라 배포 가능한 시스템입니다. 한 번 설명하고, 한 번 컴파일하고, 영원히 실행합니다.
Production에서의 모습
1️⃣ Content Empire
- Pipeline: Keyword Research → Cluster Architecture → Outline → Draft → On‑Page SEO → Quality Gate (6 brains).
- 분기당 산출물: 150 SEO‑optimized pages, 13 weekly newsletters, 12 authority essays, 3 full SEO audits, 500+ platform adaptations.
- 비용: $299 / month vs. ≈ $25 K / month for an equivalent human team.
2️⃣ Sales Engine
- Blueprints: Prospecting → Research → Personalized outreach → Reply handling → Pipeline intelligence (5 brains).
- 산출물: 500 qualified prospects per month with individualized research and multi‑step sequences.
- 비용: $399 / month vs. ≈ $6.6 K / month for an SDR.
3️⃣ MLB Prediction Engine (validation case)
- 6‑layer probability engine predicting scoreless innings.
- Running autonomously since opening day.
- Results: 150+ verified picks at 89 % accuracy.
- Public track record: (link omitted for brevity).
스택
- 프론트엔드: Next.js 16 (App Router) + React 19
- 인증 / DB: Supabase (Postgres)
- 배포 및 크론: Vercel
- 청구: Stripe
- 거래 이메일: Resend
- AI 레이어: Vercel AI SDK v6 with AI Gateway (멀티‑모델 라우팅)
Brain runtime은 타입 검증, 불변 조건 강제, 재시도 로직 및 텔레메트리를 처리합니다. 모든 실행은 cognitive trace를 생성하여 어떤 모델, 규칙, 그리고 브레인이 어떤 결정에 기여했는지 보여줍니다.
인프라 비용: ~$50 / month (단독 구축, 자금 없음).
사용해 보기
- 플랫폼:
- 무료 티어: 200개 이상의 선별된 프롬프트, 계정 없이도 이용 가능.
컴파일러, 두뇌, 그리고 회로가 마법이 일어나는 곳입니다.
선언문 (발췌)
“프롬프트는 소프트웨어다.”
전체 선언문은 프롬프트를 코드와 동일한 엄격함—타입이 지정된 인터페이스, 테스트 가능한 단위, 조합 가능한 모듈, 그리고 견고한 오류 처리—으로 다루는 철학을 설명합니다.
(원본 텍스트는 여기서 끊기며, 전체 선언문은 사이트에서 확인할 수 있습니다.)
phy is at .
다른 사람들이 신뢰성 및 토큰 효율성 문제에 어떻게 접근하고 있는지 궁금합니다. 비슷한 것을 구축했거나 다른 방식을 시도한 경우, 진심으로 의견을 듣고 싶습니다.