Wipe & Inject 패턴: 긴 계획 세션 후 구현을 위한 전체 컨텍스트

발행: (2025년 12월 11일 오전 08:30 GMT+9)
5 min read
원문: Dev.to

Source: Dev.to

Cover image for The Wipe & Inject Pattern: Full Context for Implementation After Long Planning Sessions

The Wall

Claude Code(또는 다른 에이전시 도구)를 진지하게 개발에 사용한다면 **“The Wall”(벽)**에 부딪힌 적이 있을 겁니다.

Scenario

Phase 1 – Planning

  • 약 45분 동안 아키텍처를 논의합니다.
  • Claude에게 20개의 파일을 읽고, 의존성을 확인하고, 인증 시스템을 계획하도록 요청합니다.
  • Cost: 약 150 k 토큰.
  • Result: 완벽한 계획.

Phase 2 – Implementation

  • 당신이 말합니다: “좋아, 코드를 작성해줘.”
  • Claude가 답합니다: “진행하려면 메모리를 압축해야 합니다.”

The Workaround Everyone Uses

  1. “알겠어, 먼저 계획을 .md 파일에 저장해.”
  2. Claude가 압축합니다(컨텍스트 손실).
  3. “이제 방금 만든 .md 파일을 읽어.”
  4. Claude가 계획에 언급된 파일들을 다시 탐색합니다.
  5. “진행하면서 .md 파일을 업데이트해.”
  6. 컨텍스트가 가득 찰 때마다 2‑5단계를 반복합니다.

The Problem

에이전트가 컨텍스트를 “압축”하면 WHAT(예: “우리는 인증을 구축한다”)는 유지하지만 WHY(예: “XSS 문제 때문에 헤더 대신 쿠키를 선택했다”)는 버립니다.
구현 단계는 저해상도 뷰로 시작되며, 에이전트는 제약 조건을 잊고 질문을 다시 하고, 버그가 있는 코드를 생성합니다.

The Solution – “Wipe & Inject” Pattern

우리는 이것을 매일 Grov를 만들면서 겪었습니다. 이를 해결하기 위해 Planning CLEAR라는 오케스트레이션 흐름을 만들었으며, 이는 “연속 문장” 세션을 “챕터 책” 세션으로 전환합니다.

How It Works (The Logic)

  1. Detect Completion

    • 작은 모델(Claude Haiku)이 세션을 모니터링합니다.
    • Planning에서 Implementation으로 전환을 감지하면 CLEAR 이벤트를 트리거합니다.
  2. Extract the Signal

    • 메모리를 지우기 전에 두 개의 데이터 포인트를 JSON 구조로 추출합니다:
    {
      "key_decisions": [
        "Use Zod for validation"
      ],
      "reasoning_trace": [
        "Because Joi doesn't support type inference"
      ]
    }
  3. The “Wipe” (Reset)

    • messages[] 배열을 완전히 비웁니다.
    • Old Context Usage: 150 k 토큰 → New Context Usage: 0 토큰.
  4. The “Inject”

    • 구조화된 요약을 새로운 세션의 system_prompt에 직접 주입하여 에이전트가 아키텍처 제약을 “전체 기억”하도록 합니다.

The Result

코드를 입력하기 시작하면 마지막 50 k 토큰을 위해 싸우지 않아도 됩니다. 새로 확보된 ~195 k 토큰 창이 생기지만, 에이전트는 여전히 모든 결정과 그 이유를 기억합니다.

Bonus – The “Heartbeat” (Solving the 5‑Minute Timeout)

Anthropic의 프롬프트 캐시는 비활동 상태가 5분이 지나면 만료됩니다. 10분짜리 커피 브레이크는 “웜 캐시”를 죽이고, 다음 프롬프트는 전체 비용이 들며 시간이 더 걸립니다.

The Fix

우리는 Grov에 --extended-cache 플래그를 추가했습니다. 이 플래그는 유휴 상태일 때마다 4분마다 최소 토큰(단일 .)을 API에 전송하는 백그라운드 하트비트를 실행합니다.

  • Cost: 유지 요청당 약 $0.002(대략 4분마다).
  • Value: 세션을 무한히 “핫” 상태로 유지합니다.

Try It Out (Open Source)

우리는 이 워크플로를 Grov, 우리 오픈소스 Claude Code 프록시에 구현했습니다.

  • Repository:
  • Install: npm install -g grov

토큰이 부족하거나 구현 중 컨텍스트를 잃는 것이 지겹다면 한 번 사용해 보고, 이 패턴이 워크플로에 도움이 되는지 알려 주세요!

Back to Blog

관련 글

더 보기 »

컴파일러 엔지니어링 실무

번역할 텍스트를 제공해 주시겠어요? 현재는 URL만 확인할 수 없으니, 번역하고 싶은 내용(요약 또는 발췌)을 직접 입력해 주시면 도와드리겠습니다.