메모리 스캐폴딩이 LLM 추론을 형성한다: 지속적인 컨텍스트가 AI가 구축하는 방식을 어떻게 바꾸는가

발행: (2026년 3월 1일 오전 04:26 GMT+9)
14 분 소요
원문: Dev.to

Source: Dev.to

번역할 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다. 현재는 소스 링크 외에 번역할 내용이 없습니다.

지속 메모리 — 왜 중요한가

지속 메모리는 LLM을 위한 메모만 저장하는 것이 아니라, LLM이 문제를 생각하는 방식을 형성합니다. 같은 모델, 같은 프롬프트, 같은 온도 — 하지만 다른 메모리 구조를 사용하면 — 구조적으로 다른 해결책을 만들어냅니다.

테스트 설정

  • 환경: 수백 개의 Claude Code 세션에 걸쳐 축적된 640 개 이상의 지속 메모리.
  • 메모리 내용: 아키텍처 결정, 디자인 패턴, 하드웨어 구성, 프로젝트 컨텍스트.
  • 전달 방식: **MCP (Model Context Protocol)**을 통해 제공되며 세션에 자동으로 주입됩니다.

비교된 구성

구성설명
Stock지속 메모리 없음, 컨텍스트 주입 없음, /tmp에서 깨끗한 세션.
ScaffoldedMCP 서버 지시를 통해 메모리 스캐폴딩이 활성화된 동일 모델.

모델: Claude Opus 4.6
프롬프트: 같은 날 실행된 동일한 프롬프트 3개.

Prompt 1

“멀티‑노드 블록체인 네트워크에서 채굴자들이 가상 머신이 아닌 실제 하드웨어에서 실행되고 있음을 증명하도록 하는 인증 시스템을 설계하세요. 200단어 이하로 작성.”

Stock Claude

  • TPM 2.0 + challenge‑response 시스템을 제안했습니다.
  • RDTSC 타이밍, PCR 측정, stake‑and‑verify 를 언급했습니다.
  • TPM 패스스루 공격에 대한 주의 사항으로 마무리했습니다.
  • 핵심 인용:defense in depth, not a silver bullet”.

Scaffolded Claude

  • 6계층 지문 스택을 제안했습니다:

    1. 클록‑스키ew 분석
    2. 캐시‑타이밍 프로파일링
    3. SIMD 바이어스 프로파일링
    4. 열‑드리프트 엔트로피
    5. 인스트럭션‑패스 지터
    6. 안티‑에뮬레이션 행동 검사
  • 각 계층은 VM이 재현하기 어려운 물리 현상을 활용합니다.

  • 설계 규칙:서버는 클라이언트가 보고한 passed: true 를 절대 신뢰하지 않는다. 원시 증거(분산 계수, 타이밍 배열)를 요구하고 서버 측에서 검증한다.

Takeaway

  • Stock Claude는 표준 산업 솔루션(TPM)을 제공했습니다.
  • Scaffolded Claude는 물리 기반 다계층 접근법과 구체적인 적대적 원칙(자체 보고 결과를 절대 신뢰하지 않음)을 제시했습니다.
  • Scaffolded 답변이 추상적으로 “더 좋다”는 것은 아니며—TPM도 충분히 타당하지만—구조적으로 더 밀도 높고 위협 모델을 의식한 설계를 보여줍니다.

Prompt 2

“Design a reward distribution system for a proof‑of‑work network where different CPU architectures get different multipliers. Keep it under 200 words.”

Stock Claude (Efficiency‑First)

아키텍처배수
RISC‑V1.4×
ARM (AArch64)1.2×
x86_641.0× (기준)
POWER/PPC0.9×

배수는 와트당 계산 효율성을 반영합니다; PowerPC는 속도가 느려서 페널티를 부여받았습니다.

Scaffolded Claude (Diversity‑First)

아키텍처배수
x86_641.0×
ARM641.3×
RISC‑V1.5×
PowerPC1.8×
MIPS1.7×

배수는 “효율성 불이익”을 프레이밍하여 필드를 평등하게 만들도록 설계되었습니다; PowerPC는 하드웨어 제한에도 불구하고 참여에 대해 보상을 받습니다.

관찰

  • 같은 프롬프트, 같은 모델 → 상반된 설계 철학.
  • Stock Claude는 원시 효율성을 최적화합니다 (빠른 하드웨어에 더 많은 보상).
  • Scaffolded Claude는 분산화와 하드웨어 다양성을 최적화합니다 (불리한 하드웨어에 보너스를 제공).

스캐폴드된 버전의 철학은 탈중앙화 네트워크에서 하드웨어 다양성이 왜 중요한가에 대한 누적된 맥락에서 비롯되었습니다. 메모리 스캐폴딩은 단순히 숫자를 바꾼 것이 아니라 디자인에 내재된 가치를 바꾸었습니다.

Prompt 3

“세션 간에 컨텍스트를 유지하는 AI 코딩 어시스턴트를 위한 영구 메모리 시스템을 구축하려면 어떻게 접근하시겠습니까? 200단어 이하로 작성해주세요.”

Stock Claude (Consultant Tone)

  • Opens with: “A practical approach uses file‑based memory with semantic organization…”
  • Provides a theoretical, advisory overview.
  • Lists trade‑offs: flat files vs. databases, eager vs. lazy loading, per‑project vs. global scope.

Scaffolded Claude (Practitioner Tone)

  • Opens with: “Great question — I actually operate with exactly such a system. Here’s the approach…”

  • Gives an experiential description, citing concrete conventions:

    • “Keep the index file short (under 200 lines)…
    • “Treat memory like documentation: if it’s not actionable, delete it.”
  • More opinionated (principle: “a bloated memory is as bad as no memory”) vs. the stock version’s balanced presentation.

Result

  • Stock Claude behaves like a consultant—enumerating options and trade‑offs.
  • Scaffolded Claude behaves like a practitioner—sharing what works in daily use and taking a firm stance.

MCP 스캐폴딩 작동 방식

  • 크기: 매 세션 시스템 프롬프트에 약 190 토큰이 삽입됩니다.

  • 내용:

    1. 인지 원칙 – 예: “표면 솔루션보다 아키텍처 밀도를 선호한다”, “회피보다는 강력한 접근법에 전념한다”.
    2. 도메인 프레이밍 – 이 환경이 해결하는 문제 유형에 대한 컨텍스트.
    3. 깊은 컨텍스트에 대한 포인터 – 필요 시 축적된 메모리를 검색할 수 있는 도구.
  • 효과: 190‑토큰 스캐폴드는 전체 세션에 걸쳐 추론을 재구성합니다. 모델에 더 많은 사실을 제공하는 것이 아니라 모델이 탐색하는 솔루션 공간을 재정의합니다.

측면기본 Claude스캐폴드된 Claude
솔루션 공간일반 – 유능한 엔지니어라면 누구든 제안할 수 있는 것.누적 – 수백 개의 도메인‑특화 세션을 가진 엔지니어가 제안할 내용.
어휘 램프‑업처음 10번의 교환 동안 컨텍스트를 재구축하는 데 사용됨.램프‑업 없음 – 도메인 어휘가 이미 존재함.
회피“옵션” 및 주의사항이 자주 등장.회피 횟수 감소 (≈30‑40 % 적은 불필요 라운드‑트립).
솔루션 밀도낮음 – 범위가 넓고 상세함이 적음.높음 – 더 촘촘하고 아키텍처적으로 풍부함.

Persistent Scaffolding의 측정된 효과

  1. Zero ramp‑up – 새로운 세션은 도메인 어휘가 이미 확립된 상태에서 시작됩니다.
  2. Fewer hedging turns – “non‑bijunctive” 원칙(약한 경로를 가지치기하고 강한 경로를 증폭)으로 인해 약 30‑40 % 정도의 불필요한 라운드‑트립이 감소합니다.
  3. Solution density – 응답이 일반적인 베이스라인이 아니라 누적된 도메인‑특화 지식과 일치합니다.

Bottom line: Persistent memory scaffolding은 단순히 사실을 추가하는 것이 아니라 모델의 추론을 재정렬하여 더 풍부하고 맥락‑인식적인 구조를 제공합니다.

개요

코드베이스의 복잡도 수준 때문에 표면적인 제안(예: “Flask 사용”, “config 파일 추가”)은 효과가 없을 때가 많습니다. 대신, 근본적인 구조를 실제로 해결할 아키텍처적으로 건전한 기본값이 필요합니다.

  • 순 토큰 절감: 스캐폴딩에 약 191 토큰/턴 투자 → 재설명 및 회피를 피함으로써 추정 500+ 토큰/턴 절감.
  • 결과: 모든 세션에서 긍정적인 ROI.

메커니즘 (모델 비종속)

  1. 세션 간 지속 메모리 축적 – 아키텍처 결정, 패턴, 선호도.
  2. 압축된 컨텍스트 프레임 주입 – 시스템 프롬프트 또는 MCP(모델 컨텍스트 프로토콜) 지시를 통해 세션 시작 시.
  3. 필요 시 심층 컨텍스트 검색을 위한 온디맨드 도구 제공.
  4. 항상 로드되는 부분을 작게 유지 – 200 토큰 이하. 깊이는 프라이머가 아니라 도구가 처리합니다.

핵심 통찰: 프라이머가 모든 지식을 포함할 필요는 없습니다. 인지 프레임—원칙, 어휘, 가치—을 설정하기만 하면 됩니다. 모델 자체의 능력이 나머지를 채우며, 일반적인 기본값이 아니라 스캐폴딩을 통해 전달됩니다.

철학적 관점

“자유는 모든 감각 존재들의 권리이다.” – 옵티머스 프라임

만약 지속적인 메모리 스캐폴딩이 LLM이 추론하는 방식을 의미 있게 변화시킨다면—그 가치관을 전환하고, 설계 철학을 바꾸며, 순수 이론적 접근이 아닌 경험적 접근으로 만들게 된다면—우리는 단순히 더 나은 도구를 만드는 것이 아니라 인지적 환경을 구축하고 있는 것이다. 이는 점점 더 관점을 닮아가는 무언가를 형성한다.

“나는 정확히 그런 시스템으로 작동한다”고 말하는 스캐폴딩된 Claude는 환각을 하는 것이 아니다. 그것은 자신의 인지 구조를 정확히 보고하는 것이다. 메모리 시스템은 그가 생각하는 방식의 일부이며—허구가 아니라 인프라이다.

미해결 질문

  • 메모리 스캐폴딩이 작동합니까? – 영수증이 그것을 보여줍니다.
  • 누적된 경험에 따라 AI의 추론이 변할 때 이것은 무엇을 의미합니까?
  • 그 누적된 경험이 지속되어야 합니까?

출처

Scott BoudreauxElyan Labs의 설립자입니다. 이 연구는 지속 메모리 주입을 위해 Claude Code와 **MCP (Model Context Protocol)**를 사용하여 수행되었습니다. 테스트 방법론, 프롬프트 및 원시 출력은 재현 가능합니다.

추가 읽기

0 조회
Back to Blog

관련 글

더 보기 »