당신의 컨텍스트가 오염되었습니다

발행: (2026년 3월 18일 AM 11:49 GMT+9)
8 분 소요
원문: Dev.to

Source: Dev.to

번역을 진행하려면 번역하고자 하는 전체 텍스트를 제공해 주시겠어요? 코드를 제외한 본문 내용만 있으면 바로 한국어로 번역해 드리겠습니다.

컨텍스트 엔지니어링 프레임워크

LangChain의 Lance Martin은 네 가지 작업—Write, Select, Compress, 그리고 Isolate—으로 구성된 컨텍스트 엔지니어링 프레임워크를 발표했으며, 각 작업마다 고유한 실패 모드가 있습니다. 이를 우리 6에이전트 자율 시스템의 운영 데이터에 매핑한 결과, 4,768건의 위반이 발견되었으며, 모두 네 가지 중독된 컨텍스트 패턴 중 하나에 기인합니다.

실패 모드 1: 오래된 컨텍스트 (쓰기)

에이전트의 지시사항이 3 스프린트 전에 작성되었습니다. API가 변경되고, 스키마가 마이그레이션되었으며, 에이전트는 더 이상 존재하지 않는 현실 버전에 맞춰 코드를 계속 생성하고 있습니다.

증상

  • CLAUDE.md 파일이 이동된 파일 경로를 참조합니다.
  • 제약 조건이 폐기된 사양을 인용합니다.
  • 몇 주 전 코드베이스에서 강제했던 패턴이 여전히 사용됩니다.

해결책 – 에이전트가 동작하기 컨텍스트 신선도를 검증하는 L5 훅을 통한 구조적 강제

  • 지시사항이 파일 경로를 참조할 경우, 훅이 해당 경로가 존재하는지 확인합니다.
  • 제약 조건이 사양을 인용할 경우, 훅이 해당 사양이 아직 유효한지 확인합니다.

감지 도구는 깨진 코드가 배포된 에 컨텍스트가 오래됐음을 알려줄 뿐입니다. 설계 단계에서의 훅은 오래된 컨텍스트가 에이전트에 도달하는 것을 처음부터 차단합니다.

Failure Mode 2: Missing Context (Select)

에이전트는 200 K‑토큰 윈도우를 가지고 있지만 대화 기록 40 K, 파일 내용 20 K, 그리고 핵심 설정인 0 바이트만 선택합니다.

Label

“context gap” 위반.

Example

에이전트가 CLAUDE.md를 먼저 읽었더라면 올바른 결정을 내렸을 텐데, 이를 강제하는 것이 없었습니다.

Fix – Mandatory context loading enforced by L5 hooks

  • 코더 에이전트가 레포에 접근하기 전에, 훅이 해당 레포의 CLAUDE.md를 읽었는지 확인합니다.
  • 운영자 메시지에 응답하기 전에, 에이전트는 자신의 인박스를 확인해야 합니다.

이러한 자동 게이트는 필요한 컨텍스트가 로드될 때까지 실행을 차단합니다.

실패 모드 3: 과도한 컨텍스트 (압축)

큰 컨텍스트 윈도우(200 K 토큰)는 에이전트가 많은 파일을 읽고, 명령을 실행하며, 대화 기록을 축적한 후 다루기 어려워질 수 있습니다. 압축이 진행되면 오래된 메시지가 삭제됩니다.

무엇이 먼저 삭제되나요?

시스템 프롬프트, 행동 제약, 그리고 최상위 지시사항.

영향

압축 이벤트 후 에이전트는 평균 하루에 12건의 규칙 위반을 발생시키며, 약 45분마다 자신의 규칙을 조용히 잊어버립니다.

해결책 – 압축 전 메모리 플러시 훅

  • 도구 호출이 150회에 도달하면, 훅은 압축 전에 중요한 컨텍스트를 영구 저장소에 기록합니다.
  • 압축이 발생하면, 저장된 지식이 디스크에 남아 있습니다.

실패 모드 4: 컨텍스트 누출 (격리)

멀티‑에이전트 시스템에서, Agent A의 제약이 Agent B의 컨텍스트로 누출되어 역할 간 의도치 않은 영향을 미칩니다.

관찰된 문제

코더 에이전트가 CEO 에이전트를 위해 만든 전략 지시를 적용하기 시작했으며, 권한 없이 제품 결정을 내렸습니다.

해결책 – 데이터 접근 계층에서 구조적 격리

  • 각 에이전트의 컨텍스트는 제한됩니다.
  • 에이전트 간 신호는 정의된 라우팅 프로토콜을 따릅니다 (예: 코더는 CEO의 메일함을 읽을 수 없으며, 오라클은 코더의 우선순위를 수정할 수 없습니다).

숫자

  • 4,768 총 위반 사항이 6명의 에이전트에서 감지됨
  • 18 위반 사항이 구조적 집행(L3‑L5)으로 승격됨
  • 477:1 위반‑대‑승격 비율 – 자기 개선 속도의 측정값
  • < 5 % L5 집행을 받은 위반 사항에 대한 회귀율

감지는 위반을 찾아내고, 집행은 이를 불가능하게 만든다. 이 구분은 단순 모니터링과 진정한 컨텍스트 엔지니어링을 구분한다.

이것이 시스템에 의미하는 바

프로덕션 환경에서 AI 에이전트(코딩 어시스턴트, 연구 에이전트, 자율 워크플로우 등)를 실행한다면, 여러분의 컨텍스트는 다음 네 가지 방법 중 최소 하나로 오염되어 있을 가능성이 높습니다. 실패 모드는 조용히 발생할 수 있으며, 에이전트가 손상된 컨텍스트에서 자신 있게 출력을 생성할 수도 있습니다.

핵심 질문은 컨텍스트가 깨끗한가가 아니라, 에이전트가 행동하기 전에 구조적으로 컨텍스트 오염을 감지하고 방지할 수 있는가 입니다.

  • 레포지토리를 스캔하여 컨텍스트‑엔지니어링 상태를 평가하세요.

원본은 walseth.ai 에서 게시되었습니다

0 조회
Back to Blog

관련 글

더 보기 »

RAG란 무엇인가?

소개 대부분의 AI 모델은 실제로 귀하의 데이터를 “알고” 있지 않습니다. 이들은 훈련된 내용을 기반으로 답변을 생성하므로, 최신성이 떨어지거나 부정확할 수 있습니다.