에이전트 스코프 크리프 문제: 제한 없이 성장하는 AI 에이전트가 신뢰성을 잃는 이유
Source: Dev.to
왜 스코프 크리프가 발생하는가
에이전트는 확장이 쉽습니다. 도구를 하나 추가하고, 또 하나, 새로운 SOUL.md 규칙, 더 넓은 미션 선언문을 추가하죠. 각각의 추가는 작게 느껴지지만, 누적되면 우선순위가 충돌하고, 컨텍스트가 오염되며, 명확한 완료 정의가 없는 에이전트가 됩니다.
모든 일을 잘 하려는 에이전트는 보통 아무것도 신뢰성 있게 하지 못합니다.
무엇이 잘못되는가
- 충돌하는 제약 – “도움을 주라”와 “예산을 절약하라”는 과제를 동시에 받은 에이전트는 상황에 따라 하나를 선택하게 되며, 어떤 것이 선택됐는지는 무언가가 깨질 때까지 알 수 없습니다.
- 컨텍스트 오염 – 광범위한 명령은 관련 없는 컨텍스트를 더 많이 로드해, 에이전트가 올바른 결정을 내리는 데 필요한 신호를 희석시킵니다.
- 불명확한 소유권 – 에이전트의 범위가 다른 시스템의 업무와 겹치면 경쟁 상태, 중복 작업, 그리고 조용한 재정의가 발생합니다.
- 유효한 “완료” 상태가 없음 – 에이전트의 업무가 모호하면 완료를 검증할 수 없습니다. 계속 진행하거나 임의로 멈춥니다.
단일 작업 규칙
신뢰할 수 있는 시스템의 모든 에이전트는 하나의 작업만 수행하고 나머지는 모두 넘깁니다.
## My Job
I am the research agent. I find, summarize, and validate information.
I do NOT send emails, update files outside /research/, or make purchases.
When I finish a task, I write output to outbox.json and stop.
마지막 줄이 중요합니다. 명시적인 정지 조건은 무한히 동작하는 에이전트를 예측 가능한 시스템 구성 요소로 바꿔줍니다.
스코프 크리프 감사를 위한 체크리스트
스스로에게 물어보세요:
- 이 에이전트가 하는 일을 한 문장으로 설명할 수 있나요?
- 명시적으로 하지 않는 일을 세 가지 이름 붙일 수 있나요?
- 명확한 출력 형식과 정지 조건이 있나요?
세 가지 모두 답할 수 없다면, 범위가 너무 넓은 것입니다.
해결책으로서의 핸드오프 패턴
하나의 에이전트가 더 많은 일을 하는 대신, 핸드오프 패턴을 사용하세요:
{
"task_complete": true,
"output_location": "/research/summary-2026-03-09.json",
"next_agent": "kai",
"instruction": "Review research summary and update project tracker"
}
각 에이전트는 자신의 한 가지 작업만 수행하고 바통을 넘깁니다. 시스템은 모듈화되고, 감사 가능하며, 수정 가능하게 유지됩니다.
복합적인 이점
에이전트의 범위가 좁을 때:
- 실패가 격리됩니다 (하나의 에이전트가 고장 나도 전체 시스템은 정상)
- 디버깅이 빨라집니다 (정확히 어디를 봐야 할지 알 수 있음)
- 개선이 누적됩니다 (좁은 범위 = 정제 신호가 더 일관되어 학습 효율 상승)
신뢰할 수 있는 다중 에이전트 시스템을 운영하는 팀은 하나의 강력한 에이전트를 사용하지 않습니다; 많은 좁은 에이전트를 사용합니다.
단일 책임 에이전트 설계를 위한 전체 패턴 라이브러리 — SOUL.md 템플릿 및 핸드오프 스키마 포함 — 는 askpatrick.co에서 확인할 수 있습니다.
