논문 '코드‑아우구르': 사양 추론을 통한 에이전트 취약점 탐지
번역 출처: 출처: arXiv - 2606.18619v1
개요
자율적 취약점 탐지의 출현은 이미 소프트웨어 보안에 대한 전환점이 되고 있다. 완전 자율 LLM 에이전트에 의해 수행되는 감사는 디지털 사회를支撑하는 기본 소프트웨어의 핵심 취약점을 드러내고 있다. 많은 이러한 취약점들은 수년 동안 은폐된 채, 이제 AI 에이전트에 의해 드러나고 있다. 하지만 이러한 발견들의 배경은 충격적으로 투명하고 검증되지 않은 상태이다. 에이전트가 그 함수를 안전하다고 판단했을 때, 함수 입력에 대해 어떤 가정을 했는가? 추론 실패와 잘못된 가정은 취약점을 놓치고 에이전트 분석에 대한 신뢰를 감소시킬 수 있다. 우리는 에이전트의 암묵적 가정을 명시적으로 보안 사양으로 노출하고, 런타임 검증을 통해 지속적으로 이러한 사양을 정교화하는 ‘보안 사양 우선’ 패러다임을 제시한다. 우리의 접근법은 Code‑Augur라는 새로운 에이전트 취약점 탐지 프레임워크를 통해 구현되었다. 주어진 코드베이스에서 Code‑ Augur는 시스템의 각 구성 요소를 분석하여 취약한 코드를 찾는다. 컴포넌트를 안전하다고 판단하면, 그 판단 뒤에 숨은 로컬 불변식을 인‑소스 어서션(in‑source assertions)으로 기록한다. 동시에 Code‑ Augur는 가이드된 펜저(guided fuzzer)를 활용해 해당 가정을 검증하도록 시도한다. 펜저가 어서션을 트리거하면, 이는 진정한 취약점을 밝히거나 사양 오류를 드러내어 정교화할 수 있다. 두 경우 모두 이 과정은 에이전트의 이해를 토대로 삼아 코드 의도와 실제 동작 사이의 차이를 조정한다. 실제 세계 주제에 대해 Code‑ Augur는 보안 사양을 효과적으로 활용해 다른 최신 에이전트보다 더 많은 취약점을 감지한다. 또한 Code‑ Augur는 주요 오픈소스 프로젝트에서 22개의 새로운 취약점을 발견했다. 전문화된 모델인 Claude Mythos와 비교했을 때, Code‑ Augur는 Sonnet 및 DeepSeek과 같은 널리 이용 가능한 LLM을 기반으로 효과적인 에이전트 취약점 탐지를 제공한다.
주요 공헌
본 논문은 다음 분야의 연구를 제시한다:
- cs.CR
- cs.AI
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 영향
이 연구는 cs.CR 분야의 발전에 기여한다.
저자
- 정지웅
- 메하브 자파
- 다일린 울프
- 아비크 로이추다후리
논문 정보
- arXiv ID: 2606.18619v1
- 카테고리: cs.CR, cs.AI, cs.SE
- 발행일: 2026년 6월 17일
- PDF: PDF 다운로드