[논문] 오픈앤트: LLM 기반 코드 분해·적대 검증·동적 테스트로 취약점 탐지
개요
자동 취약점 탐지에서 대규모 코드베이스 다루기는 여전히 도전적이다: 전통적인 정적 분석은 높은 오탐(False Positive)율을 보이며, 퍼징(Fuzzing)과 같은 동적 접근 방식은 상당한 인프라를 필요로 하고 종종 제한된 종류의 버그만 타겟으로 삼는다. 대규모 언어 모델(LLM)의 최근 발전은 프로그램 동작에 대한 의미론적 추론을 가능하게 하지만, LLM을 저장소 규모의 보안 분석에 적용하면 컨텍스트 관리, 비용, 검증과 같은 과제가 발생한다. 우리는 OpenAnt라는 오픈 소스 취약점 탐지 시스템을 제시한다. 이 시스템은 정적 프로그램 분석과 LLM 기반 추론을 결합하여 다단계 파이프라인을 구성한다. OpenAnt는 세 가지 핵심 기술을 도입한다. 첫째, 코드베이스는 외부 진입점으로부터의 가용성(접근 가능성)에 따라 필터링된 자체 포함 분석 단위로 분해된다. 이를 통해 분석 대상을 최대 97% 감소시키면서 공격에 관련 있는 코드는 유지한다. 둘째, 후보 취약점들은 제한된 공격자 시뮬레이션을 통해 적대적 검증을 받는다. 여기서 모델은 현실적인 공격자 역량을 고려하여 탐지 가능성을 평가한다. 셋째, 결과는 동적 검증을 통해 검증된다. 여기서 취약점 환경은 자동으로 생성되고, 샌드박스 컨테이너에서 실행된 뒤 사용 후 폐기한다. OpenSSL, WordPress, Flowise와 같은 널리 사용되는 오픈 소스 프로젝트에 대한 평가는 이 아키텍처가 이전에 알려지지 않은 취약점을 탐지하면서 분석 비용을 관리 가능하게 유지하고, False Positive를 크게 감소시킨다는 것을 보여준다. 우리의 결과는 의미론적 추론과 공격 검증을 결합한 폐쇄형 취약점 탐지 파이프라인이 확장 가능하고 자동화된 보안 분석을 위한 실용적인 경로를 제공한다는 것을 시사한다. OpenAnt는 Apache 2.0 라이선스 하에 GitHub(https://github.com/knostic/OpenAnt)에서 오픈 소스로 공개된다.
주요 기여
본 논문은 다음 분야를 다룬다:
- cs.CR
- cs.LG
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 의미
본 연구는 cs.CR 분야의 발전에 기여한다.
저자
- Nahum Korda
- Gadi Evron
논문 정보
- arXiv ID: 2606.19149v1
- 분야: cs.CR, cs.LG
- 발행일: 2026년 6월 17일
- PDF: 다운로드 PDF