[논문] Acoda: LLM 기반 분석 방어를 위한 적대적 코드 난독화

발행: (2026년 6월 10일 PM 04:29 GMT+9)
4 분 소요
원문: arXiv

출처: arXiv - 2606.11755v1

개요

대형 언어 모델(LLM)이 코드 이해, 디버깅, 취약점 탐지 등 소프트웨어 공학(SE) 작업에 널리 활용되면서, 그 강력한 의미 추론 능력이 새로운 보안·프라이버시 위험을 초래하고 있습니다. LLM은 소스 코드 로직을 분석·재구성하거나 역공학까지 수행할 수 있어 지적 재산이 유출될 가능성이 있습니다. 이를 해결하고자 우리는 LLM 기반 코드 분석에 대비하는 유전 알고리즘 기반 적대적 코드 난독화 프레임워크 Acoda를 제안합니다. Acoda는 LLM의 두 가지 핵심 메커니즘인 안전 정렬(safety alignment)과 토큰 기반 정보 처리 방식을 활용해 8가지 의미 보존 난독화 방법을 설계합니다. 유전 알고리즘을 통해 난독화 전략을 반복적으로 최적화함으로써 방어 효과를 극대화하는 적대적 샘플을 생성합니다. 또한 보조 LLM과 네 가지 평가 지표를 결합한 LLM 응답 기반 정량적 평가 프레임워크를 제안해 대상 LLM이 난독화된 코드를 어떻게 분석하는지 종합적으로 평가합니다. 실험 결과, Acoda는 LLM이 코드 분석을 거부하거나 오해하도록 효과적으로 유도함을 확인했습니다. GPT‑4o, DeepSeek, Qwen, Llama, Gemma 등 7개의 최신 LLM에 대해 공격 성공률(ASR)이 최대 70%에 달했으며, 모델 간 전이성도 높고 실행 시간 오버헤드가 최소화되었습니다. 동시에 원본 코드의 의미는 변하지 않도록 보장합니다. 전반적으로 본 연구는 LLM 시대에 코드 보호와 LLM 보안 방어를 위한 새로운 관점을 제시합니다.

주요 기여

본 논문은 다음 분야의 연구를 다룹니다.

  • cs.SE

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.SE 분야의 발전에 기여합니다.

저자

  • Hongzhou Rao
  • Zikan Dong
  • Yanjie Zhao
  • Haodong Li
  • Haoyu Wang

논문 정보

  • arXiv ID: 2606.11755v1
  • 분류: cs.SE
  • 발표일: 2026년 6월 10일
  • PDF: PDF 다운로드
0 조회
Back to Blog

관련 글

더 보기 »