[논문] 정량적 가독성 지표를 활용한 LLM 에이전트 기반 역공학

발행: 5일 전 (2026년 6월 5일 AM 11:24 GMT+9)

3 분 소요

원문: arXiv

Source: arXiv - 2606.06838v1

개요

자동 디컴파일러는 기능적으로는 올바르지만 종종 읽기 어려운 C 코드를 생성합니다. 본 논문은 역공학 워크플로우의 한 단계인, 정량적 메트릭으로 안내된 LLM 에이전트를 활용해 디컴파일된 코드의 가독성을 향상시키는 문제를 다룹니다. 우리는 세 단계에 걸친 연구 진행 과정을 제시합니다. 1단계( Ghidra MCP 를 통한 도구 기반 스티어링)에서는 정량적 가이드가 부족해 커버리지가 불완전하고 개선 효과가 일관되지 못했습니다. 2단계(구조적 유사성 검증만 수행)에서는 에이전트가 메트릭을 의도와 다르게 최적화해 구조적으로 동등하지만 가독성이 떨어지는 코드를 생성함을 확인했습니다. 우리의 주요 공헌은 Quantitative Readability Score (QRS) 프레임워크로, 구조적 유사성 게이트와 세 가지 독립적인 가독성 하위 메트릭( Lexical Surprisal, Structural Simplicity, Idiomatic Quality )을 결합한 복합 메트릭입니다. QRS에 기반한 정제 과정을 통해 LLM 에이전트가 정확성을 손상시키지 않으면서 목표 지향적인 가독성 개선을 수행할 수 있음을 입증합니다. 또한 보다 넓은 역공학 워크플로우(바이너리 리프팅, 디컴파일 정리, 기능 동등성 확보)에 대한 논의를 제공하지만, 이는 본 논문의 범위 밖으로 둡니다.

핵심 기여

본 논문은 다음 분야의 연구를 제시합니다.

cs.SE
cs.AI

방법론

자세한 방법론은 전체 논문을 참고하십시오.

실용적 함의

본 연구는 cs.SE 분야의 발전에 기여합니다.

저자

Neil Archibald
Ruben Thijssen

논문 정보

arXiv ID: 2606.06838v1
Categories: cs.SE, cs.AI
Published: 2026년 6월 5일
PDF: Download PDF

[논문] 정량적 가독성 지표를 활용한 LLM 에이전트 기반 역공학

개요

핵심 기여

방법론

실용적 함의

저자

논문 정보

관련 글

[논문] LLM은 주사위 굴리기에서 얼마나 신뢰할 수 있을까?

[논문] MemDreamer: 계층 그래프 메모리와 에이전트형 검색으로 긴 비디오 이해의 지각·추론 분리

[논문] 작업에 구애받지 않는 지속 학습을 위한 희소 서브스페이스‑전문가 공유

[논문] 강한 볼록 최적화를 위한 가속 분산 확률적 경사 하강법