[논문] FusionVul: 소스 코드 취약점 탐지를 위한 다중모달 특징 융합 프레임워크
개요
소스 코드 취약점 탐지는 현대 코드베이스의 규모 증가, 구조적 복잡성, 의미적 다양성 때문에 오랫동안 해결되지 않은 과제로 남아 있습니다. 기존의 정적 분석이나 규칙 기반 접근법은 미묘한 실행 의존성을 포착하지 못하는 경우가 많으며, 단일 모달리티 학습 모델은 소스 코드의 어휘적 표면을 넘어 내재된 중요한 구조 정보를 간과하는 경향이 있습니다. 이질적인 코드 패턴 전반에 걸쳐 견고성을 향상시키기 위해, 우리는 사전 학습된 Transformer 인코더가 추출한 순차적 구문 표현과 그래프 신경망을 통해 전파된 구조적 의미를 통합하는 공동 표현 학습 프레임워크인 FusionVul을 제안합니다. 이 프레임워크는 교차 주의 기반 특징 융합 네트워크를 추가하여 미세한 교차 모달 상호작용을 가능하게 하고, 샘플 인식 가중치 메커니즘을 사용해 여러 예측 브랜치를 통합합니다. 네 개 데이터셋에 대한 실험 결과, FusionVul은 함수 크기 분포가 크게 분산되고 취약점 유형 커버리지가 넓은 SVulD 및 DiverseVul과 같은 데이터셋에서 우수한 F1 점수를 달성했으며, 이는 복잡하고 다양한 취약점 패턴을 포착할 수 있는 능력을 반영합니다.
핵심 기여
이 논문은 다음 분야의 연구를 제시합니다.
- cs.SE
방법론
자세한 방법론은 전체 논문을 참고하십시오.
실용적 시사점
이 연구는 cs.SE 분야의 발전에 기여합니다.
저자
- Hongyu Yang
- Yaping Zhu
- Jingchuan Luo
- Hiroshi Nomaguchi
- Chunhua Su
- Willy Susilo
논문 정보
- arXiv ID: 2606.08553v1
- 분류: cs.SE
- 발행일: 2026년 6월 7일
- PDF: PDF 다운로드