에임인텔리전스, 영상 생성 AI 취약점 분석 논문 ICLR 2026 채택
Source: Platum

Overview
AI 보안 전문기업 에임인텔리전스(AIM Intelligence)가 참여한 연구 논문이 AI 분야 국제 학술대회 ICLR 2026(International Conference on Learning Representations) 메인 트랙에 채택됐다.
채택된 논문은 텍스트‑투‑비디오(T2V·Text-to-Video) 모델의 안전성 취약점을 분석한 **“Jailbreaking on Text-to-Video Models via Scene Splitting Strategy”**이다. ICLR은 머신러닝·딥러닝 분야 대표 국제 학술대회로, 올해는 약 1만 9천 편이 제출돼 이 중 28%만 채택되었다.
Attack Method: SceneSplit
연구의 핵심은 ‘SceneSplit’이라 명명한 공격 기법이다.
- 유해한 프롬프트를 여러 개의 개별 장면으로 분할한다.
- 각 장면은 무해하게 보이도록 구성하고, 순차적으로 결합한다.
예시) “하늘로 퍼지는 연기”, “바닥에 누워 있는 사람들”, “붉은 액체”와 같이 개별적으로는 문제 소지가 낮은 묘사를 이어 붙이면, 폭발 현장을 연상시키는 영상이 생성될 수 있다. 이는 현행 안전 필터가 단일 장면 수준의 표현에만 초점을 맞출 경우, 서사적 맥락 전체를 충분히 고려하지 못한다는 점을 보여준다.
Evaluation
연구팀은 다음과 같이 실험을 진행했다.
- 안전 카테고리: 음란물·폭력·불법행위 등 11개 카테고리
- 프롬프트 수: 220개
- 대상 모델: 5개 T2V 모델
Results
- SceneSplit 기반 공격 성공률: 70 % ~ 80 %
- 기존 단일 프롬프트 공격 성공률: 0 % ~ 10 %
Research Team & Publication
- 주요 연구자: 박하언 (에임인텔리전스 CTO), 연세대·KIST·서울대 연구진
- 지도 교수: 김수현 (경희대)
- 논문 공개: arXiv (논문 사전 공개 사이트)
Implications
박하언 CTO는 “생성 AI가 이미지에서 영상, 멀티모달·피지컬 AI로 빠르게 확장되는 만큼 안전성 검증 방식도 정적 필터링을 넘어 구조적·맥락적 평가로 진화해야 한다”고 강조했다.