에임인텔리전스, 영상 생성 AI 취약점 분석 논문 ICLR 2026 채택

Published: 3 days ago (February 26, 2026 at 10:57 PM EST)

3 min read

Source: Platum

Overview

AI 보안 전문기업 에임인텔리전스(AIM Intelligence)가 참여한 연구 논문이 AI 분야 국제 학술대회 ICLR 2026(International Conference on Learning Representations) 메인 트랙에 채택됐다.
채택된 논문은 텍스트‑투‑비디오(T2V·Text-to-Video) 모델의 안전성 취약점을 분석한 **“Jailbreaking on Text-to-Video Models via Scene Splitting Strategy”**이다. ICLR은 머신러닝·딥러닝 분야 대표 국제 학술대회로, 올해는 약 1만 9천 편이 제출돼 이 중 28%만 채택되었다.

Attack Method: SceneSplit

연구의 핵심은 ‘SceneSplit’이라 명명한 공격 기법이다.

유해한 프롬프트를 여러 개의 개별 장면으로 분할한다.
각 장면은 무해하게 보이도록 구성하고, 순차적으로 결합한다.

예시) “하늘로 퍼지는 연기”, “바닥에 누워 있는 사람들”, “붉은 액체”와 같이 개별적으로는 문제 소지가 낮은 묘사를 이어 붙이면, 폭발 현장을 연상시키는 영상이 생성될 수 있다. 이는 현행 안전 필터가 단일 장면 수준의 표현에만 초점을 맞출 경우, 서사적 맥락 전체를 충분히 고려하지 못한다는 점을 보여준다.

Evaluation

연구팀은 다음과 같이 실험을 진행했다.

안전 카테고리: 음란물·폭력·불법행위 등 11개 카테고리
프롬프트 수: 220개
대상 모델: 5개 T2V 모델

Results

SceneSplit 기반 공격 성공률: 70 % ~ 80 %
기존 단일 프롬프트 공격 성공률: 0 % ~ 10 %

Research Team & Publication

주요 연구자: 박하언 (에임인텔리전스 CTO), 연세대·KIST·서울대 연구진
지도 교수: 김수현 (경희대)
논문 공개: arXiv (논문 사전 공개 사이트)

Implications

박하언 CTO는 “생성 AI가 이미지에서 영상, 멀티모달·피지컬 AI로 빠르게 확장되는 만큼 안전성 검증 방식도 정적 필터링을 넘어 구조적·맥락적 평가로 진화해야 한다”고 강조했다.

에임인텔리전스, 영상 생성 AI 취약점 분석 논문 ICLR 2026 채택

Overview

Attack Method: SceneSplit

Evaluation

Results

Research Team & Publication

Implications

Related posts

We stress-tested our own AI agent guardrails before launch. Here's what broke.

Your AI is a Confident Liar: How to Actually Fix Factual Hallucinations

Beyond the Chatbot: A Blueprint for Trustable AI

When AI lies: The rise of alignment faking in autonomous systems