AI 모델은 단일 공격의 87%를 차단하지만, 공격자가 지속할 때는 단 8%만 차단한다
발행: (2025년 12월 2일 오전 02:00 GMT+9)
1 min read
원문: VentureBeat
Source: VentureBeat
개요
공격적인 프롬프트 하나는 차단되고, 열 개의 프롬프트는 통과됩니다. 이 격차는 벤치마크를 통과하는 것과 실제 공격을 견디는 것 사이의 차이를 정의하며, 대부분의 기업이 존재한다는 사실조차 모르는 격차입니다.
공격자가 단일 악의적인 요청을 보낼 때, 오픈‑웨이트 AI 모델은 우리가…