AI 모델은 단일 공격의 87%를 차단하지만, 공격자가 지속할 때는 단 8%만 차단한다

발행: (2025년 12월 2일 오전 02:00 GMT+9)
1 min read

Source: VentureBeat

개요

공격적인 프롬프트 하나는 차단되고, 열 개의 프롬프트는 통과됩니다. 이 격차는 벤치마크를 통과하는 것과 실제 공격을 견디는 것 사이의 차이를 정의하며, 대부분의 기업이 존재한다는 사실조차 모르는 격차입니다.

공격자가 단일 악의적인 요청을 보낼 때, 오픈‑웨이트 AI 모델은 우리가…

Back to Blog

관련 글

더 보기 »

시를 통한 프롬프트 인젝션

번역할 텍스트를 제공해 주시겠어요? 현재는 링크만 확인할 수 없어 내용을 알 수 없습니다. 번역이 필요한 문장을 알려주시면 바로 한국어로 번역해 드리겠습니다.