AI 모델은 단일 공격의 87%를 차단하지만, 공격자가 지속할 때는 단 8%만 차단한다

발행: 2개월 전 (2025년 12월 2일 오전 02:00 GMT+9)

1 분 소요

Source: VentureBeat

개요

공격적인 프롬프트 하나는 차단되고, 열 개의 프롬프트는 통과됩니다. 이 격차는 벤치마크를 통과하는 것과 실제 공격을 견디는 것 사이의 차이를 정의하며, 대부분의 기업이 존재한다는 사실조차 모르는 격차입니다.

공격자가 단일 악의적인 요청을 보낼 때, 오픈‑웨이트 AI 모델은 우리가…

Accenture와 OpenAI는 기업이 agentic AI 역량을 비즈니스 핵심에 도입하고 새로운 성장 수준을 열 수 있도록 협력하고 있습니다....

OpenAI는 Thrive Holdings에 지분을 인수하여 기업 AI 도입을 가속화하고, 최첨단 연구와 엔지니어링을 회계에 직접 통합합니다.

AI 시스템이 프로덕션에 들어가면서, reliability와 governance는 희망적인 생각에 의존할 수 없습니다. 여기서는 observability가 large language models(LLMs)를 어떻게 전환하는지 설명합니다. https://ve...

최근 몇 년간, 구현 지능 분야에서 Vision-Language-Action (VLA) 모델이 급속히 발전했습니다. 그러나 기존의 적대적 공격 방법은 비용이 많이 듭니다...