持续强化 ChatGPT Atlas 对抗提示注入
发布: (2025年12月22日 GMT+8 08:00)
1 min read
原文: OpenAI Blog
Source: OpenAI Blog
OpenAI 加强 ChatGPT Atlas 对提示注入的防御
OpenAI 正在通过使用强化学习训练的自动化红队来加强 ChatGPT Atlas 对提示注入攻击的防御。这种主动的发现‑修补循环有助于及早识别新型漏洞,并在 AI 越来越具代理性时强化浏览器代理的防御能力。