Anthropic 的 Mythos 对网络安全未来的意义
Source: Schneier on Security
请提供您希望翻译的具体文本内容,我将按照要求进行简体中文翻译并保留原有的格式。
两周前,Anthropic 宣布其新模型 Claude Mythos Preview 能够自主发现并武器化软件漏洞,将其转化为可运行的利用代码,无需专家指导。
这些漏洞出现在关键软件中,如操作系统和互联网基础设施,而数千名致力于这些系统的软件开发者未能发现。此能力将带来重大的安全影响,危及我们日常使用的设备和服务。因此,Anthropic 并未向公众发布该模型,而是仅向少数公司提供。
此消息在网络安全社区掀起了巨大的波澜。Anthropic 的公告细节寥寥,令许多观察者感到愤怒。有人猜测 Anthropic 并没有足够的 GPU 来运行该模型,所谓的网络安全只是限制发布的借口。也有人认为 Anthropic 正在坚持其 AI 安全使命。舆论中充斥着炒作与反炒作、现实与营销。即便是专家,也很难理清其中的纷繁信息。
我们将 Mythos 视为一次真实但渐进的进步,是一系列渐进步骤中的一环。但即使是渐进的步骤,在宏观视角下也可能具有重要意义。
AI 如何改变网络安全
我们已经写过“基线漂移综合征”,这是一种现象,会导致公众和专家忽视隐藏在渐进步骤中的巨大长期变化。它在在线隐私领域已经出现,现在也在 AI 领域出现。即使 Mythos 发现的漏洞本可以用上个月或去年的 AI 模型找到,它们也不可能被五年前的 AI 模型发现。
Mythos 的公告提醒我们,AI 在短短几年内已经取得了长足进步:基线真的已经改变。寻找源代码中的漏洞正是当今大型语言模型擅长的任务。无论是去年发生的,还是明年将要发生的,这类能力的到来已经显而易见。问题在于我们如何适应它。
我们并不认为能够自主进行黑客攻击的 AI 会在进攻与防御之间产生永久的不对称;实际情况可能更为微妙。
- 某些漏洞可以被自动发现、验证并修补。
- 某些漏洞难以发现,但验证和修补却相对容易——比如基于标准软件栈构建的通用云托管 Web 应用,其更新可以快速部署。
- 还有一些漏洞容易被发现(即使没有强大的 AI),验证也相对容易,但修补困难或不可能,例如很少更新或难以改动的物联网设备和工业设备。
此外,还有一些系统的漏洞在代码中容易发现,却在实际中难以验证。例如,复杂的分布式系统和云平台可能由成千上万相互并行运行的服务组成,这使得区分真实漏洞与误报、以及可靠复现漏洞变得困难。
保护系统的分类法
- 不可修补或难以验证的系统 应通过更严格、受控的层进行包装来保护。你希望冰箱、恒温器或工业控制系统位于受限且持续更新的防火墙后面,而不是自由地与互联网通信。
- 根本互联的分布式系统 应该是可追踪的,并遵循最小特权原则,即每个组件只拥有其所需的访问权限。这些是标准的安全理念,在 AI 时代我们可能曾想抛弃它们,但它们依然极其重要。
重新思考软件安全实践
这也凸显了软件工程最佳实践的重要性。自动化、彻底且持续的测试一直很重要。现在我们可以更进一步,使用防御性 AI 代理 对真实堆栈进行 漏洞测试,反复进行,直到剔除误报并确认真实漏洞及其修复。这种 VulnOps 很可能成为开发过程的标准组成部分。
- 文档变得更有价值,因为它可以像指导开发者一样,引导 AI 代理执行寻找 bug 的任务。
- 遵循标准实践并使用标准工具和库,使 AI 和工程师都能更有效地识别模式,即使在充斥着个体化、短暂 即时软件 的世界中也是如此。
[What Anthropic’s “Mythos” Means for the Future of Cybersecurity](https://www.schneier.com/blog/archives/2026/04/what-anthropics-mythos-means-for-the-future-of-cybersecurity.html) — code that can be generated and deployed on demand.
Will this favor [offense or defense](https://www.schneier.com/essays/archives/2018/03/artificial_intellige.html)? The defense eventually, probably, especially in systems that are easy to patch and verify. Fortunately, that includes our phones, web browsers, and major internet services. But today’s cars, electrical transformers, fridges, and lampposts are connected to the internet. Legacy banking and airline systems are networked.
Not all of those are going to get patched as fast as needed, and we may see a few years of constant hacks until we arrive at a new normal: where verification is paramount and software is patched continuously.
本文与 Barath Raghavan 合著,最初发表于 IEEE Spectrum。
标签:
AI •
cybersecurity •
LLM •
patching •
vulnerabilities
发表于 2026 年 4 月 28 日上午 7:06 – 查看帖子 • 1 条评论
侧栏照片:Bruce Schneier,由 Joe MacInnis 拍摄。