微软的新型10,000年数据存储介质:玻璃
Source: Hacker News
飞秒激光 在一种非常稳定的介质上刻写数据。
注: 目前,硅石硬件尚未完全准备好商业化。
致谢: 微软研究院
档案存储面临许多挑战。我们需要 极其密集、能够稳定保存数百年甚至更久,并且理想情况下 在未被访问时不消耗任何能量 的介质。已经探索了众多概念——甚至考虑过 DNA——但最简单的方法之一是 将数据刻入玻璃。许多类型的玻璃在物理和化学上都非常稳定,而且在其内部创建微观特征相对容易。
已经有大量的初步工作展示了基于玻璃的存储系统的不同方面。在《自然》周三刊中,微软研究院宣布了 Project Silica,这是一项能够在小玻璃板上读写数据的工作演示,存储密度 超过每立方毫米一千兆位。
“档案存储面临许多挑战。我们希望介质既极其密集,又能在数百年甚至更久的时间内保持稳定,并且理想情况下在未被访问时不消耗任何能量。” – 微软研究院
关于基于 DNA 的存储,参见 Ars Technica 上的文章。
Source: …
在玻璃上写入
玻璃常被认为是易碎的、容易碎裂的,并且(错误地)被视为一种可以在数百年间流动的材料。实际上,玻璃是一大类材料,可以通过许多不同的化学成分进行工程化。通过合适的配方,研究人员已经制造出热稳定且化学稳定的玻璃,能够抵抗湿气渗入、温度波动和电磁干扰。虽然仍需小心操作,但这种玻璃提供了长期数据存储所需的稳定性。
编码数据
- 工作原理 – 通过在玻璃内部聚焦超快激光脉冲来写入数据。激光会产生微观的改性(通常称为“纳米光栅”),从而编码二进制信息。
- 挑战所在 – 传统的激光写入速度慢,因为每个特征必须单独形成。
- 突破 – 飞秒激光(脉冲持续约 10‑15 飞秒)每秒可发射数百万个脉冲,显著缩短写入时间,并且能够紧密聚焦以实现更高的数据密度。
读取数据
有多种方法可以检索存储在玻璃中的信息:
- 光学读取 – 类似于读取光盘,使用低功率激光扫描玻璃并检测折射率的变化。
- 其他感测方法 – 任何能够分辨亚微米特征的技术(例如共聚焦显微镜、干涉测量)都可以使用,尽管速度和成本各有差异。
从理论到实践:Project Silica
在基本概念已经确立的基础上,下一步是将其整合成一个可运行的系统。微软的 Project Silica 通过开发所需的硬件和软件,实现了可靠的写入、存储和检索数据。为了降低风险,团队从两个互补的角度着手,确保最终方案具备冗余性和鲁棒性。
实际系统
两种方法的区别在于单个数据单元(体素)如何写入玻璃。
1. 双折射体素
- 原理 – 折射取决于光子的偏振。
- 过程
- 第一次激光脉冲在玻璃中形成椭圆形空洞。
- 第二次、带偏振的脉冲在该空洞中诱导双折射。
- 编码 – 椭圆的方向决定体素的身份。由于可以分辨多种方向,单个体素可以存储超过一位(bit)。
2. 折射率幅值体素
- 原理 – 通过改变激光脉冲能量来调节折射效应的幅度。
- 编码 – 不同的能量水平产生不同的折射状态,从而在单个体素中存储多个比特。
读取数据
读取使用显微镜检测折射率的细微差异(即 相差显微镜)。显微镜的景深限制了玻璃中可以堆叠的体素层数。制造时将层间距设置得足够大,使得一次只能对焦于单层。
刻在玻璃上的特殊对齐符号让自动系统能够将镜头定位到选定点,然后逐焦平面移动,捕获每一层的图像。
使用 AI 解码
微软训练了一个 卷积神经网络(CNN) 来解释显微镜图像。网络结合了以下信息:
- 对于给定层,完全聚焦的图像,和
- 略微失焦的图像(近焦图像)。
相邻体素会微妙地影响目标体素的外观;CNN 在获得足够的训练数据后学会识别这些效应。
数据编码流水线
- 原始比特流 →
- 使用 低密度奇偶校验(LDPC) 码进行 纠错编码(与 5G 网络使用的相同代码)。
- 符号形成 – 将相邻比特分组为符号,以利用每个体素的多比特容量。
- 写入玻璃 – 使用选定的体素创建方法写入符号流。
示例图像

图:来自 Microsoft Flight Simulator 的地图数据刻在硅酸盐存储介质上。
来源:Microsoft Research
性能
写入仍是瓶颈,因此微软研发了能够同时使用四束激光在单块玻璃板上写入而不产生过多热量的硬件。这使得写入速度达到 66 兆比特 每 秒,团队认为再增加至多十余束激光是可行的。单块玻璃板的存储容量最高可达 4.84 TB(尺寸 12 cm × 12 cm × 0.2 cm)。按当前速度,完整写入一块玻璃板需要 超过 150 小时。
存储系统的 “最高” 容量取决于两种写入方式能够实现的密度:
| 方法 | 数据密度 | 硬件复杂度 | 材料要求 |
|---|---|---|---|
| 基于双折射 | 最高(每体积的体素更多) | 需要更多光学硬件;仅适用于高质量玻璃 | 仅限高质量玻璃 |
| 替代(更简易) | 大约 2 TB 每块板 | 硬件更简化 | 任何透明材料均可使用 |
硼硅酸盐玻璃具有极高的稳定性;微软的加速老化实验表明,这些数据在 室温下可保持超过 10,000 年。因此微软宣称:
“我们的结果表明,Silica 有望成为数字时代的档案存储解决方案。”
这一说法相当宏大。作为对比,平方公里阵列(SKA)望远镜预计每年产生 ≈ 700 PB 的数据,这将需要 > 140,000 块玻璃板。即便配备大量额外激光器,要跟上也需要 > 600 台 Silica 机器 并行运行。尽管如此,Silica 仍具备若干吸引档案存储的优势:
- 零能耗 保存数据。
- 与 DNA 存储等替代方案(可能需要数天)相比,检索速度更快。
- 未来感十足的外观,宛如科幻作品(参见视频 5:02 分钟处:https://youtu.be/V0bUd6KrQGg?t=302)。
参考文献 – Nature,2026。DOI: 10.1038/s41586-025-10042-w
(关于 DOI 的说明:https://arstechnica.com/science/news/2010/03/dois-and-their-discontents-1/)
更正:此处已定义蚀刻的使用方式。
作者
John Timmer 是 Ars Technica 的科学编辑。他拥有哥伦比亚大学的生物化学学士学位以及加州大学伯克利分校的分子与细胞生物学博士学位。闲暇时,他常骑自行车或在风景秀丽的地方徒步。
