마이크로소프트의 새로운 10천년 데이터 저장 매체: 유리

발행: (2026년 2월 20일 오후 12:57 GMT+9)
14 분 소요

Source: Hacker News

펨토초 레이저가 매우 안정적인 매체에 데이터를 새깁니다.
참고: 현재 실리카 하드웨어는 상용화 단계에 아직 도달하지 못했습니다.
출처: Microsoft Research

아카이브 저장은 많은 도전을 안겨줍니다. 우리는 극도로 고밀도이며 수세기 이상 안정적이고, 이상적으로는 접근되지 않을 때 전력을 전혀 소비하지 않는 매체가 필요합니다. 수많은 개념이 탐구되어 왔으며—DNA도 고려된 바 있습니다—그 중 가장 단순한 접근법 중 하나는 데이터를 유리 안에 새기는 것입니다. 많은 종류의 유리는 물리적·화학적으로 안정적이며, 그 안에 미세한 구조를 만드는 것이 비교적 쉽습니다.

유리 기반 저장 시스템의 다양한 측면을 보여주는 예비 연구가 많이 진행되었습니다. Nature 수요일 호에서 Microsoft Research는 Project Silica를 발표했으며, 이는 작은 유리 슬래브에 ㎣당 1기가비트 이상의 밀도로 데이터를 읽고 쓸 수 있는 작동 시연을 보여줍니다.

“아카이브 저장은 많은 도전을 안겨줍니다. 우리는 극도로 고밀도이고 수세기 이상 안정적이며, 이상적으로는 접근되지 않을 때 전력을 전혀 소비하지 않는 매체를 원합니다.” – Microsoft Research

DNA 기반 저장에 대한 자세한 내용은 Ars Technica 기사에서 확인하세요.

Source:

유리 위에 쓰기

유리는 종종 깨지기 쉬우며 파손되기 쉽고, (잘못된 생각으로) 수세기에 걸쳐 흐를 수 있는 물질로 여겨집니다. 실제로 유리는 다양한 화학 조성으로 설계할 수 있는 광범위한 재료군입니다. 적절한 조성을 사용하면 연구자들은 열 및 화학적으로 안정하고, 수분 침투, 온도 변화, 전자기 간섭에 저항하는 유리를 만들었습니다. 여전히 조심스러운 취급이 필요하지만, 이러한 유리는 장기 데이터 저장에 필요한 안정성을 제공합니다.

데이터 인코딩

  • 작동 원리 – 데이터는 초고속 레이저 펄스를 유리 내부에 집중시켜 기록합니다. 레이저는 미세한 변형(종종 “나노그레이팅”이라고 함)을 생성하여 이진 정보를 인코딩합니다.
  • 어려운 점 – 기존 레이저 기록은 각 특징을 개별적으로 형성해야 하므로 속도가 느립니다.
  • 돌파구 – 펨토초 레이저(펄스 지속시간이 ~10‑15 펨토초)로 초당 수백만 펄스를 발사할 수 있습니다. 이는 기록 시간을 크게 단축하고 레이저를 매우 정밀하게 초점 맞출 수 있게 하여 데이터 밀도를 높입니다.

데이터 읽기

유리 안에 저장된 정보를 추출할 수 있는 여러 접근 방식이 있습니다:

  1. 광학 판독 – 광디스크를 읽는 방식과 유사하게, 저출력 레이저가 유리를 스캔하면서 굴절률 변화를 감지합니다.
  2. 기타 센싱 방법 – 아광학 현미경, 인터페로메트리 등 서‑마이크론 수준의 특징을 해상할 수 있는 모든 기술을 사용할 수 있지만, 속도와 비용은 다양합니다.

이론에서 실천으로: Project Silica

기본 개념이 정립된 후, 다음 단계는 이를 실용적인 시스템으로 통합하는 것이었습니다. 마이크로소프트의 Project Silica는 데이터를 신뢰성 있게 기록, 저장, 복구하기 위한 하드웨어와 소프트웨어를 모두 개발함으로써 이 문제에 접근했습니다. 위험을 최소화하기 위해 팀은 두 가지 보완적인 관점에서 문제를 해결했으며, 최종 솔루션의 중복성과 견고함을 확보했습니다.

Source:

실제 시스템

두 접근 방식의 차이는 개별 데이터 단위(voxel)가 유리(유리) 안에 어떻게 기록되는가에 달려 있습니다.

1. 복굴절 기반 voxel

  • 원리 – 굴절은 광자 편광에 따라 달라집니다.
  • 과정
    1. 첫 번째 레이저 펄스가 타원형의 빈 공간(void)을 생성합니다.
    2. 두 번째, 편광된 펄스가 그 빈 공간에 복굴절을 유도합니다.
  • 인코딩 – 타원의 방향이 voxel의 정체성을 정의합니다. 여러 방향을 구분할 수 있기 때문에 하나의 voxel당 하나 이상의 비트를 저장할 수 있습니다.

2. 굴절률 크기 기반 voxel

  • 원리 – 레이저 펄스 에너지를 변화시켜 굴절 효과의 크기를 조절합니다.
  • 인코딩 – 서로 다른 에너지 레벨이 서로 다른 굴절 상태를 만들며, 이를 통해 하나의 voxel에 여러 비트를 저장할 수 있습니다.

데이터 읽기

읽기는 미세한 굴절률 차이를 감지하는 현미경, 즉 위상대비 현미경(phase‑contrast microscopy) 으로 수행됩니다. 현미경의 심도(depth of field) 때문에 유리 조각에 겹쳐 넣을 수 있는 voxel 층 수가 제한됩니다. 제작 시 각 층은 충분히 떨어져 있어 한 번에 하나의 층만 초점이 맞게 됩니다.

유리에 새겨진 특수 정렬 기호가 자동 시스템이 렌즈를 원하는 지점에 위치시키고, 초점면을 단계별로 이동시켜 각 층의 이미지를 캡처하도록 도와줍니다.

AI를 이용한 디코딩

Microsoft는 현미경 이미지 해석을 위해 합성곱 신경망(CNN) 을 훈련시켰습니다. 네트워크는 다음 정보를 결합합니다.

  • 해당 층에 정확히 초점이 맞는 이미지, 그리고
  • 약간 초점이 벗어난 이미지(near‑focus).

인접한 voxel은 미세하게 대상 voxel의 외관에 영향을 줍니다; 충분한 학습 데이터를 제공하면 CNN이 이러한 효과를 인식하도록 배울 수 있습니다.

데이터 인코딩 파이프라인

  1. 원시 비트스트림
  2. 오류 정정 코딩저밀도 패리티 검사(LDPC) 코드를 사용(5G 네트워크에서 쓰이는 동일한 코드).
  3. 심볼 형성 – 인접 비트를 그룹화해 각 voxel의 다중 비트 용량을 활용하는 심볼을 만듭니다.
  4. 유리 기록 – 선택한 voxel 생성 방식을 이용해 심볼 스트림을 기록합니다.

예시 이미지

Map data from Microsoft Flight Simulator etched onto the Silica storage medium.
그림: Microsoft Flight Simulator의 지도 데이터가 실리카 저장 매체에 새겨진 모습.
출처: Microsoft Research

Source:

성능

쓰기 작업은 여전히 병목 현상이므로 Microsoft는 과도한 열을 발생시키지 않으면서 네 개의 레이저를 동시에 사용해 단일 유리 슬래브에 기록할 수 있는 하드웨어를 개발했습니다. 이를 통해 66 메가비트 초당의 기록 속도를 달성했으며, 팀은 추가로 최대 열 개의 레이저를 더하는 것이 가능하다고 보고 있습니다. 하나의 슬래브는 4.84 TB(크기 12 cm × 12 cm × 0.2 cm)까지 저장할 수 있습니다. 현재 속도로는 슬래브 전체를 기록하는 데 150시간 이상이 소요됩니다.

스토리지 시스템의 “최대” 용량은 두 가지 기록 방식으로 달성 가능한 밀도에 따라 달라집니다:

방법데이터 밀도하드웨어 복잡성재료 요구사항
이중굴절 기반가장 높음(부피당 더 많은 복셀)더 많은 광학 하드웨어 필요; 고품질 유리에서만 작동고품질 유리 전용
대안(단순형)슬래브당 약 2 TB간단한 하드웨어투명한 재료라면 모두 사용 가능

보로실리케이트 유리는 극도의 안정성을 제공합니다. Microsoft의 가속 노화 실험에 따르면 데이터는 실온에서 10,000년 이상 보존될 수 있다고 합니다. 이에 Microsoft는 다음과 같이 선언했습니다:

“우리의 결과는 실리카가 디지털 시대의 기록 보관 솔루션이 될 수 있음을 보여줍니다.”

이 주장은 야심 차지만, 참고로 Square Kilometre Array (SKA) 망원경은 연간 ≈ 700 PB의 데이터를 생성할 것으로 예상되며, 이는 140,000개 이상의 유리 슬래브가 필요합니다. 추가 레이저를 많이 도입한다 하더라도 이를 따라잡으려면 600대 이상의 실리카 기계가 병렬로 운영되어야 합니다. 그럼에도 불구하고 실리카는 기록 보관용 스토리지로서 몇 가지 매력적인 특징을 가지고 있습니다:

  • 데이터 보존에 전력 소모가 전혀 없음.
  • DNA 저장과 같은 대안에 비해 빠른 검색 가능(DNA 저장은 며칠이 걸릴 수 있음).
  • 과학 소설에서 바로 튀어나온 듯한 미래지향적 미학 (영상 5분 2초 지점 참고: https://youtu.be/V0bUd6KrQGg?t=302).

ReferenceNature, 2026. DOI: 10.1038/s41586-025-10042-w
(DOI에 관하여: https://arstechnica.com/science/news/2010/03/dois-and-their-discontents-1/)

Correction: 여기서 에칭이 어떻게 사용되는지 정의했습니다.


저자

Photo of John Timmer

John Timmer는 Ars Technica의 과학 편집자입니다. 그는 콜럼비아 대학교에서 생화학 학사 학위를, 캘리포니아 대학교 버클리에서 분자 및 세포 생물학 박사 학위를 받았습니다. 키보드 앞에 없을 때는 자전거를 타거나 경치 좋은 곳을 하이킹합니다.

0 조회
Back to Blog

관련 글

더 보기 »