그라비톤5, 개선된 설계로 속도와 에너지 효율 상승 — 무어의 법칙을 넘어
출처: Amazon Science
AWS Graviton 프로세서는 세대를 거듭할수록 꾸준히 개선되어 왔으며, 각 버전마다 연산 성능, 가격 대비 성능, 에너지 효율성, 메모리 용량이 향상되었습니다. 오늘 Amazon은 일반 목적 워크로드를 위한 Elastic Compute Cloud(EC2) 신규 M9g 및 M9gd 인스턴스의 일반 제공을 발표했습니다. 이 인스턴스들은 Amazon의 최신 CPU인 Graviton5로 구동되는 최초의 제품입니다.
맞춤형 실리콘 5세대와 8년간의 지속적인 투자를 거쳐, Graviton은 웹 애플리케이션, 마이크로서비스, 분석, 데이터베이스, 머신러닝 추론, 전자 설계 자동화, 게임, 비디오 인코딩, 에이전트형 AI 등 다양한 워크로드에 적합한 350여 개 이상의 인스턴스 유형을 지원합니다.
Graviton5는 코어 수를 Graviton4의 96개에서 192개로 두 배로 늘렸으며, DDR5‑8800 메모리와 최신 PCIe Gen6 인터커넥트를 지원합니다. DDR5‑8800 수준의 성능을 달성하기 위해 주요 DRAM 제조업체와 긴밀히 협력했으며, AWS Graviton 인스턴스는 클라우드 내 모든 프로세서 인스턴스 중 가장 빠른 메모리를 제공합니다.
Graviton5는 3nm 공정으로 전환하여 회로 밀도를 높이고 칩 내 통신 속도를 가속화했습니다. Graviton5는 코어 수가 늘어났을 뿐만 아니라, 각 코어가 이전 세대 대비 25% 높은 성능을 제공합니다.
우리는 마이크로 벤치마크와 실제 워크로드가 크게 다르다는 점을 오랫동안 강조해 왔으며, 고객의 실제 워크로드—작은 루프가 아니라 데이터베이스와 같은 복잡한 애플리케이션 전체—에 맞춰 설계합니다.
코드를 빠르게 실행하기 위해 최신 프로세서는 프로그램 흐름에서 발생하는 분기(branch)를 예측하고, 예측된 경로를 사전 실행(speculative execution)합니다. Graviton5에 사용된 Neoverse V3 코어는 Arm과 Amazon Annapurna Labs가 공동 정의했으며, CPU의 분기 예측 능력을 크게 향상시켜 데이터베이스와 같은 실제 애플리케이션을 최대 30% 더 빠르게 실행할 수 있게 합니다.
Graviton5 패키지의 상단 뷰. 네 개의 칩렛 각각에 48개의 코어, DRAM 컨트롤러, PCIe 컨트롤러가 포함되어 있습니다.
CPU의 DRAM은 약 100나노초 정도 떨어져 있습니다. 이는 큰 수처럼 보이지 않지만, 3.3GHz로 동작하는 CPU에서는 메모리 접근 하나에 330 사이클이 소요됩니다. CPU는 캐시를 사용해 데이터를 CPU에 가깝게 두며, 캐시에서 요청을 처리할 경우 전체 DRAM 지연 시간을 기다릴 필요가 없습니다. Graviton5는 64KB 1차 캐시, 2MB 2차 캐시, 그리고 192MB 3차 캐시를 제공하는데, 이는 이전 세대 대비 5배 이상 큰 용량입니다.
Graviton3은 코어, DRAM 컨트롤러, PCIe 컨트롤러를 각각 별도의 다이(die)로 구성한 칩렛 아키텍처를 처음 도입했으며, 7개의 다이로 구성되었습니다. Graviton4는 Graviton3와 동일한 아키텍처에 몇 가지 개선을 더했습니다.
하지만 Graviton5에서는 구조를 크게 바꾸었습니다. 192개의 코어를 4개의 칩렛에 고르게 배치했으며, 각 칩렛에는 DRAM 컨트롤러, PCIe 컨트롤러, 48개의 코어가 포함됩니다. 맞춤형 다이‑투‑다이 연결을 통해 칩렛 간에 초당 최대 420GB의 대역폭을 제공해 메쉬 내 코어 간 지연 시간을 최소화합니다. 별도의 I/O 다이와 DRAM 컨트롤러 다이는 존재하지 않으며, 이 설계 덕분에 각 칩당 2개 또는 4개의 비균일 메모리 접근(NUMA) 영역을 구성하고, L3 캐시 크기를 가상 머신(VM) 크기에 맞게 조정하면서 48코어 이하 VM의 메모리 지연 시간을 줄일 수 있습니다.
이러한 개선을 통해 Graviton5 기반 인스턴스는 Graviton4 기반 인스턴스 대비 최대 25% 높은 연산 성능을 제공하며, 웹 애플리케이션에서는 최대 35%, 머신러닝 추론에서는 최대 35%, 데이터베이스에서는 최대 30% 빠른 성능을 보입니다.
Graviton5로 구동되는 M9g 및 M9gd 인스턴스는 Nitro Isolation Engine 도입으로 보안 수준을 한층 끌어올렸습니다. Nitro Isolation Engine은 Nitro 시스템을 강화한 구성 요소로, 인스턴스 격리를 강제하고 형식 검증(formal verification)을 활용해 수학적으로 정확한 격리 보장을 제공합니다. Nitro Isolation Engine은 VM 메모리, CPU 레지스터 상태, I/O 장치에 대한 모든 접근을 최소한의 API 집합을 통해 중재함으로써 VM 간 격리를 구현합니다. 형식 검증은 하드웨어 또는 소프트웨어가 의도한 대로 동작한다는 것을 수학적으로 증명하는 기법으로, 특정 테스트 케이스에만 국한되지 않습니다. 이러한 집중적인 검증을 통해 Nitro는 최초의 형식 검증된 클라우드 하이퍼바이저가 되었으며, 수학적으로 입증된 클라우드 보안의 새로운 표준을 제시합니다. Nitro Isolation Engine에 대해 더 알고 싶다면 Amazon Science 블로그 게시물을 읽어보세요.