CPU2026 사양 평가
출처: Hacker News
SPEC의 CPU 벤치마크 스위트는 오랫동안 업계 표준으로 자리 잡아 왔으며, 다양한 출판물을 살펴볼 때 거의 놓칠 수 없습니다. 인텔은 SPEC CPU2000을 사용해 Pentium 4가 Pentium III에 비해 얼마나 개선됐는지를 보여주었습니다. 삼성은 SPEC CPU2000과 SPEC CPU2006 트레이스를 활용해 Mongoose 코어를 튜닝했습니다. SPEC CPU2017은 인텔이 Lion Cove 성능을 예측할 때 참고 자료로 사용되었습니다. 이제 SPEC는 CPU 벤치마크 스위트를 SPEC CPU2026으로 업데이트했습니다. 새 스위트는 43개였던 SPEC CPU2017에 비해 52개의 워크로드를 포함합니다. 개별 워크로드는 더 많은 소스 코드 라인(KLOC, 천 라인 단위)으로 구성됩니다. SPEC의 목표는 CPU 벤치마크 스위트를 현대화하면서도 SPEC가 추구해 온 이식성 목표를 유지하는 것입니다.

SPEC가 CPU 성능 분야에서 차지하는 중요성 때문에, 나는 새 스위트의 워크로드를 살펴보며 CPU에 어떤 도전 과제를 제시하는지 분석하려 합니다. 나는 컴파일러 비교보다 하드웨어에 더 관심이 있으므로, GCC 14.2.0에 -O3 옵션과 네이티브 아키텍처/최적화 타깃을 사용합니다. GCC 15.2.0을 시도해 보았지만 여러 문제에 부딪혀 시간을 절약하기 위해 GCC 14.2.0에 머물렀습니다. 아래 시스템들은 모두 Linux에서 테스트했습니다.
SPEC CPU 점수는 기준 시스템에 대한 속도 향상 비율을 나타냅니다. 각 SPEC CPU 업데이트마다 기준 시스템이 바뀌는 경우가 많지만, 최신 하드웨어와 항상 관련성이 있는 비교 대상은 아닙니다.

Ampere eMAG 8180 시스템이 SPEC CPU2026의 기준 점수 1.0을 제공합니다. Ampere eMAG은 SPEC CPU2017에 사용된 Sun Fire V490보다 빠른데, 이는 Cessna 172가 Sopwith Camel보다 빠른 것과 비슷합니다. 하지만 두 시스템 모두 현대 여객기에 비하면 비교가 무의미합니다. 게다가 Ampere eMAG은 널리 배포된 플랫폼이 아니며, 수년 전의 시스템조차도 큰 차이로 이를 앞서고 있습니다. 기준 시스템을 느리게 잡은 이유는 대부분의 시스템이 높은 점수를 받게 하려는 의도였다고 들었지만, 기준 점수를 1000처럼 높은 수치로 잡아도 같은 효과를 얻을 수 있었을 겁니다. Geekbench 6은 Core i7‑12700을 기준 점수 2500으로 보정하는 등 보다 합리적인 접근을 취합니다. Ampere eMAG과 달리 Intel Core i7‑12700 및 유사 CPU는 소비자 시스템에 널리 보급됐으며, 현재 Intel은 Xeon 6에서도 비슷한 코어 아키텍처를 사용하고 있습니다.

Intel과 AMD 최신 데스크톱 CPU를 SPEC CPU2026 정수 스위트에 적용해 보면 비슷한 성능을 보이지만, 부동소수점 테스트에서는 Zen 5가 앞서는 경향이 있습니다. 나는 Lion Cove 코어를 5.5 GHz까지 올려서 SPEC CPU2026을 실행했는데, 5.7 GHz를 지원하는 두 코어는 테스트 도중 크래시가 발생해 전체 스위트를 마무리하지 못했습니다. 샘플에 뭔가 문제가 있는 듯하지만, 5.7 GHz에서 테스트를 정상적으로 마치는 Lion Cove 코어가 있다면 격차가 줄어들 것이라 추측합니다.

정수 스위트 개별 점수는 Zen 5와 Lion Cove가 거의 일치함을 보여주며, 전체 점수에서도 그 경향이 드러납니다. 절대 점수는 Ampere eMAG 시스템이 얼마나 뒤처져 있는지를 단적으로 보여줍니다. 현재 데스크톱 코어는 Ampere eMAG보다 압도적으로 앞서 있으며, 특히 706.stockfish 테스트에서 그 차이가 크게 나타납니다. 10년 이상 된 FX‑8350조차도 더 나은 기준점이 될 수 있을 정도이며, 거의 모든 테스트에서 eMAG 시스템을 훨씬 앞서고 있습니다.
[![](https://substackcdn.com/image/fetch/$s_!5-nN!,w_1456,c_limit,f_auto,q_auto: