미국은 중국 AI를 막기 위해 1000억 달러를 썼다. 효과가 없었다.

발행: (2026년 2월 22일 오전 09:18 GMT+9)
11 분 소요
원문: Dev.to

Source: Dev.to

나방

개요

세계에서 가장 많이 다운로드된 AI 시스템은 OpenAI, Google, Meta가 만든 것이 아니라 알리바바의 Qwen입니다—2026년 1월 현재 Hugging Face에서 7억 건 이상의 다운로드를 기록했으며, 2025년 10월에 Meta의 Llama를 제치고 1위를 차지했습니다. 12월 한 달 다운로드 수만으로도 다음 8개의 주요 모델를 합친 총 다운로드 수를 넘어섰습니다.

2월에 발표된 두 번째로 중요한 AI는 GPT‑5.3‑CodexClaude Opus 4.6이 아니라, 중국 연구소 Zhipu AI가 만든 GLM‑5였습니다. 이 모델은 744 억 파라미터 규모이며, 전적으로 Huawei Ascend 칩으로 학습되었습니다. Nvidia도, TSMC도, 미국산 실리콘도 스택 어디에도 사용되지 않았습니다.

수 차례에 걸친 수출 통제와 3년이 지난 지금, 데이터는 명확한 이야기를 보여줍니다: 통제는 중국의 반도체 생산을 늦췄지만, 중국의 AI는 느려지지 않았습니다.

The Hardware Wall That Wasn’t

미국의 수출 통제는 정확히 한 가지를 잘 해냈다: 중국의 첨단 칩 제조 능력을 크게 약화시켰다. ASML의 EUV 리소그래피 장비는 SMIC에 도달하지 못했다. 화웨이는 2025년에 200 000개의 AI 칩만 생산했으며—제한이 없었다면 만들 수 있었던 양에 비하면 극히 일부에 불과하다. 상무부 장관 Howard Lutnick은 이 수치를 의회 증언에서 전략이 효과적이었다는 증거로 인용했다.

하지만 칩을 제조하는 것과 AI 모델을 구축하는 것은 서로 다른 문제임이 드러났다.

  • GLM‑5는 256개의 mixture‑of‑experts 모듈에 걸쳐 744 억 개의 파라미터를 구동하며, 추론당 440 억 개가 활성화된다.
  • 100 000 Huawei Ascend 910B 칩을 사용해 28.5 조 개의 토큰으로 학습되었다.
  • Ascend 910B는 원시 연산 능력에서 H100에 미치지 못한다. Zhipu는 소프트웨어 최적화와 거대한 클러스터 규모로 이를 보완했다.

그 결과는 Humanity’s Last Exam (50.4 % 대 47.8 %) 및 SWE‑bench Verified (77.8 % 대 76.2 %)에서 GPT‑5.2와 경쟁한다. 토큰당 비용은 대략 6배 정도 낮다.

  • MIT 라이선스.
  • Hugging Face에 전체 가중치 공개.
  • chat.z.ai에서 무료 채팅 티어 제공.

이 모델은 Slime이라는 강화학습 기법을 통해 업계 최저 환각률 34 %(Claude Sonnet 4.5의 42 % 대비)를 달성했으며, 이 기법은 비동기 활성 부분 롤아웃을 사용해 순차적 학습 병목을 제거한다. 이름은 특이하지만 결과는 그렇지 않다.

실리콘밸리의 80 %가 중국 코드 위에서 돌아갑니다

Martin Casado는 Andreessen Horowitz의 일반 파트너이자 125억 달러 규모의 인프라 펀드를 관리하면서 피치 미팅 중 조용히 다음과 같은 관찰을 했습니다. 오픈‑소스 스택을 사용하는 스타트업 중 약 **80 %**가 중국 모델—DeepSeek, Qwen, Kimi, Zhipu—을 사용하고 있다는 것입니다.

소프트웨어 엔지니어 Rohan Paul은 더 날카로운 점을 발견했습니다. 전 세계 리더보드 상위 16개의 오픈‑소스 모델이 모두 중국산이며, 가장 높은 순위의 비중국 오픈‑소스 모델은 17위에 불과합니다.

중국 오픈‑소스 AI는 2024년 말 전 세계 사용량의 **1.2 %**에서 2025년 말에는 거의 **30 %**로 급증했습니다. 이는 단순한 트렌드가 아니라 이동입니다.

왜일까요? 경제적 논리는 명확합니다. 스타트업은 현금을 소진합니다. 중국 오픈‑소스 모델은 무료이며, 관용적인 라이선스를 가지고 있고, 점점 경쟁력을 갖추고 있습니다. Meta 등 미국 대안은 제한적인 라이선스와 불확실한 미래를 안고 있습니다. 런웨이가 18개월이고 추론 비용이 생존 여부를 좌우한다면, 여러분은 무료이면서 작동하는 모델을 선택하게 됩니다.

  • 알리바바는 Qwen 패밀리 전체에 걸쳐 거의 400개의 모델을 오픈‑소스로 공개했습니다.
  • 파생 버전만 해도 180 000개가 넘습니다.

이 생태계는 규모가 클 뿐만 아니라 자기 강화적입니다.

펜타곤이 계획하지 못한 역설

  • DeepSeekR1을 출시한 후 추론 연산 능력이 충분하지 않아 API 접근을 제한해야 했습니다.
  • 중국의 AI 칩 중 **80 %**까지가 생산 서비스에 필요한 안정성을 유지할 수 없는 데이터 센터에 남아 사용되지 않을 수 있습니다.

중국은 모델 성능에서 앞서고, 미국은 배포 인프라에서 앞서고 있습니다. 이러한 통제는 중국이 AI 연산을 수출하는 것을 성공적으로 차단했으며, 말레이시아에서 3 000 Ascend GPU에 대한 계약이 말레이시아 정부의 압력으로 철회되었습니다. 글로벌 AI 클라우드 인프라에서 중국의 영향력은 여전히 미미합니다.

하지만 이와 같은 구도에는 문제가 있습니다: 모델은 자유롭게 이동합니다. 코드는 운송 경로가 필요하지 않기 때문입니다. Zhipu가 MIT 라이선스로 GLM‑5 가중치를 공개하면 전 세계가 중국이 훈련한 AI에 접근할 수 있게 되며, 여기에는 이미 이를 활용하고 있는 미국 스타트업의 **80 %**도 포함됩니다.

Stanford의 AI Index Report 2025는 중국 연구소들이 최악의 경우에도 모델 성능에서 “빠른 추종자”에 불과하다고 결론지었습니다. 선두와 추종자 사이의 격차는 이제 단위이며, 연이 아닙니다. 그리고 DeepSeek의 창업자 Liang Wenfeng은 연구자들에게 이렇게 말했습니다:

“우리에게는 돈이 문제가 된 적이 없습니다. 문제는 고성능 칩의 수출 금지입니다.”

그는 자신의 팀이 표준 벤치마크에서 GPT‑4.5에 버금가는 모델을 출시한 상황에서 이 말을 했습니다.

1천억 달러가 산 것

미국은 막대한 정치적 자본을 쏟아부었고, 수십억 달러 규모의 반도체 무역을 방해했으며, 칩 수출 통제로 동맹국들을 소외시켰습니다. 하드웨어를 제한하면 AI 역량도 제한될 것이라는 베팅이었습니다. 3년 동안은 그 논리가 통했습니다.

하지만 이제는 통하지 않습니다.

  • Zhipu의 홍콩 IPO는 2026년 1월에 5억 5800만 달러를 모금했습니다.
  • 상장 이후 주가는 300 % 이상 급등했습니다.
  • 이 회사는 이미 상하이에서 2차 공모를 계획하고 있습니다.

Zhipu는 화웨이와의 호환성뿐 아니라 Moore Threads, Cambricon, Kunlun Chip, MetaX, Enflame, Hygon와도 호환되도록 설계해, 미국 부품 하나도 필요 없는 병렬 하드웨어 생태계를 구축했습니다.

수출 통제 체제는 중국의 칩 제조를 수년간 지연시키는 데는 성공했지만, 중국의 AI를 몇 달이라도 지연시키는 데는 실패했습니다. 모델들은 열등한 하드웨어 위에 더 나은 소프트웨어로 여전히 구축되었고, 이제 그 모델들이 대부분의 새로운 미국 스타트업을 구동하고 있습니다.

이것이 이야기의 끝은 아니지만, 전 세계 AI 판도에 결정적인 변화를 가져왔습니다.

0 조회
Back to Blog

관련 글

더 보기 »