구글 최신 DiffusionGemma 오픈 AI 모델, 속도 4배 향상

발행: 21시간 전 (2026년 6월 11일 AM 04:29 GMT+9)

4 분 소요

로컬 효율성을 위한 여러 경로

확산이 훨씬 빠른데 왜 구글은 대규모 클라우드 기반 Gemini 모델에 이를 사용하지 않을까요? 구글은 이와 같이 실험해봤습니다, 하지만 텍스트 확산에는 몇 가지 단점이 있습니다. 그 중 하나는 오류율이 높다는 점입니다. 이미지 확산 모델에서는 하나의 잘못 예측된 픽셀이 이미지 전체를 쓸모없게 만들지는 않지만, 언어는 이산적이기 때문에 텍스트에서 동등한 오류가 발생하면 토큰 블록 전체가 의미를 잃고 더 나은 출력을 얻기 위해 처음부터 다시 시작해야 합니다. 또한 원하는 출력이 몇 개 안 되는 토큰일 경우, 확산 모델은 많은 병렬 작업을 수행해 다섯 개 토큰을 얻어야 하는데, 이는 자동회귀 모델이 처음부터 끝까지 단 5단계만에 처리하는 것과 비교됩니다.

DiffusionGemma는 다른 Gemma 모델만큼의 능력을 가지고 있지만, 훨씬 빠릅니다.
출처: Google

클라우드에서는 자동회귀 모델이 여러 사용자의 대규모 연산 작업을 배치해 항상 토큰을 생성하고, 이러한 시스템에 사용되는 고대역폭 메모리(HBM)는 데이터를 훨씬 효율적으로 이동시킬 수 있습니다. 반면 로컬 AI는 메모리 대역폭이 낮고 유휴 시간이 발생해 연산 사이클이 낭비됩니다. 확산 모델은 사용 가능한 연산을 보다 효율적으로 활용할 수 있지만, 이것이 유일한 방법은 아닙니다. 구글은 최근 멀티 토큰 예측(Multi-Token Prediction, MTP) 초안기를 도입했으며, 이는 낭비되는 연산 사이클을 활용해 가능한 토큰을 예측해 속도를 높입니다. 그러나 확산은 MTP 버전의 Gemma보다도 더 빠릅니다.

구글은 DiffusionGemma가 실험적인 것이라고 강조하지만, 다른 4세대 Gemma 모델과 동일한 Apache 2.0 라이선스로 제공됩니다. 모델 가중치는 오늘 바로 Hugging Face에서 다운로드할 수 있습니다. 구글은 Nvidia와 협력해 DiffusionGemma가 고성능 RTX GPU(양자화)와 H100 또는 DGX Spark 플랫폼과 같은 엔터프라이즈 시스템을 포함한 다양한 환경에 최적화되도록 했다고 밝혔습니다.

구글 최신 DiffusionGemma 오픈 AI 모델, 속도 4배 향상

로컬 효율성을 위한 여러 경로

관련 글

‘이대로는 안 된다’: Xbox 경영진, 침체된 브랜드 뒤 ‘가혹한 진실’ 밝힘

알래스카, NSF가 해양 모니터링망을 폐쇄해 눈이 멀다

최초의 복잡한 세포는 여러 종의 유전자를 혼합해 가지고 있었다.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.

로컬 효율성을 위한 여러 경로

관련 글

‘이대로는 안 된다’: Xbox 경영진, 침체된 브랜드 뒤 ‘가혹한 진실’ 밝힘

알래스카, NSF가 해양 모니터링망을 폐쇄해 눈이 멀다

최초의 복잡한 세포는 여러 종의 유전자를 혼합해 가지고 있었다.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.

AI와는 무관하게 내가 좋아하는 macOS 27 골든게이트의 몇 가지.