Google, ‘Agentic Era’를 위한 새로운 AI 칩 두 개 공개
Source: Slashdot
Google의 새로운 TPU 라인업, “에이전트 시대”를 위해
Google은 떠오르는 “에이전트 시대”에 대비한 두 개의 새로운 Tensor Processing Units(TPU)를 발표했습니다. 이 칩들은 목적에 맞게 설계되었으며, 하나는 훈련 전용, 다른 하나는 추론 전용입니다.
“AI 에이전트가 급증함에 따라, 우리는 커뮤니티가 훈련과 서비스 요구에 각각 특화된 칩으로 혜택을 볼 것이라고 판단했습니다.”라고 Amin Vahdat(Google 수석 부사장 겸 AI 및 인프라 최고 기술 책임자)가 블로그 게시물에서 말했습니다. 두 칩 모두 올해 말에 출시될 예정입니다.
성능 주장
- 훈련용 칩은 동일한 가격에서 7세대 Ironwood TPU(지난 11월 발표) 대비 2.8배의 성능을 제공합니다.
- 추론용 프로세서는 이전 모델보다 80 % 더 빠릅니다.
이 수치는 CNBC 보도에서 인용된 것으로, Google이 훈련과 추론을 모두 처리하던 단일 칩에서 별도의 프로세서로 전환함으로써 Nvidia와 AI 하드웨어 시장에서 경쟁하고 있음을 강조합니다.
아키텍처 세부 사항 및 경쟁
- Nvidia는 정적 랜덤 액세스 메모리(SRAM)를 크게 활용할 예정인 차세대 Groq 3 LPU 하드웨어를 암시했습니다.
- 최근 상장을 신청한 또 다른 AI 칩 제조업체인 Cerebras도 설계에 SRAM을 사용합니다.
- Google의 추론 칩인 TPU 8i 역시 SRAM을 사용하며, 384 MB(Ironwood 대비 3배)의 용량을 갖추고 있습니다.
Alphabet CEO Sundar Pichai에 따르면, 이 아키텍처는 “수백만 개의 에이전트를 동시에 비용 효율적으로 실행하는 데 필요한 대용량 처리량과 낮은 지연 시간을 제공하도록 설계되었습니다.”
참고 문헌
- Google 블로그 발표:
- CNBC 기사: