애플, 새로운 Siri에 쓰일 대형 Gemini 모델을 아이폰에 탑재하려고 노력 중
Source: Ars Technica
기술과 상호작용할 때 생성형 AI를 완전히 피하는 것은 이제 불가능하지만, 애플은 그 양을 조금 줄이고 있다. 완전히 선택에 의한 것은 아니다. 아이폰 제조사는 2024년에 처음 약속한 AI‑강화 시리를 여러 차례 연기했지만, 구글과의 계약을 통해 올해 말에 상징적인 어시스턴트를 제미니와 결합할 예정이다. 전 세계 개발자 회의(WWDC)가 다가오면서 애플은 스마트폰이라는 제한된 처리 환경에 대규모 AI 지능을 도입하려고 노력하고 있다. 하지만 그 결과를 애플 팬들이 마음에 들어하지 않을 수도 있다.
애플은 오랫동안 AI를 로컬에서 실행하는 것의 프라이버시 가치를 강조해 왔지만, 새로운 보고서에 따르면 아이폰의 제미니 변신은 클라우드에서 구글과 엔비디아에 크게 의존할 것이라고 한다. The Information은 애플의 제미니가 탑재된 시리가 로컬과 클라우드 모두에서 동작할 것이며, 이는 로컬 AI에 초점을 맞춘 프라이버시 우선 정책이 뒤바뀐 것으로 보인다고 전한다.
새로운 칩이 발표될 때마다 애플은 자사의 실리콘이 AI에 최적화되어 있다고 강조한다—특히 뉴럴 엔진 업그레이드를 통해서다. 스마트폰에 탑재되는 NPU가 점점 강력해지고 있지만, 거대한 모델을 메모리에 올려두기에 충분한 RAM은 여전히 부족하다. 대부분의 휴대폰 GPU는 AI‑전용 NPU보다 더 많은 AI 토큰을 처리할 수 있지만, 최첨단 모델이 가진 방대한 파라미터 수를 대체할 수는 없다.
오늘날 가장 큰 AI 모델은 수조 개의 파라미터를 가지고 있는 반면, 디바이스 내 모델은 최대 몇 억 개 수준에 머문다. 휴대폰에 맞추기 위해 이러한 모델은 낮은 정밀도로 “양자화”되어 실행되며, 이는 추론 속도를 높이지만 토큰 생성 정확도를 떨어뜨릴 수 있다. 결과적으로 디바이스 내 AI는 클라우드 기반 AI보다 덜 똑똑하게 느껴지는 경우가 많으며, 가장 큰 클라우드 모델조차도 만족스럽지 못한 결과를 낼 때가 있다.
The amazing, shrinking Gemini
구글은 모바일에 최적화된 제미니 버전을 Gemini Nano라는 이름으로 제공한다. 이는 Magic Cue와 오디오 요약 같은 컨텍스트 기능을 위해 설계된 것이다. 그러나 시리는 대화형 어시스턴트를 목표로 한다—사용자는 시리와 대화하고 행동을 수행하기를 기대한다. 이를 위해서는 전혀 다른 종류의 모델이 필요하다. 안드로이드에서는 구글이 제미니 쿼리를 완전한 온‑디바이스 실행을 시도하기보다 클라우드로 바로 라우팅하는 경우가 일반적이다.