구글, Gemini 사용량 제한 초과 문제를 해결했을 가능성
TL;DR
- 구글은 Gemini의 주요 할당량 불만을 버그를 수정하고 사용 제한을 보다 예측 가능하게 만들어 해결하고 있습니다.
- 또한 과다 사용을 계산하는 방식을 바꾸고, 실패한 요청과 Flash‑Lite 프롬프트는 전혀 제한에 포함되지 않도록 합니다.
- 투명성을 높이기 위해 Deep Research 사용량에 대한 상세 구분을 추가하고, 모델 선택을 세션 간에 지속하도록 합니다.
배경
우리는 최근 구글이 AI Pro 플랜의 일부를 조용히 강화했으며, 사용자들이 예상보다 훨씬 빨리 제한에 도달하고 있다는 점을 보도했습니다—때로는 몇 번의 프롬프트만으로도 말이죠. 구글은 이후 Antigravity 사용자들의 할당량을 늘려 상황을 진정시키려 했지만, 이는 불만의 일부만 해소했습니다.
구글 부사장인 Josh Woodward는 X(구 트위터) 게시물에서 직접 답변하며, 사용자가 제한에 너무 빨리 도달하고 있음을 인정했습니다. 그는 회사가 사용량을 더 예측 가능하게 만들고, 혼란을 줄이며, 다양한 작업 유형에 걸쳐 할당량이 더 일관되게 느껴지도록 여러 가지 수정을 진행하고 있다고 밝혔습니다.
주요 수정 사항
Omni 비디오 생성 버그
Omni 비디오 생성 모델과 관련된 버그 때문에 단 한 번 혹은 몇 번의 비디오 프롬프트만으로도 사용자의 할당량이 크게 소모되는 문제가 있었습니다. 구글은 이제 이 문제를 해결하고, 과다 사용자를 위한 허용량을 늘렸습니다. 예를 들어 Ultra 구독자는 Omni 비디오 생성 횟수가 즉시 두 배가 됩니다.

Complex 3.1 Pro 프롬프트 상한선
Complex 3.1 Pro 프롬프트—대용량 파일 업로드나 다단계 추론이 동반되는 길고 상세한 지시—가 이전에는 할당량을 급격히 소모했습니다. 구글은 프롬프트당 상한선을 도입해 단일 무거운 요청이 월 할당량의 큰 부분을 소진하지 않도록 합니다.

실패한 요청은 이제 차감되지 않음
전체 요청 중 약 10%가 시스템 오류로 실패할 수 있습니다. 이전에는 실패한 시도조차도 할당량에서 차감되었습니다. 구글은 이를 수정하여 실패한 요청은 사용량에 차감되지 않도록 했습니다.

Flash‑Lite 프롬프트는 무료화
Flash‑Lite 프롬프트는 전혀 할당량에 포함되지 않게 되어, 가벼운 작업에 대해 Flash‑Lite를 무료 레이어로 사용할 수 있게 되었습니다. 이는 전체 추론 파워가 필요 없는 경우 가벼운 모델을 활용하도록 유도합니다.
Deep Research 사용량 상세 구분
구글은 Deep Research 사용량—Gemini가 대용량 입력을 처리하거나 다단계 분석을 수행하는 컴퓨팅 집약적 작업—에 대해 더 자세한 구분과 알림을 추가합니다. 사용자는 이제 어떤 작업 유형이 비용이 많이 드는지, 어떤 것이 그렇지 않은지를 명확히 확인할 수 있습니다.

모델 선택 지속성
앱은 이제 세션 간에 선택한 모델을 기억하므로, 사용자가 Gemini를 열 때마다 선호하는 글쓰기·연구 모델을 다시 선택할 필요가 없습니다. 단, 사용 제한에 도달했을 경우 시스템이 자동으로 가벼운 모델로 전환해 작업이 계속 진행될 수 있습니다.
결론
이번 업데이트는 많은 사용자에게 일관성을 잃어버린 시스템을 다듬기 위한 구글의 노력을 보여줍니다. 제한 자체는 여전히 존재하지만, 이번 변화는 제한이 보다 논리적이고 투명하게 느껴지도록 하는 데 초점을 맞추고 있습니다. 이 조치가 사용자 불만을 완전히 해소할지는 두고 봐야겠지만, 방향성은 확실히 더 사용자 친화적이라고 할 수 있습니다.