Gemini 3 Flash가 이제 Gemini CLI에서 사용 가능합니다
Source: Google Developers Blog
Dec 17, 2025 – Gemini 3 Flash는 이제 Gemini CLI에서 사용할 수 있으며, 터미널 기반 작업에 흔히 필요한 고빈도 워크플로를 지원합니다.
Gemini 3 Flash는 **SWE‑bench Verified 점수 78 %**를 달성하여 에이전시 코딩에서 2.5 시리즈뿐 아니라 Gemini 3 Pro보다도 뛰어납니다. Gemini 3 Flash는 높은 효율성을 위해 설계되어 품질 대비 비용 및 속도의 파레토 경계를 확장했으며, Gemini 3 Pro 비용의 1/4 이하로 프리뷰에서 제공됩니다. 두 개의 최고 모델이 Gemini CLI를 구동함에 따라 속도가 품질을 희생할 필요가 없어졌습니다.
Gemini CLI로 Gemini 3 Flash 시작하기
오늘부터 대부분의 유료 등급 Gemini CLI 고객은 Gemini 3 Pro와 Gemini 3 Flash 모두에 접근할 수 있습니다. 포함 대상은 다음과 같습니다:
- Google AI Pro 또는 AI Ultra의 모든 비비즈니스 고객
- Google AI 또는 Vertex를 통해 유료 API 키로 접근하는 사용자
- 프리뷰 모델에 대해 클라우드 관리자가 활성화한 Gemini Code Assist 사용자
(관리자 지침 보기)
무료 등급 사용자에게
- 이전 대기자 명단에 등록한 모든 사람은 이미 온보딩되었습니다 – 자세한 내용은 이메일을 확인하세요.
- 대기자 명단에 없었던 경우, 경험을 빠르고 안정적으로 유지하기 위해 추가 접근 권한을 점진적으로 확대하고 있습니다. 계속 지켜보시거나 현재 옵션을 확인하려면 문서를 확인하세요.
Source:
Gemini CLI 업그레이드
최신 버전(0.21.1 이상)으로 업그레이드:
npm install -g @google/gemini-cli@latest
버전이 0.21.1 이상인지 확인한 후 다음을 수행하세요:
/settings를 실행하고 Preview features를 true로 전환합니다./model을 실행하고 Gemini 3을 선택합니다.
모델 선택기

새로운 소식은?
- Intelligent auto‑routing: Gemini CLI는 고도로 복잡한 추론 작업을 위해 자동으로 Gemini 3 Pro를 예약합니다.
- Manual selector: 원하는 경우 모든 작업에 대해 특정 모델을 선택할 수 있습니다.
- Gemini 3 Flash: 상당한 추론 개선으로 이전에 더 느린 Pro 등급이 필요했던 프롬프트를 이제 더 낮은 비용으로 실행할 수 있습니다.
Source:
터미널에서 향상된 에이전트 코딩으로 모든 것을 구축하세요
Gemini 3 Flash는 강력한 추론, 도구 활용 및 멀티모달 기능을 통해 코딩 세션의 성능 기준을 높입니다.
3D 그래픽이 포함된 바로 배포 가능한 앱 생성
우리는 Gemini CLI에서 Gemini 3 Pro를 사용해 **골든게이트 브릿지의 3D 복셀 시뮬레이션을 구축**했습니다. 이 프롬프트를 창의적인 브리프와 기술 사양 모두로 취급했죠. 그런데 Gemini 3 Flash도 같은 작업을 할 수 있을까요?
이전에는 한 번에 이 수준의 기능적인 코드를 생성하는 것이 Pro 모델에 더 적합했습니다. 예를 들어 Gemini 2.5 Flash는 종종 복잡성을 처리하는 데 어려움을 겪어 논리가 깨지는 경우가 있었습니다. Gemini 3 Pro의 최첨단 추론은 보다 시각적으로 매력적인 결과를 만들어내지만, Gemini 3 Flash도 정밀하게 작업을 수행할 수 있어, 빠른 프로토타이핑 도구가 코드 품질을 희생할 필요가 없다는 것을 보여줍니다.
Video placeholder – your browser may not support playback.
일일 업무 향상
개발 어시스턴트의 진정한 테스트는 하루 동안 수행하는 대량의 실용적인 작업을 어떻게 처리하느냐에 달려 있습니다. Gemini 3 Flash는 2.5 Pro보다 3배 빠르게 동작하면서 비용은 극히 적게 듭니다(Artificial Analysis 벤치마크 기준).
대용량 컨텍스트 창을 활용한 액션 코드 변경
대규모 코드베이스를 관리할 때는 수백 개의 PR 코멘트 중 단 하나의 실행 가능한 항목을 찾아야 하는 경우가 많습니다. 이를 위해서는 특정 지시를 놓치지 않으면서 방대한 컨텍스트 창을 유지할 수 있는 모델이 필요합니다.
이번 데모에서 Gemini 3 Flash는 1,000개의 코멘트가 포함된 가상 풀‑리퀘스트 스레드를 처리합니다. “bikeshedding”이라 불리는 잡담을 가르고, 타임아웃 조정에 관한 단 하나의 핵심 요청을 찾아냅니다. Gemini CLI는 첫 시도에서 정확히 해당 설정 파일을 업데이트합니다. 이는 모델이 신호와 잡음을 구분하고 방대한 컨텍스트 창 내에서 정확한 편집을 수행할 수 있음을 보여줍니다.
비디오를 재생할 수 없습니다: 사용 중인 브라우저가 이 비디오 재생을 지원하지 않습니다.
현실적인 사용자 트래픽을 시뮬레이션하여 스트레스 테스트
백엔드 인프라를 검증하려면 실제 사용자 행동을 모방한 트래픽이 필요하지만, 동시성 및 특정 사용자 여정을 처리하는 맞춤형 부하 테스트 스크립트를 작성하는 데는 시간이 많이 소요됩니다. 이러한 작업은 Gemini 3 Flash에 적합하며, 구문 환각과 실패 루프를 줄이면서도 빠른 응답을 제공합니다.
이번 데모에서는 Gemini CLI를 사용해 Cloud Run에 호스팅된 웹 애플리케이션을 스트레스 테스트합니다. Gemini 3 Flash는 asyncio를 활용한 파이썬 스크립트를 생성해 세 가지 시나리오에 걸쳐 동시 사용자를 시뮬레이션합니다:
- 주문 성공
- 결제 실패
- 재고 타임아웃
초기 실행 시 프로토콜 오류가 발생하면, 모델이 즉시 트레이스백을 분석하고 스크립트를 수정합니다. 이를 통해 몇 초 만에 포괄적인 부하 테스트를 시작하고 Cloud Run 대시보드에서 결과 메트릭을 확인할 수 있습니다.
비디오를 재생할 수 없습니다: 사용 중인 브라우저가 이 비디오 재생을 지원하지 않습니다.
흐름을 오래 유지하기
Gemini 3 Flash는 터미널에서 고빈도 개발 작업을 위한 새로운 성능 기준을 제공합니다. 성능 하한선을 높이고 Gemini CLI의 자동 라우팅과 통합함으로써 작업 속도를 높이고 효율성을 향상시킵니다. 새로운 프로토타입을 만들든 복잡한 인프라를 관리하든, 이제 작업 속도를 따라잡을 수 있는 개발 도우미가 있습니다.
Gemini CLI를 최신 버전으로 업데이트하여 Gemini 3 Flash와 함께 더 빠르게—토큰당 비용을 낮추면서—빌드하세요.