Gemini 3 Flash가 이제 Gemini CLI에서 사용 가능합니다
Source: Google Developers Blog
2025년 12월 17일
Gemini 3 Flash 이제 Gemini CLI에서 사용 가능
Gemini 3 Flash 이제 Gemini CLI에 통합되어 고주파, 터미널 기반 워크플로를 가능하게 합니다.
- 성능: 에이전트 코딩에서 **SWE‑bench 검증 점수 78 %**를 달성했으며, 2.5 시리즈와 Gemini 3 Pro 모두를 능가합니다.
- 효율성: 품질 대비 비용 및 속도의 파레토 경계를 확장하도록 설계되었습니다.
- 비용: Gemini 3 Pro 대비 ¼ 이하의 비용으로 프리뷰에서 제공됩니다.
- 속도 및 품질: 최고의 모델 두 개가 Gemini CLI를 구동하므로, 이제 속도를 위해 품질을 희생할 필요가 없습니다.
Gemini CLI로 Gemini 3 Flash 시작하기
오늘부터 대부분의 유료 등급 Gemini CLI 고객은 Gemini 3 Pro와 Gemini 3 Flash를 모두 사용할 수 있습니다. 포함 대상은 다음과 같습니다:
- Google AI Pro 또는 AI Ultra의 모든 비비즈니스 고객
- Google AI 또는 Vertex를 통해 유료 API 키로 접근 권한을 가진 사용자
- 프리뷰 모델에 대해 클라우드 관리자에 의해 활성화된 Gemini Code Assist 사용자
(관리자 안내)
무료 등급 사용자에게
- 이전 대기자 명단에 등록한 모든 사람에게 이미 제공되었습니다 – 자세한 내용은 이메일을 확인하세요.
- 대기자 명단에 없었던 경우, 경험을 빠르고 안정적으로 유지하기 위해 추가 접근 권한을 점진적으로 확대하고 있습니다. 계속 지켜보시거나 현재 옵션에 대해 문서를 확인하세요.
Gemini CLI 업그레이드
최신 버전(0.21.1 이상)으로 업그레이드:
npm install -g @google/gemini-cli@latest
업그레이드 확인:
gemini --version # should show 0.21.1 or later
미리보기 기능 활성화
/settings명령을 실행합니다.- Preview features를 true로 전환합니다.
/model을 실행하고 Gemini 3을 선택합니다.

새로운 소식?
- Intelligent auto‑routing: Gemini CLI는 고도로 복잡한 추론 작업을 위해 자동으로 Gemini 3 Pro를 예약합니다.
- Manual selector: 모든 작업에 대해 특정 모델을 선택합니다.
- Gemini 3 Flash: 상당한 추론 개선을 제공하여, 이전에 더 느린 Pro 등급이 필요했던 프롬프트를 더 낮은 비용으로 실행할 수 있습니다.
터미널에서 향상된 에이전시 코딩으로 모든 것을 구축
Gemini 3 Flash는 강력한 추론, 도구 사용, 멀티모달 기능으로 코딩 세션의 성능 기준을 높입니다.
3D 그래픽이 포함된 바로 배포 가능한 앱 생성
우리는 Gemini CLI에서 Gemini 3 Pro를 사용해 **골든게이트 브리지의 3D 복셀 시뮬레이션을 구축**했으며, 프롬프트를 창의적 브리프와 기술 사양으로 동시에 다루었습니다. 그런데 Gemini 3 Flash도 같은 작업을 할 수 있을까요?
이전에는 한 번에 이 정도 수준의 기능 코드를 생성하는 것이 Pro 모델에 더 적합했습니다. 예를 들어 Gemini 2.5 Flash는 종종 이 복잡성을 처리하는 데 어려움을 겪어 논리가 깨지는 경우가 있었습니다. Gemini 3 Pro의 최첨단 추론은 더 시각적으로 매력적인 결과를 만들지만, Gemini 3 Flash도 정밀하게 작업을 수행할 수 있어, 빠른 프로토타이핑 도구가 코드 품질을 희생할 필요가 없음을 보여줍니다.
Video placeholder – replace with an actual video embed when available.
Source: …
일일 업무 개선
개발 어시스턴트의 진정한 시험은 하루 동안 수행하는 대량의 실용적인 작업을 어떻게 처리하느냐에 달려 있습니다. Gemini 3 Flash는 2.5 Pro보다 3배 빠르면서도 비용은 일부에 불과한 성능을 보여줍니다(Artificial Analysis 벤치마크 기준).
대용량 컨텍스트 윈도우에서의 액션‑코드 변경
대규모 코드베이스를 관리할 때는 수백 개의 풀 리퀘스트 댓글을 뒤져야 할 때가 많으며, 그 중 단 하나의 실행 가능한 항목을 찾아야 합니다. 이를 위해서는 특정 지시를 놓치지 않으면서 방대한 컨텍스트 윈도우를 유지할 수 있는 모델이 필요합니다.
이번 데모에서 Gemini 3 Flash는 1,000개의 댓글이 포함된 가상 풀‑리퀘스트 스레드를 처리합니다. “bikeshedding”이라 불리는 잡담을 가르고, 타임아웃 조정에 관한 단 하나의 핵심 요청을 찾아냅니다. Gemini CLI는 첫 시도에서 정확히 해당 설정 파일을 업데이트하여, 모델이 방대한 컨텍스트 내에서 신호와 잡음을 구분하고 정확한 편집을 수행할 수 있음을 보여줍니다.
영상 자리표시자 – “죄송합니다, 브라우저가 이 동영상을 재생할 수 없습니다.”
실제 사용자 트래픽을 시뮬레이션하여 스트레스 테스트
백엔드 인프라를 검증하려면 실제 사용자 행동을 모방한 트래픽이 필요하지만, 동시성 및 특정 사용자 여정을 처리하는 맞춤형 부하‑테스트 스크립트를 작성하는 데는 많은 시간이 소요됩니다. 이러한 작업은 Gemini 3 Flash에 적합한데, 구문 환각과 실패 루프를 줄이면서도 빠른 응답을 제공합니다.
이번 데모에서는 Gemini CLI를 사용해 Cloud Run에 호스팅된 웹 애플리케이션을 스트레스‑테스트합니다. Gemini 3 Flash는 **asyncio**를 활용한 파이썬 스크립트를 생성해 세 가지 시나리오에 걸쳐 동시 사용자를 시뮬레이션합니다:
- 주문 성공
- 결제 실패
- 재고 타임아웃
초기 실행 시 프로토콜 오류가 발생하면, 모델이 즉시 트레이스백을 분석하고 스크립트를 패치합니다. 이후 포괄적인 부하 테스트를 실행하고 몇 초 안에 Cloud Run 대시보드에서 결과 메트릭을 확인할 수 있습니다.
영상 자리표시자 – “죄송합니다, 브라우저가 이 동영상을 재생할 수 없습니다.”
흐름을 더 오래 유지하세요
Gemini 3 Flash는 터미널에서 고빈도 개발 작업을 위한 새로운 성능 기준을 제공합니다. 성능 하한선을 높이고 Gemini CLI의 자동 라우팅과 통합함으로써 더 빠르고 효율적으로 작업할 수 있도록 도와줍니다. 새로운 프로토타입을 구축하든 복잡한 인프라를 관리하든, 이제 작업 속도에 맞춰 따라갈 수 있는 개발 도우미가 있습니다.
오늘 Gemini CLI를 업데이트하여 최신 버전으로 전환하고 Gemini 3 Flash와 함께 더 빠르게 — 토큰당 비용을 낮추면서 — 개발을 시작하세요.