Gemini 3 Flash가 이제 Gemini CLI에서 사용 가능합니다

발행: (2025년 12월 18일 오전 01:17 GMT+9)
9 min read

Source: Google Developers Blog

December 17, 2025

Gemini 3 Flash가 이제 Gemini CLI에서 사용 가능해졌으며, 터미널 기반 작업에 흔히 필요한 고빈도 워크플로를 지원합니다.
Gemini 3 Flash는 **SWE‑bench Verified 점수 78 %**를 달성했으며, 이는 2.5 시리즈는 물론 Gemini 3 Pro보다도 뛰어난 에이전시 코딩 성능을 보여줍니다.

Gemini 3 Flash는 비용과 속도 대비 품질의 파레토 프론티어를 밀어붙이도록 설계된 고효율 모델입니다. 현재 프리뷰 단계에서 Gemini 3 Pro 비용의 1/4 미만으로 제공됩니다. 최고의 모델 두 개가 Gemini CLI를 구동하므로, 속도가 품질을 희생해야 할 필요가 없습니다.

Gemini CLI로 Gemini 3 Flash 시작하기

오늘부터, Gemini CLI의 대부분 유료 고객은 Gemini 3 Pro와 Gemini 3 Flash 모두에 접근할 수 있습니다. 포함되는 대상은 다음과 같습니다:

  • Google AI Pro 또는 AI Ultra의 모든 비비즈니스 고객
  • Google AI 또는 Vertex를 통해 유료 API 키로 접근 권한을 가진 사용자
  • 프리뷰 모델에 대해 클라우드 관리자가 활성화한 Gemini Code Assist 사용자

무료 티어 사용자에게

  • 이전 대기자 명단에 등록한 모든 사용자는 이미 온보딩되었습니다 – 자세한 내용은 이메일을 확인하세요.
  • 대기자 명단에 없었다면, 우리는 경험을 빠르고 안정적으로 유지하기 위해 추가 접근 권한을 점진적으로 제공하고 있습니다. 계속 지켜보시거나 현재 옵션을 확인하려면 우리의 docs를 확인하세요.

시작하기

  1. Gemini CLI를 최신 버전(≥ 0.21.1)으로 업그레이드합니다:

    npm install -g @google/gemini-cli@latest
  2. 설치된 버전이 0.21.1 이상이면 확인합니다.

  3. /settings 명령을 실행하고 Preview featurestrue로 전환합니다.

  4. 프리뷰 기능을 활성화한 후 /model을 실행하고 Gemini 3를 선택합니다.

    Gemini CLI model selector

이번 릴리스에서는 Gemini 3 패밀리의 전체 기능을 터미널에서 사용할 수 있게 되었습니다. Gemini CLI의 지능형 자동 라우팅을 활용하면 복잡한 추론 작업에 Gemini 3 Pro를 예약하고, 수동 선택기를 사용해 특정 모델을 모든 작업에 할당할 수 있습니다. Gemini 3 Flash의 큰 추론 개선 덕분에 이전에 느린 Pro‑tier 모델이 필요했던 프롬프트를 더 낮은 비용으로 실행할 수 있습니다.

터미널에서 향상된 에이전트 코딩으로 모든 것을 구축하세요

Gemini 3 Flash는 강력한 추론, 도구 활용 및 멀티모달 기능을 통해 코딩 세션의 성능 기준을 높여줍니다.

3D 그래픽이 포함된 바로 배포 가능한 앱 생성

우리는 Gemini CLI에서 Gemini 3 Pro를 사용해 **골든게이트 브리지를 3D 복셀 시뮬레이션으로 구축**했으며, 프롬프트를 창의적 브리프와 기술 사양 모두로 다루었습니다. 그런데 Gemini 3 Flash도 같은 작업을 할 수 있을까요?

이전에는 한 번에 이 정도 수준의 기능 코드를 생성하는 것이 Pro 모델에 더 적합한 작업이었습니다. 예를 들어 Gemini 2.5 Flash는 종종 복잡성을 처리하지 못해 논리가 깨지는 경우가 있었습니다. Gemini 3 Pro의 최첨단 추론은 보다 시각적으로 매력적인 결과를 만들어내지만, Gemini 3 Flash도 정밀하게 작업을 수행할 수 있어, 빠른 프로토타이핑 도구가 코드 품질을 희생할 필요가 없음을 보여줍니다.

Source:

일일 업무 개선

개발 어시스턴트의 진정한 시험은 하루 동안 수행하는 대용량, 실용적인 작업을 어떻게 처리하느냐에 달려 있습니다. Gemini 3 Flash2.5 Pro보다 3배 빠르면서 비용은 일부에 불과합니다(Artificial Analysis 벤치마크 기준).

대용량 컨텍스트 창을 활용한 액션‑코드 변경

대규모 코드베이스를 관리할 때는 수백 개의 PR 댓글을 뒤져야 할 때가 많습니다. 이때 모델은 방대한 컨텍스트 창을 유지하면서도 특정 지시를 놓치지 않아야 합니다.

이 데모에서 Gemini 3 Flash는 1,000개의 댓글이 포함된 가상 풀‑리퀘스트 스레드를 처리합니다. “bikeshedding”이라 불리는 잡담을 가르고, 타임아웃 조정에 관한 단일 핵심 요청을 찾아냅니다. Gemini CLI는 첫 시도에서 정확히 구성 파일을 업데이트하여, 모델이 신호와 잡음을 구분하고 방대한 컨텍스트 창 내에서 정확한 편집을 수행할 수 있음을 보여줍니다.

Video placeholder – “Sorry, your browser doesn’t support playback for this video.”

실제 사용자 트래픽을 시뮬레이션하여 스트레스 테스트

백엔드 인프라를 검증하려면 실제 사용자 행동을 모방한 트래픽이 필요합니다. 하지만 동시성 및 특정 사용자 흐름을 처리하는 맞춤형 부하‑테스트 스크립트를 작성하는 데는 시간이 많이 소요됩니다. 이러한 작업은 Gemini 3 Flash에 적합한데, 구문 환각과 실패 루프를 줄이면서도 빠른 응답을 제공합니다.

이 데모에서는 Gemini CLI를 사용해 Cloud Run에 호스팅된 웹 애플리케이션을 스트레스‑테스트합니다. Gemini 3 Flash는 asyncio를 활용한 파이썬 스크립트를 생성해 세 가지 시나리오에 걸쳐 동시 사용자를 시뮬레이션합니다:

  1. 주문 성공
  2. 결제 실패
  3. 재고 타임아웃

초기 실행에서 프로토콜 오류가 발생하면, 모델이 즉시 트레이스백을 분석하고 스크립트를 수정합니다. 이를 통해 포괄적인 부하 테스트를 바로 시작하고, 몇 초 안에 Cloud Run 대시보드에서 결과 메트릭을 확인할 수 있습니다.

Video placeholder – “Sorry, your browser doesn’t support playback for this video.”

흐름을 더 오래 유지하세요

Gemini 3 Flash는 터미널에서 고빈도 개발 작업을 위한 새로운 성능 기준을 제공합니다. 성능 바닥을 높이고 Gemini CLI의 자동 라우팅과 통합함으로써 더 빠르고 효율적으로 작업할 수 있도록 도와줍니다. 새로운 프로토타입을 만들든 복잡한 인프라를 관리하든, 이제 작업 속도에 맞춰 따라갈 수 있는 개발 어시스턴트가 있습니다.

오늘 Gemini CLI를 업데이트하여 최신 버전으로 전환하고 Gemini 3 Flash와 함께 더 빠르게 — 토큰당 비용을 낮추면서 — 빌드하세요.

Previous | Next

Back to Blog

관련 글

더 보기 »