Gemini 3 Flash와 함께 구축하세요, 당신과 함께 확장되는 최전선 인텔리전스
Source: Dev.to

Source: …
Gemini 3 Flash 소개
오늘은 Gemini 3 Flash(https://blog.google/products/gemini/gemini-3-flash)를 소개합니다. 이 최신 모델은 비용의 일부만으로 속도를 위해 설계된 최첨단 인텔리전스를 제공합니다. 3 Pro의 강력한 멀티모달, 코딩, 에이전트 기능을 기반으로 하며, 3 Flash는 3 Pro 비용의 ¼ 이하로 강력한 성능을 제공하고, 더 높은 호출 제한을 지원합니다. 새로운 3 Flash 모델은 많은 벤치마크에서 2.5 Pro를 능가하면서도 더 빠른 속도를 제공합니다. 또한 가장 진보된 시각 및 공간 추론(세부 정보)을 갖추었으며, 이제 코드 실행(문서)을 지원해 시각 입력을 확대, 개수 세기, 편집할 수 있습니다.
Gemini 3 Flash는 다음을 통해 개발자에게 제공됩니다:
- Google AI Studio – 새 채팅 시작
- Google Antigravity – 공지 읽기
- Gemini CLI – 블로그 게시물
- Android Studio – 스마트 앱 빌드
- Vertex AI – 엔터프라이즈 제공
더 똑똑하고, 더 빠르며, 대규모 프로덕션에 준비된
Gemini 3 Flash는 **GPQA Diamond (90.4 %)**와 Humanity’s Last Exam (툴 없이 33.7 %) 같은 박사 수준 추론 및 지식 벤치마크에서 최첨단 성능을 제공하며, 훨씬 더 큰 최첨단 모델과 경쟁합니다.
Gemini 3 Flash는 지능을 희생하지 않으면서도 높은 효율성을 제공하여 성능 대비 비용의 Pareto frontier를 앞당깁니다. Artificial Analysis 벤치마크에 따르면 2.5 Pro보다 3배 빠르게(비용은 훨씬 낮게) 뛰어납니다. 가장 낮은 thinking level(문서)에서도 3 Flash는 종종 “high” thinking level로 설정된 이전 버전보다 우수한 성능을 보입니다.
가격 및 비용 절감 기능
- 가격 (Gemini API & Vertex AI)
- 입력 토큰 1 M당 $0.50
- 출력 토큰 1 M당 $3
- 오디오 입력은 여전히 입력 토큰 1 M당 $1
- 컨텍스트 캐싱 – 특정 임계값을 초과하는 반복 토큰 사용 시 90 % 비용 절감.
- 배치 API – 50 % 비용 절감 및 비동기 처리에 대한 높은 속도 제한 제공.
- 프로덕션 준비된 속도 제한 – 동기 및 근실시간 사용 사례에서 유료 API 고객에게 제공.
Gemini 3 Flash 작동 예시
Gemini 3 Flash가 이제 우리 제품 다수에 통합되었으며, 초기 고객들은 새로운 가능성에 대해 열광하고 있습니다.
코딩용
Gemini 3 Flash는 이전 버전보다 향상된 코딩 및 에이전트 기능을 제공하여 빠르고 반복적인 개발을 가능하게 합니다. 3 Pro의 에이전트 코딩 스킬(SWE‑bench Verified 기준 78 %)을 능가하면서도 더 빠르게 작동해 신속한 반복이 가능합니다. 오늘날 3 Flash는 Google Antigravity라는 새로운 에이전트 개발 플랫폼 사용자에게 출시되어, 생각의 흐름에 맞춰 지능형 코딩 지원을 제공합니다.
게임용
Gemini 3 Flash는 게임 개발자에게 강력한 성능을 제공하며, 뛰어난 비디오 분석과 거의 실시간에 가까운 추론을 통해 2.5 시리즈보다 우수한 결과를 보여줍니다.
- Astrocade는 3 Flash를 사용해 에이전트 기반 게임 제작 엔진을 구현하고, 단일 프롬프트만으로 전체 게임 플랜과 실행 가능한 코드를 생성해 개념을 몇 초 만에 플레이 가능한 게임으로 전환합니다.
- Latitude는 3 Flash를 활용해 더 똑똑한 캐릭터와 보다 현실적인 세계를 생성함으로써 게임플레이를 향상시키면서 비용을 낮게 유지합니다. 이제 엔진은 이전에 Sonn과 같은 프로 수준 모델이 필요했던 복잡한 작업도 처리할 수 있습니다.
Gemini 3 Flash – 개발자와 기업 모두에게 속도, 지능, 비용 효율성의 최적 균형을 제공합니다.
Gemini 3 Flash 하이라이트
Nick Walton
CEO, Latitude
딥페이크 탐지를 위해
Resemble AI는 Gemini 3 Flash를 사용하여 복잡한 포렌식 데이터를 즉시 간단한 설명으로 변환함으로써 거의 실시간 딥페이크 인텔리전스를 제공하고 있습니다. 그들은 Gemini 3 Flash가 Gemini 2.5 Pro에 비해 4× 빠른 멀티모달 분석을 제공하며, 원시 기술 출력을 처리하면서도 중요한 워크플로우를 방해하지 않는다는 것을 발견했습니다. 자세한 내용은 그들의 사례 연구를 참고하세요.
문서 분석을 위해
성능 향상은 종종 지연 시간과의 트레이드오프를 동반하지만, Gemini 3 Flash는 빠른 모델도 법률 산업의 엄격한 정확도 요구를 충족할 수 있음을 증명합니다. 속도를 희생하지 않는 강력한 추론 능력을 갖춘 이 모델은 법률 사무소 및 전문 서비스 제공자를 위한 AI 기업인 Harvey의 복잡한 문서 분석 효율성을 새로운 수준으로 끌어올립니다.
Gemini 3 Flash는 추론 능력에서 의미 있는 도약을 이루어, 이전 모델인 Gemini 2.5 Flash에 비해 Harvey의 BigLaw Bench에서 7 % 이상 향상되었습니다. 이러한 품질 개선과 Flash의 낮은 지연 시간이 결합되어 계약서에서 정의된 조항 및 교차 참조를 추출하는 고볼륨 법률 작업에 큰 영향을 미칩니다.
Niko Grupen
Harvey 응용 연구 책임자
Gemini 3 Flash 시작하기
Gemini 3 Flash는 우리 제품, API 및 전체 생태계에서 사용할 수 있습니다. Gemini 3 제품군을 탐색하면서 다음을 할 수 있습니다:
- 새로운 내장 API 로그 시각화 대시보드 사용하기.
- Google AI Studio를 통해 모델 피드백을 직접 전송하기.
- 3 Flash는 추론 모델이므로 **API에서 생각을 순환시키기**하거나 새로운 **Interactions API**를 사용하세요.
Gemini 3 Flash에 접근할 수 있는 곳
이 모델을 여러분에게 제공하게 되어 기쁘며, Gemini 3 Flash로 어떤 작품을 만들지 기대됩니다.

