Google의 새로운 Gemini Pro 모델이 기록적인 벤치마크 점수 — 다시

발행: (2026년 2월 20일 오전 09:55 GMT+9)
3 분 소요
원문: TechCrunch

Source: TechCrunch

구글 제미니
이미지 출처: Jagmeet Singh / TechCrunch

릴리스 개요

목요일에 Google은 최신 버전의 Gemini Pro, 즉 강력한 LLM인 Gemini 3.1을 출시했습니다. 이 모델은 현재 프리뷰 형태로 제공되고 있으며, 일반 출시가 가까운 시일 내에 예정되어 있습니다.

Gemini 3.1 Pro는 이미 2025년 11월에 출시된 Gemini 3보다 훨씬 향상된 것으로 보이며, 당시 Gemini 3는 매우 뛰어난 AI 도구로 평가받았습니다.

벤치마크 성능

Google은 독립적인 벤치마크 결과를 공유했으며, 특히 Humanity’s Last Exam이라는 테스트에서 Gemini 3.1 Pro가 이전 버전을 크게 앞선다는 점을 보여주었습니다.

이 모델은 AI 스타트업 Mercor의 CEO인 Brendan Foody에 의해 또한 강조되었습니다. Foody의 벤치마크 시스템 APEX는 새로운 AI 모델이 실제 전문 작업을 얼마나 잘 수행하는지를 측정합니다. 그는 소셜 미디어 게시물에서 다음과 같이 언급했습니다:

“Gemini 3.1 Pro가 이제 APEX‑Agents 리더보드 상단에 올랐습니다,”
— Brendan Foody, X 게시물

그는 또한 이 결과가 “에이전트가 실제 지식 작업에서 얼마나 빠르게 개선되고 있는지”를 보여준다고 덧붙였습니다.

산업적 맥락

이번 릴리스는 AI 모델 전쟁이 격화되는 시점에 이루어졌으며, 기술 기업들이 에이전트 기반 작업 및 다단계 추론에 최적화된 점점 더 강력한 LLM을 출시하기 위해 경쟁하고 있습니다. OpenAI와 Anthropic과 같은 주요 플레이어들도 최근 새로운 모델을 선보이며 경쟁을 더욱 뜨겁게 만들고 있습니다.

0 조회
Back to Blog

관련 글

더 보기 »