AI의 과학 연구 작업 수행 능력 평가
발행: (2025년 12월 16일 오후 06:00 GMT+9)
1 min read
원문: OpenAI Blog
Source: OpenAI Blog
Summary
OpenAI는 물리학, 화학 및 생물학에서 AI 추론을 테스트하는 벤치마크인 FrontierScience를 소개하여 실제 과학 연구에 대한 진전을 측정합니다.
Source: OpenAI Blog
OpenAI는 물리학, 화학 및 생물학에서 AI 추론을 테스트하는 벤치마크인 FrontierScience를 소개하여 실제 과학 연구에 대한 진전을 측정합니다.
OpenAI가 공식적으로 GPT-5.2를 출시했으며, 초기 테스터들의 반응은 — 이들 중 일부는 공개 출시 며칠 전에 OpenAI가 모델을 시드한 사람들입니다 — ...
GPT‑5.2는 OpenAI의 수학·과학 분야에서 가장 강력한 모델로, GPQA Diamond와 FrontierMath와 같은 벤치마크에서 새로운 최첨단 결과를 달성했습니다. 이 게시물은…
GPT-5.2는 일상적인 전문 업무를 위한 가장 진보된 frontier 모델이며, state-of-the-art reasoning, long-context understanding, coding, vision을 갖추고 있습니다. 사용…
나는 OpenAI의 o4-mini와 o4-mini-high에 대한 Makiai 기사에 들어가서, 스쳐 지나가며 잊어버릴 benchmarks로 가득한 또 다른 기술 분석을 기대했다. 대신…