자율 수학 연구를 향해

발행: 3일 전 (2026년 2월 16일 오전 03:35 GMT+9)

4 분 소요

Source: Hacker News

Authors: Tony Feng, Trieu H. Trinh, Garrett Bingham, Dawsen Hwang, Yuri Chervonyi, Junehyuk Jung, Joonkyung Lee, Carlo Pagano, Sang‑hyun Kim, Federico Pasqualotto, Sergei Gukov, Jonathan N. Lee, Junsu Kim, Kaiying Hou, Golnaz Ghiasi, Yi Tay, YaGuang Li, Chenkai Kuang, Yuan Liu, Hanzhao Lin, Evan Zheran Liu, Nigamaa Nayakanti, Xiaomeng Yang, Heng‑Tze Cheng, Demis Hassabis, Koray Kavukcuoglu, Quoc V. Le, Thang Luong

View PDF | HTML (experimental)

Abstract

최근 기초 모델의 발전으로 국제 수학 올림피아드에서 금메달 수준에 도달하는 추론 시스템이 등장했습니다. 그러나 대회 수준의 문제 해결에서 전문 연구로 전환하려면 방대한 문헌을 탐색하고 장기적인 증명을 구성해야 합니다. 본 연구에서는 Aletheia라는 수학 연구 에이전트를 소개합니다. 이 에이전트는 자연어로 솔루션을 반복적으로 생성·검증·수정하는 엔드‑투‑엔드 파이프라인을 갖추고 있습니다. 구체적으로 Aletheia는 어려운 추론 문제를 해결하기 위한 Gemini Deep Think의 고급 버전, 올림피아드 수준을 넘어서는 추론‑시점 스케일링 법칙, 그리고 수학 연구의 복잡성을 탐색하기 위한 집중적인 도구 활용을 기반으로 합니다.

우리는 Aletheia가 올림피아드 문제부터 박사 수준 연습문제까지, 그리고 특히 AI‑지원 수학 연구의 여러 중요한 이정표를 달성하는 능력을 보여줍니다:

(a) AI만으로 인간 개입 없이 산술 기하학에서 eigenweights라 불리는 특정 구조 상수를 계산한 연구 논문 (Feng26);
(b) 인간‑AI 협업을 통해 independent sets라 불리는 상호작용 입자 시스템에 대한 경계를 증명한 연구 논문 (LeeSeo26);
(c) Bloom’s Erdos Conjectures 데이터베이스에 있는 700개의 미해결 문제에 대한 광범위한 반자동 평가 (Feng et al., 2026a), 여기에는 네 개의 미해결 질문에 대한 자율적 해결책이 포함됩니다.

AI와 수학의 발전을 대중이 더 잘 이해하도록 돕기 위해, 우리는 AI‑지원 결과의 자율성 수준과 새로움 정도를 정량화할 것을 제안하고, 투명성을 위한 human‑AI interaction cards라는 새로운 개념을 제시합니다. 마지막으로 수학에서 인간‑AI 협업에 대한 고찰을 제시하고, 모든 프롬프트와 모델 출력물을 GitHub 저장소에서 공유합니다.

Comments

35 페이지. 관련 블로그 게시물: Accelerating mathematical and scientific discovery with Gemini Deep Think

Subjects

Machine Learning (cs.LG)
Artificial Intelligence (cs.AI)
Computation and Language (cs.CL)
Computers and Society (cs.CY)

Citation

arXiv:2602.10177 – (cs.LG)
DOI:

Submission history

v1 – Tue, 10 Feb 2026 18:50:15 UTC (2,611 KB) – submitted by Thang Luong
v2 – Thu, 12 Feb 2026 18:27:29 UTC (2,612 KB) – submitted by Thang Luong

자율 수학 연구를 향해

Abstract

Comments

Subjects

Citation

Submission history

관련 글

X의 피드 알고리즘이 정치에 미치는 영향

Show HN: Claude Code용 Strava

R3forth: ColorForth에서 파생된 연결형 언어

R3forth: ColorForth에서 파생된 연결형 언어