AI reasoning

1개월 전 · ai

AI의 과학 연구 작업 수행 능력 평가

OpenAI는 물리학, 화학, 생물학에서 AI 추론을 테스트하는 벤치마크인 FrontierScience를 도입하여 실제 과학 연구에 대한 진전을 측정합니다....

#OpenAI #FrontierScience #AI benchmark #scientific research #physics #chemistry #biology #AI reasoning
1개월 전 · ai

Gemini 3을 위한 새로운 Gemini API 업데이트

Gemini 3, 우리 가장 지능적인 모델이 이제 Gemini API를 통해 개발자에게 제공됩니다. 최첨단 추론, 자율 코딩, 멀티모달…

#Gemini 3 #Gemini API #thinking_level #multimodal AI #autonomous coding #agentic capabilities #Google AI #large language model #AI reasoning
1개월 전 · ai

GPT-5.2 첫인상: 강력한 업데이트, 특히 비즈니스 작업 및 워크플로에

OpenAI가 공식적으로 GPT-5.2를 출시했으며, 초기 테스터들의 반응은 — 이들 중 일부는 공개 출시 며칠 전에 OpenAI가 모델을 시드한 사람들입니다 — ...

#GPT-5.2 #OpenAI #large language model #AI reasoning #AI coding #business workflows #LLM updates
1개월 전 · ai

GPT‑5.2를 소개합니다

GPT-5.2는 일상적인 전문 업무를 위한 가장 진보된 frontier 모델이며, state-of-the-art reasoning, long-context understanding, coding, vision을 갖추고 있습니다. 사용…

#GPT-5.2 #OpenAI #large language model #LLM #AI reasoning #coding assistance #vision model #API #agentic workflows
1개월 전 · ai

AI 추론을 열다: 모듈식 인지의 힘

소개 AI가 블랙 박스인가요? 디버깅이 어렵고 적응하기 힘든 복잡한 시스템에 좌절하고 있나요? 만약 여러분이 지능형 시스템을 구축할 수 있다면...

#modular AI #cognitive architecture #AI reasoning #explainability #AI development
1개월 전 · ai

대형 언어 모델이 어려운 문제를 생각하는 더 스마트한 방법

이 새로운 기술은 LLM이 질문의 난이도에 따라 추론에 사용하는 계산량을 동적으로 조정할 수 있게 합니다....

#large language models #dynamic computation #adaptive inference #AI reasoning #MIT research
1개월 전 · ai

AI 모델, Putnam을 거의 만점에 가깝게: 진정한 파괴는 우리가 사고하는 방식이다

AI 모델이 푸트남 시험에서 거의 완벽에 가까운 점수를 받다. 최근 한 AI 수학 모델이 가장 어려운 인간 시험 중 하나에서 118/120점을 기록했다. 문제를 푸는 것을 넘어, 그것은 …

#Putnam exam #AI reasoning #self‑verification #proof generation #math AI #model self‑correction #large language models
1개월 전 · ai

HATEOAS처럼 생각하기: Agentic RAG가 지식을 동적으로 탐색하는 방법

표지 이미지: Think Like HATEOAS: How Agentic RAG Dynamically Navigates Knowledge https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=...

#RAG #Agentic RAG #Retrieval Augmented Generation #LLM #HATEOAS #AI reasoning #knowledge navigation #prompt engineering
1개월 전 · ai

o4-mini와 o4-mini-high에 대해 읽으면서 “작은” AI 모델을 다시 생각하게 되었다

나는 OpenAI의 o4-mini와 o4-mini-high에 대한 Makiai 기사에 들어가서, 스쳐 지나가며 잊어버릴 benchmarks로 가득한 또 다른 기술 분석을 기대했다. 대신…

#openai #small language models #o4-mini #AI reasoning #model comparison
1개월 전 · ai

[Paper] 에이전시 학습자와 Grow-and-Refine 다중모달 의미 메모리

MLLMs는 개별 질의에 대해 강력한 추론 능력을 보여주지만, de novo 방식으로 작동하여 각 문제를 독립적으로 해결하고 종종 같은 실수를 반복합니다. Existi...

#multimodal memory #lifelong learning #large multimodal models #semantic memory #AI reasoning