[Paper] FFT 기반 보간을 이용한 Matrix Inversion 없이 Minimal Problems 해결
camera geometry를 추정하는 것은 일반적으로 multivariate polynomial equations의 시스템으로 구성된 minimal problems를 해결하는 것을 포함하며, 이는 종종 계산적으로 …
camera geometry를 추정하는 것은 일반적으로 multivariate polynomial equations의 시스템으로 구성된 minimal problems를 해결하는 것을 포함하며, 이는 종종 계산적으로 …
사물인터넷(IoT) 및 산업용 사물인터넷(IIoT)의 급속한 확장은 대규모이면서 이질적인 공격 표면을 만들어내어 전통적인 …에 도전한다.
대규모 언어 모델은 autoregressive paradigm 하에서 눈부신 성공을 거두었지만, 고품질 텍스트 생성이 고정된 left‑to‑right 흐름에 얽매일 필요는 없습니다.
Agentic reinforcement learning (RL)은 LLM의 다단계 추론 및 도구 사용 능력을 향상시키는 핵심 동력으로 부상했습니다. 그러나 그 효율성은…
LLM 기반 자율 코딩 에이전트는 소프트웨어 개발을 재편했습니다. 이러한 에이전트가 코드 생성에 뛰어나지만, 장기적인 …에 대한 열린 질문이 여전히 남아 있습니다.
Large Language Model (LLM) 에이전트는 느슨한 사양 하에서 자율 코드 생성에서 강력한 성능을 보여줍니다. 그러나 프로덕션 급 소프트웨어는…
지구상의 생명의 특징은 에이전트가 인과적 파워를 발휘하고 이후 사건들의 드라이버가 될 수 있는 능력이다. 이는 모든 규모의 인지에 핵심이다. 인과적 ...
Hybrid parallelism은 수만 개의 GPU에 걸친 대규모 LLM 훈련의 기반을 제공합니다. 이러한 규모에서는 개별 장치의 하드웨어 오류가 성능에 영향을 미칩니다...
Large language model systems은 추론, tool use, memory, iterative refinement를 교차시키는 agentic workflows로 점점 더 많이 활용되고 있습니다. 이러한 시스템은...
많은 실제 최적화 문제는 고도로 결합된 여러 하위 문제들로 구성되어 있으며, 이들의 해결책을 조정하여 전체 성능을 높여야 합니다. H...
대형 언어 모델(LLM)은 이제 소프트웨어 개발 워크플로에 크게 관여하고 있으며, 이들이 생성하는 코드는 일반적으로 third-party library (TPL)를 포함합니다.
대형 모델이 대화형 어시스턴트에서 자율 에이전트로 진화함에 따라, 장기 의사결정, 도구 사용, 그리고 rea...
개발자들은 관련 기능을 구현하는 코드 위치들에서 비슷한 실수를 자주 저지릅니다. 이러한 위치들을 형제(siblings)라고 부르며, 비슷한 문제를 공유하고 ...
우리는 다섯 가지 속성 유형(memory safety, overflow, termination, reachability, data races)에 걸친 500개의 C 검증 과제에 대한 평가 프레임워크를 소개합니다.
배경: Open source software ecosystems는 구조적으로 중심적인 패키지의 maintenance degradation가 전파될 수 있는 밀집된 dependency networks를 보여준다.
우리는 TACO라는 툴스위트를 제시합니다. 이는 결함 허용 및 임계값 기반 분산 알고리즘의 개발과 자동 검증을 위한 툴스위트입니다. 우리의 툴스위트는 ...
데이터 병렬(DP) 로드 밸런싱은 대규모 LLM 서비스에서 1차 병목 현상으로 떠올랐습니다. 모델이 텐서 병렬을 통해 디바이스에 샤딩될 때...
수년 동안 우리는 LLM 서빙 시스템을 다른 중요한 인프라와 마찬가지로 구축해 왔습니다: 단일 범용 스택, 수많은 엔지니어‑연도에 걸쳐 손수 튜닝된, …
Peak breaking Matrix Multiplication은 특히 LLM 학습 및 추론에서 DL의 성능을 향상시키는 유망한 기술입니다. 우리는 FalconGEMM을 소개합니다, ...
고용량 연관 기억 모델, 예를 들어 Kernel Logistic Regression (KLR) Hopfield networks와 같은 모델은 강력한 저장 능력을 보여주었지만 일반적으로…
Linear Attention (LA)는 자기‑attention의 제곱 복잡성을 피함으로써 대형 언어 모델(LLMs)을 긴 시퀀스로 확장하는 유망한 패러다임을 제공합니다.
우리는 Graph Normalization (GN)을 소개한다. 이는 그래프 위의 원칙적인 동적 시스템으로, NP‑hard인 Maximum Weight 문제에 대한 미분 가능한 근사 엔진 역할을 한다.
Dense 3D reconstruction 및 tracking of dynamic scenes from monocular video는 컴퓨터 비전에서 중요한 미해결 과제로 남아 있습니다. 이 분야의 진전은 …
우리는 이미지 생성용 Diffusion Transformers(DiTs)에서 이상치 토큰을 연구한다. 이전 연구에서는 Vision Transformers(ViTs)가 소량의 ...
본 연구는 Linear Congruential Generator (LCG)의 특수 변형을 기반으로 하는 새로운 결정론적 최적화 알고리즘을 제시한다. 기존 알고리즘...
문법성(Grammaticality)과 가능도(likelihood)는 인간 언어에서 구별되는 개념이다. 사전 학습된 언어 모델(Pretrained language models, LMs)은 언어의 확률적 모델이며…
Long-horizon search agents는 추론하고 도구를 호출하며 정보를 관찰함에 따라 급격히 증가하는 working context를 관리해야 합니다. 모든 중간 결과를 무작정 누적하는 것은…
dtimes d 선형 메모리는 얼마나 많은 키-값 연관을 저장할 수 있을까? 우리는 답이 메모리 행렬의 d² 자유도에만 의존하지 않는다는 것을 보여준다,…
이 논문은 LoViF 2026 PhyScore 챌린지에 대해 보고한다. 이 챌린지는 2D와 4D 유전자를 아우르는 세계 모델이 생성한 비디오에 대한 전체적인 품질 평가를 목표로 하는 대회이다.
딥 서치는 최첨단 멀티모달 에이전트에게 중요한 역량이 되었으며, 모델이 능동적인 검색과 증거 검증을 통해 복잡한 질문을 해결할 수 있게 합니다.
Pre-trained transformers는 프롬프트의 일부로 제공된 예시들로부터 weight updates 없이 학습할 수 있는 놀라운 능력인 in-context learning을 수행할 수 있다.
배경: 기존 MRI LLM 벤치마크는 주로 리뷰 책의 객관식 질문에 의존하고 있으며, 최고 상용 모델들이 이미 높은 점수를 받아 차별성을 제한하고 있다.
Behavior Cloning (BC)은 로봇 학습을 위한 매우 효과적인 패러다임으로 부상했습니다. 그러나 BC는 데모 이후 온라인 개선을 위한 자체 가이드 메커니즘이 부족합니다.
Self-consistency는 질문에 대해 여러 개의 샘플링된 답변을 생성하고 그 일치를 측정함으로써 hallucinations를 감지하지만, 이는 반복적인 decoding과 ca…
Evolutionary computation은 오랫동안 high-performance optimization tools와 Darwinian evolution의 rigorous scientific simulations를 모두 제공할 것이라고 약속해 왔습니다.
Physics‑grounded 3D assets를 합성하는 것은 인터랙티브 가상 세계와 embodied AI에 대한 중요한 병목 현상이다. Existing methods는 주로 static …
Zero-shot anomaly localisation via vision-language models (VLMs)은 희귀 병리 검출을 위한 매력적인 접근법을 제공하지만, 그 성능은 근본적으로…
우리는 22개 언어에 걸친 이진 분류 작업인 SemEval-2026 Task 9: Multilingual Polarization Detection을 위한 시스템을 소개합니다. 우리의 접근 방식은 ...
Transformer 아키텍처는 시계열 예측에 널리 채택되고 있지만, NLP에서 그들을 강력하게 만드는 표현 메커니즘이 실제로…
Learned codecs가 hard‑coded traditional counterparts에 비해 제공하는 주요 차별점 중 하나는 바로 …에 직접 최적화할 수 있는 능력이다.
탈중앙화 금융(DeFi) 프로토콜은 현재 규제된 스테이블코인과 담보로 활용되는 토큰화 자산을 포함해 1,000억 달러 이상의 가치를 중개하고 있다.
이 논문은 고등학생 및 초기 대학생 팀이 대학원 연구자들의 멘토링 아래 수행한 AI 연구 프로젝트를 반영한다...
Large Language Models (LLMs)은 설득력은 있지만 사실이 아닌 내용을 자주 생성하는데, 이는 hallucination이라고 알려진 현상입니다. 기존의 detection methods는 전형적으로…
Multi-Output Gaussian Processes (MOGPs)는 상관된 출력을 모델링하기 위한 원칙적인 확률론적 프레임워크를 제공하지만, 적용할 때 확장성 병목 현상에 직면합니다.
우리는 텍스트 코퍼스의 **Concept Field**를 소개한다: 점별 불확실성을 가진 **local drift field**이며, **sentence‑embedding space**에서 **deltas**를 통해 추정된다.
우리는 45개의 검증된 psychometric questionnaires를 50개의 large language models (LLMs)에 적용하여 LLM이 psychometrically 차이를 보이는 차원을 식별합니다. U...
우리는 장시퀀스 모델을 지배하는 근본적인 트레이드오프를 식별하고 증명한다: 어떤 모델도 (i) 단계별 계산이 시퀀스 길이에 독립적이며, (ii) ... 를 동시에 달성할 수 없다.
최첨단 모델들은 대규모 모델 성능을 비용을 절감하면서 달성하기 위해 Mixture-of-Experts (MoE) 아키텍처를 점점 더 많이 채택하고 있습니다. 그러나 HP에서 MoE 모델을 훈련하는 것은 …