[Paper] 다수 의견을 가진 미결정 상태 역학
우리는 Undecided-State Dynamics (USD)를 연구한다. 이는 각 정점이 k개의 결정된 의견 중 하나 또는 미결정 상태를 가질 수 있는 기본적인 합의 과정이다. 우리는 ...
4528 posts from this source
우리는 Undecided-State Dynamics (USD)를 연구한다. 이는 각 정점이 k개의 결정된 의견 중 하나 또는 미결정 상태를 가질 수 있는 기본적인 합의 과정이다. 우리는 ...
자동화된 C-to-Rust 마이그레이션은 코드 스니펫에서 산업 프로젝트로 규모를 확장할 때 시스템적인 장애물에 직면합니다. 주로 빌드 컨텍스트가 종종 제공되지 않기 때문입니다.
대규모 AI/ML 훈련 시스템은 거의 검토되지 않는 두 가지 가정에 의존한다: (1) 체크포인트가 global training state의 원자적 스냅샷을 나타낸다는 것, ...
sequential에서 parallel computing으로의 전환은 현대 high‑performance applications에 필수적이지만, 동시성의 가파른 learning curve 때문에 방해받는다.
인간과 제품이 결합된 모습을 보여주는 인간‑제품 이미지(Human‑product images)는 광고, 전자상거래(e‑commerce), 디지털 마케팅에서 중요한 역할을 합니다. 필수적인 …
검증 가능한 상징 데이터에 대한 학습은 표준 사전 학습 코퍼스가 제공하는 것보다 언어 모델의 추론 한계를 확장하는 유망한 방법이다. Y...
Selective conformal prediction은 테스트 예시와 교환 가능(exchangeable)한 보정 예시(calibration examples)를 식별할 수 있을 때, 훨씬 더 타이트한 불확실성 집합(uncertainty sets)을 제공할 수 있다.
테스트 시 강화 학습(TTRL)은 자체 진화하는 대규모 추론 모델(LRMs)을 위한 유망한 패러다임으로 부상했으며, 라벨이 없는 데이터에 대한 온라인 적응을 가능하게 합니다.
Sudoku와 ARC-AGI와 같은 추론 문제는 신경망에게 여전히 도전 과제이다. 구조화된 문제 해결 아키텍처 패밀리인 Recurrent Reasoning …
우리는 Sketch2Colab을 소개한다. 이는 스토리보드 스타일 2D 스케치를 일관된 객체 인식이 가능한 3D 다중 인간 모션으로 변환하며, 에이전트와 관절에 대한 세밀한 제어를 제공한다.
대규모 언어 모델에서 장기 컨텍스트 추론은 디코딩 단계에서 Key--Value (KV) 캐시 로딩에 의해 병목 현상이 발생합니다. 여기서 순차적인 특성 때문에 …
멀티 어트리뷰션 러닝(MAL)은 여러 attribution 메커니즘에서 생성된 conversion 라벨을 학습함으로써 모델 성능을 향상시키며, …으로 부상하고 있다.
Reservoir expansion은 비선형 혼합 하에서 온라인 독립 성분 분석(ICA)을 개선할 수 있지만, top‑n whitening은 주입된 특징을 버릴 수 있습니다. We formal…
Claude 에이전트 스킬의 급속한 확산은 에이전트 스킬 생태계를 효과적으로 활용하고 관리하며 확장하는 방법에 대한 핵심 질문을 제기했습니다. In t...
Instruction-based video editing은 급속한 발전을 이루었지만, 현재 방법들은 자연어가 본질적으로 … 때문에 정밀한 시각적 제어에 어려움을 겪는다.
SageAttention와 같은 Low-bit attention은 모델 추론을 가속화하는 효과적인 접근법으로 부상했지만, 학습에 대한 적용 가능성은 여전히 낮다.
멀티모달 생존 예측 모델은 점점 더 정확해지고 있지만, 그 복잡성 때문에 해석 가능성이 감소하여 서로 다른 요소가 어떻게 영향을 미치는지에 대한 통찰이 제한됩니다.
Retrieval-Augmented Generation (RAG) 시스템은 일반적으로 multi‑query retrieval와 reciprocal rank fusion (RRF)과 같은 retrieval fusion 기술을 채택하여 …
범죄 관련 문서에서 중요한 정보를 추출하는 것은 법 집행 기관에게 매우 중요한 과제입니다. Named-Entity Recognition (NER)은 ...
스케일링 법칙은 더 많은 데이터로 훈련된 대형 모델이 일관되게 소형 모델보다 성능이 우수하다고 가정합니다—이는 컴퓨터 비전에서 모델 선택을 주도하는 가정이지만 …
현대 언어 모델은 제한된 컨텍스트 내에서 추론하며, 이는 장기 추론에 대한 근본적인 장벽이 되는 고유한 제약입니다. 우리는 재귀를 ...
Think-Answer 리저버와 같은 DeepSeek‑R1은 해석 가능한 내부 추론을 활용하여 눈에 띄는 진전을 이루었습니다. 그러나 빈번하게 존재하는 ...
멀티모달 검색은 이질적인 모달리티에 걸친 쿼리에서 정보를 집계하여 원하는 타깃을 검색하는 작업이다. 최첨단 멀티모달…
대규모 언어 모델과 멀티모달 기반 모델의 빠른 채택으로 인해 멀티모달 데이터 준비 파이프라인은 중요한 AI 인프라가 되었습니다. 이러한 pi...
우리는 n개의 파티가 서로 secure channels 로 연결된 asynchronous network 를 고려한다. 이 중 최대 t개는 byzantine이다. 우리는 common coin tossing 을 연구한다, …
클라우드 네이티브 시스템의 역동성과 복잡성은 Root Cause Analysis (RCA)에 상당한 도전을 제시합니다. 인과관계 기반 RCA 방법은 …
최첨단 대형 언어 모델(LLM)인 GPT-5와 Gemini-2.5에 대한 접근은 종종 높은 가격, 결제 장벽 및 지역 제한으로 인해 방해받습니다. T...
우리는 시간 전반에 걸쳐, 높은 확률로, stochastic gradient 로 훈련된 two-layer neural network 의 예측 간 불일치를 정량화한다.
도구 사용 에이전트를 훈련하는 것은 일반적으로 결과 기반 필터링에 의존한다: 성공적인 궤적에 대한 Supervised Fine-Tuning (SFT)과 Reinforcement Learning (RL) …
우리는 Legal RAG Bench를 소개한다. 이는 법률 RAG 시스템의 엔드‑투‑엔드 성능을 평가하기 위한 벤치마크 및 평가 방법론이다. 벤치마크로서 Legal RAG Bench는…
Large language models (LLMs)은 자연어 처리와 전반적인 인공지능에 필수적인 도구가 되었습니다. 현재 오픈소스 모델은...
밀집된 바이오메디컬 임베딩은 강력한 성능을 달성하지만, 그 블랙박스 특성은 임상 의사결정에서의 활용도를 제한합니다. 최근 질문 기반 인…
공유 L1 메모리 클러스터는 간소화된 명령어 프로세서(처리 요소 - PEs)로 구성되며, 현대의 대규모 병렬 컴퓨팅에서 일반적으로 빌딩 블록으로 사용됩니다.
현대 소프트웨어는 개발 과정을 간소화하기 위해 third-party software libraries에 크게 의존합니다. 하나의 라이브러리를 유사한 대체 라이브러리로 교체하는 행위는 ...
학술 회의의 carbon footprint는 점점 더 많은 논쟁의 주제가 되고 있다. 회의에 참석함으로써 얻는 이점을 고려하는 것이 중요하다.
이것은 The Semantic Arrow of Time을 구성하는 다섯 편 중 첫 번째 논문이다. 논증은 다음과 같은 주장으로 시작한다: computing's arrow of time은 semantic이며, thermod…
메시지 전달은 분산 시스템의 기본 원시 연산으로 널리 가정됩니다. 이 논문은 기존 메시지 시스템이 범주 불일치를 내포하고 있다고 주장합니다.
Speculative Decoding (SD)는 토큰 생성을 빠른 초안으로 분리함으로써 대형 언어 모델 (Large Language Model, LLM) 추론을 가속화하는 주요 기술로 부상했습니다.
제한된 예산 하에서 능동적인 pairwise comparisons를 사용해 아이템 집합 중 승자를 결정하는 것은 preference-based learning에서 도전적인 문제입니다. The go...
이 논문은 손글씨 숫자 인식을 위한 생물학적으로 동기 부여된 로컬 러닝에 대한 통제된 실증 연구를 제시한다. 우리는 STDP 영감을 받은 compet...
포즈가 지정되지 않은 이미지에서의 고밀도 4D 재구성은 여전히 중요한 과제이며, 현재 방법들은 느린 테스트‑타임 최적화에 의존하거나 단편적이고 작업‑특화된…
초에서 분 단위로 비디오 생성 규모를 확장하는 것은 중요한 병목 현상에 직면합니다: short‑video 데이터는 풍부하고 high‑fidelity하지만, coherent long‑form data는 …
Adam 및 Muon과 같은 최신 옵티마이저는 대규모 언어 모델을 훈련하는 데 핵심적이지만, 1차 및 2차 모멘텀에 의존함으로써 상당한…
Transformers는 최근 시퀀스 모델링에서 대부분의 진보를 이끄는 사실상의 백본으로 확립되었으며, 주로 그들의 확장되는 메모리 용량 때문에 …
표현 학습에서 식별 가능성은 일반적으로 알려진 실제 요인이 있는 합성 벤치마크에서 표준 메트릭(예: MCC, DCI, R^2)을 사용하여 평가됩니다.
많은 독자들은 오늘날 신뢰할 수 있는 보도가 허위 정보와 공존하기 때문에 온라인 뉴스의 신뢰성을 평가하는 데 어려움을 겪고 있습니다. TREC 2025 DRAGUN (Detectio...
Diffusion 기반 Real-World Image Super-Resolution (Real-ISR)은 인상적인 지각 품질을 달성하지만, 반복적인 과정으로 인한 높은 계산 비용이 문제입니다.
GPU-accelerated 서버 플랫폼은 대부분의 하드웨어 아키텍처를 공유하지만, 사소한 하드웨어 차이 때문에 별도의 펌웨어 이미지가 필요합니다—다양…