[Paper] Reasoning Core: 스케일러블 절차적 데이터 생성 스위트 for Symbolic Pre‑training and Post‑Training
검증 가능한 상징 데이터에 대한 학습은 표준 사전 학습 코퍼스가 제공하는 것보다 언어 모델의 추론 한계를 확장하는 유망한 방법이다. Y...
검증 가능한 상징 데이터에 대한 학습은 표준 사전 학습 코퍼스가 제공하는 것보다 언어 모델의 추론 한계를 확장하는 유망한 방법이다. Y...
Selective conformal prediction은 테스트 예시와 교환 가능(exchangeable)한 보정 예시(calibration examples)를 식별할 수 있을 때, 훨씬 더 타이트한 불확실성 집합(uncertainty sets)을 제공할 수 있다.
테스트 시 강화 학습(TTRL)은 자체 진화하는 대규모 추론 모델(LRMs)을 위한 유망한 패러다임으로 부상했으며, 라벨이 없는 데이터에 대한 온라인 적응을 가능하게 합니다.
Sudoku와 ARC-AGI와 같은 추론 문제는 신경망에게 여전히 도전 과제이다. 구조화된 문제 해결 아키텍처 패밀리인 Recurrent Reasoning …
우리는 Sketch2Colab을 소개한다. 이는 스토리보드 스타일 2D 스케치를 일관된 객체 인식이 가능한 3D 다중 인간 모션으로 변환하며, 에이전트와 관절에 대한 세밀한 제어를 제공한다.
대규모 언어 모델에서 장기 컨텍스트 추론은 디코딩 단계에서 Key--Value (KV) 캐시 로딩에 의해 병목 현상이 발생합니다. 여기서 순차적인 특성 때문에 …
멀티 어트리뷰션 러닝(MAL)은 여러 attribution 메커니즘에서 생성된 conversion 라벨을 학습함으로써 모델 성능을 향상시키며, …으로 부상하고 있다.
Reservoir expansion은 비선형 혼합 하에서 온라인 독립 성분 분석(ICA)을 개선할 수 있지만, top‑n whitening은 주입된 특징을 버릴 수 있습니다. We formal…
Claude 에이전트 스킬의 급속한 확산은 에이전트 스킬 생태계를 효과적으로 활용하고 관리하며 확장하는 방법에 대한 핵심 질문을 제기했습니다. In t...
Instruction-based video editing은 급속한 발전을 이루었지만, 현재 방법들은 자연어가 본질적으로 … 때문에 정밀한 시각적 제어에 어려움을 겪는다.
SageAttention와 같은 Low-bit attention은 모델 추론을 가속화하는 효과적인 접근법으로 부상했지만, 학습에 대한 적용 가능성은 여전히 낮다.
Retrieval-Augmented Generation (RAG) 시스템은 일반적으로 multi‑query retrieval와 reciprocal rank fusion (RRF)과 같은 retrieval fusion 기술을 채택하여 …