[Paper] Layout Anything: 범용 방 레이아웃 추정을 위한 하나의 트랜스포머
우리는 Layout Anything을 제시한다. 이는 실내 레이아웃 추정을 위한 트랜스포머 기반 프레임워크로, OneFormer의 범용 세그멘테이션 아키텍처를 기하…
우리는 Layout Anything을 제시한다. 이는 실내 레이아웃 추정을 위한 트랜스포머 기반 프레임워크로, OneFormer의 범용 세그멘테이션 아키텍처를 기하…
머신 러닝이 새로운 특성을 가진 무기 물질의 빠른 예측을 가능하게 했지만, 이러한 물질을 합성하는 방법을 결정하는 과제는 …
비디오 생성의 다음 경계는 제로샷 추론이 가능한 모델을 개발하는 데 있으며, 실제 세계의 과학 법칙을 이해하는 것이 …에 필수적이다.
Novel view synthesis (NVS)는 컴퓨터 비전 및 그래픽스에서 매우 중요하며, AR, VR, 자율 주행 등 다양한 분야에 널리 활용됩니다. 반면에 3D Gaussian Splatting (3D...
이 논문은 자기상관 데이터에 대해 학습된 Gaussian process 모델의 계산 속도를 높이는 방법에 관한 문제를 다룬다. Gaussian process 모델 i...
Neural Processing Units (NPUs)가 엣지 AI에 대해 높은 이론적 효율성을 제공하는 반면, GPU에 맞게 설계된 최첨단 Vision--Language Models (VLMs)는 종종 falt...
Move는 보안 및 검증 가능한 스마트 계약 개발을 위한 연구 중심 프로그래밍 언어 설계이며, 수십억의 di... 관리에 널리 사용되어 왔습니다.
최근 추론 기술의 발전은 대형 언어 모델(LLMs)의 성능을 크게 향상시켰으며, 이들의 능력에 대한 기대를 높이고 있습니다.
디버깅은 소프트웨어 개발 및 회로 설계에서 가장 시간과 비용이 많이 드는 작업 중 하나입니다. 여러 공식 기반 결함 위치 지정(FBFL) 방법…
Diffusion large language models (dLLMs)은 autoregressive 모델에 대한 유망한 대안을 제공하지만, 그 실용성은 느린 반복적인 과정 때문에 크게 제한됩니다.
Test-time policy optimization은 대규모 언어 모델(LLMs)이 자체 생성 롤아웃으로부터의 피드백을 활용하여 분포 변화에 적응하도록 합니다. 그러나,…
Majority voting은 parallel reasoning traces를 집계함으로써 close-ended question answering에 효과적인 것으로 입증되었습니다. 그러나 이는 open...