[Paper] Layout Anything:一种用于通用房间布局估计的 Transformer
我们提出 Layout Anything,一个基于 transformer 的室内布局估计框架,它将 OneFormer 的通用分割架构适配到几何…
我们提出 Layout Anything,一个基于 transformer 的室内布局估计框架,它将 OneFormer 的通用分割架构适配到几何…
虽然机器学习已经实现了对具有新颖属性的无机材料的快速预测,但如何合成这些材料的挑战仍然存在。
视频生成的下一个前沿是开发能够进行 zero-shot 推理的模型,其中对 real-world scientific laws 的理解至关重要,以实现……
新视角合成(NVS)在计算机视觉和图形学中至关重要,广泛应用于增强现实(AR)、虚拟现实(VR)和自动驾驶。虽然3D Gaussian Splatting(3D...)
本文关注的是如何加速在自相关数据上训练的 Gaussian process 模型的计算问题。Gaussian process 模型 i...
虽然神经处理单元(NPUs)为边缘AI提供了高理论效率,但针对GPU定制的最先进视觉语言模型(VLMs)常常出现不足……
Move 是一种面向研究的编程语言设计,旨在实现安全且可验证的智能合约开发,并已广泛用于管理数十亿美元的…
最近在推理技术方面的进展显著提升了大型语言模型(LLMs)的性能,提升了人们对它们在…的能力的期望。
调试是软件开发和电路设计中最耗时、最昂贵的任务之一。几种基于公式的故障定位(FBFL)方法……
Diffusion 大语言模型(dLLMs)提供了一种有前景的 autoregressive 模型替代方案,但其实际效用因生成缓慢、迭代……
Test-time policy optimization 使大语言模型(LLMs)能够通过利用自生成 rollouts 的反馈来适应 distribution shifts。然而,...
多数投票已被证明在封闭式问答中通过聚合并行推理轨迹而有效。然而,它并不直接适用于开放式……