· ai
【论文】Web World Models
语言代理日益需要持久的世界,在其中它们可以行动、记忆和学习。现有方法位于两个极端:传统的网络 fra...
语言代理日益需要持久的世界,在其中它们可以行动、记忆和学习。现有方法位于两个极端:传统的网络 fra...
我们将长上下文语言建模定义为持续学习中的一个问题,而不是架构设计。在这种定义下,我们仅使用标准的 a...
我们提出了一种在线方法,用于同时保证多个分位水平的分位数预测的校准。α水平的分位数预测序列……
我们提出了一种训练高效的时间序列学习框架,将随机特征与受控微分方程(CDE)相结合。在这种方法……
内在图像分解是视觉理解的基础,因为 RGB 图像将材料属性、光照和视角相关效应交织在一起。Rec...
本文的主要研究问题集中在定义在研究关系 b 时所需的或适当的上下文量。
人类通过视觉观察学习运动,先解释视觉内容再模仿动作。然而,state-of-the-art humanoid locomotion sy...
Information-seeking (IS) agents 已在广泛且深入的搜索任务中取得了强劲表现,但它们的工具使用仍然主要局限于 …
Omnimodal 大语言模型在统一音频和视觉模态方面取得了显著进展;然而,它们往往缺乏细粒度的跨模态理解……
我们提出了一种同时近似score function及其导数的理论,使得能够处理具有低维结构的数据分布。
对健康信息的追求已经让网络充斥着消费者的健康相关问题。一般来说,消费者使用过于描述性和外围的……
时空对齐对于自动驾驶(AD)中端到端(E2E)感知的时间建模至关重要,能够提供有价值的结构和纹理……