paper — Page 57 | EUNO.NEWS

3周前 · ai

【论文】Web World Models

语言代理日益需要持久的世界，在其中它们可以行动、记忆和学习。现有方法位于两个极端：传统的网络 fra...

#research #paper #ai #machine-learning #nlp #computer-vision
3周前 · ai

[Paper] 端到端 Test-Time Training 用于长上下文

我们将长上下文语言建模定义为持续学习中的一个问题，而不是架构设计。在这种定义下，我们仅使用标准的 a...

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 校准的多层分位数预测

我们提出了一种在线方法，用于同时保证多个分位水平的分位数预测的校准。α水平的分位数预测序列……

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 随机控制微分方程

我们提出了一种训练高效的时间序列学习框架，将随机特征与受控微分方程（CDE）相结合。在这种方法……

#research #paper #ai #machine-learning
3周前 · ai

[Paper] IDT：一种基于物理的 Transformer 用于前馈多视角固有分解

内在图像分解是视觉理解的基础，因为 RGB 图像将材料属性、光照和视角相关效应交织在一起。Rec...

#research #paper #ai #computer-vision
3周前 · ai

[Paper] 少即是多：Probabilistic reduction 最好用 small-scale predictability measures 来解释

本文的主要研究问题集中在定义在研究关系 b 时所需的或适当的上下文量。

#research #paper #ai #nlp
3周前 · ai

[Paper] RoboMirror: 先理解再模仿——从视频到类人机器人行走

人类通过视觉观察学习运动，先解释视觉内容再模仿动作。然而，state-of-the-art humanoid locomotion sy...

#research #paper #ai #computer-vision
3周前 · ai

[Paper] 嵌套浏览器使用学习用于代理式信息寻求

Information-seeking (IS) agents 已在广泛且深入的搜索任务中取得了强劲表现，但它们的工具使用仍然主要局限于 …

#research #paper #ai #machine-learning #nlp
3周前 · ai

[Paper] OmniAgent：音频引导的主动感知代理用于全模态音视频理解

Omnimodal 大语言模型在统一音频和视觉模态方面取得了显著进展；然而，它们往往缺乏细粒度的跨模态理解……

#research #paper #ai #computer-vision
3周前 · ai

[Paper] 通过深度神经网络对得分函数及其导数的同步近似

我们提出了一种同时近似score function及其导数的理论，使得能够处理具有低维结构的数据分布。

#research #paper #ai #machine-learning
3周前 · ai

[Paper] 消费者健康护理问题摘要的数据集与基准

对健康信息的追求已经让网络充斥着消费者的健康相关问题。一般来说，消费者使用过于描述性和外围的……

#research #paper #ai #nlp
3周前 · ai

[Paper] 重新思考端到端 3D 感知的时空对齐

时空对齐对于自动驾驶（AD）中端到端（E2E）感知的时间建模至关重要，能够提供有价值的结构和纹理……

#research #paper #ai #computer-vision

Newer posts

Older posts