[Paper] 从试错中学习:面向 Embodied LLMs 的反思式测试时规划
Embodied LLMs 为机器人赋予高级任务推理能力,但它们无法反思出错的原因或原因,从而使部署变成一系列独立的……
Embodied LLMs 为机器人赋予高级任务推理能力,但它们无法反思出错的原因或原因,从而使部署变成一系列独立的……
高效处理 Transformer 模型中的长序列通常需要通过上下文并行将计算拆分到多个加速器上。The domin...
冷冻电子断层成像(cryo-ET)能够实现对生物结构的高分辨率三维重建,包括膜和膜蛋白……
尽管在 terminal capabilities 方面,大型语言模型最近取得了快速进展,但支撑 state-of-the-art terminal agents 的 training data strategies 仍然……
我们研究最近由~cite{CKKMS24} 引入的 smoothed agnostic learning 的复杂性,其中学习者与目标中的最佳 classifier 竞争……
Pass@k 是一种广泛使用的可验证大语言模型任务的性能指标,包括数学推理、代码生成和简答推理等。
最近的扩散方法由于其强大的视觉生成能力,在从单张图像生成视频方面取得了显著进展。然而,c...
虽然视觉语言模型(VLMs)在二维视觉理解方面表现出色,但它们对三维空间的理解和推理能力——空间的基石——……
Uniform-state discrete diffusion models 在少步生成和引导方面表现出色,因为它们具备自我纠正的能力,使其相较于 autoregressive 模型更受青睐。
基于图的医学图像分割使用边界图来表示解剖结构,提供固定拓扑的标记点和固有的人口层面…
深度学习显著推动了自动化脑肿瘤诊断的发展,但临床采用仍受限于可解释性和计算约束……
文本到图像检索是视觉语言学习中的基础任务,但在真实场景中,它常常受到用户查询简短且信息不足的挑战。