research — Page 20

排序:

1周前 · ai · - · -

[Paper] 从试错中学习：面向 Embodied LLMs 的反思式测试时规划

Embodied LLMs 为机器人赋予高级任务推理能力，但它们无法反思出错的原因或原因，从而使部署变成一系列独立的……

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] Untied Ulysses：内存高效上下文并行 via Headwise Chunking

高效处理 Transformer 模型中的长序列通常需要通过上下文并行将计算拆分到多个加速器上。The domin...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 冷冻电子断层成像中膜的感兴趣区域分割与形态学分析

冷冻电子断层成像（cryo-ET）能够实现对生物结构的高分辨率三维重建，包括膜和膜蛋白……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 关于数据工程以扩展 LLM 终端能力

尽管在 terminal capabilities 方面，大型语言模型最近取得了快速进展，但支撑 state-of-the-art terminal agents 的 training data strategies 仍然……

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 统计查询下界用于平滑不可知学习

我们研究最近由~cite{CKKMS24} 引入的 smoothed agnostic learning 的复杂性，其中学习者与目标中的最佳 classifier 竞争……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 为什么 Pass@k 优化会削弱 Pass@1：LLM 后训练中的 Prompt 干扰

Pass@k 是一种广泛使用的可验证大语言模型任务的性能指标，包括数学推理、代码生成和简答推理等。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 单张图像生成具备3D姿态和视角控制的人体视频

最近的扩散方法由于其强大的视觉生成能力，在从单张图像生成视频方面取得了显著进展。然而，c...

#research #paper #ai #computer-vision
1周前 · ai · - · -

【论文】Spa3R：预测空间场建模用于3D视觉推理

虽然视觉语言模型（VLMs）在二维视觉理解方面表现出色，但它们对三维空间的理解和推理能力——空间的基石——……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] Diffusion Duality, Chapter II: $Ψ$-Samplers 与高效课程

Uniform-state discrete diffusion models 在少步生成和引导方面表现出色，因为它们具备自我纠正的能力，使其相较于 autoregressive 模型更受青睐。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Mask-HybridGNet：基于图的分割从像素级监督中获得自发的解剖对应关系

基于图的医学图像分割使用边界图来表示解剖结构，提供固定拓扑的标记点和固有的人口层面…

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] XMorph：可解释的脑肿瘤分析通过 LLM 辅助的混合深度智能

深度学习显著推动了自动化脑肿瘤诊断的发展，但临床采用仍受限于可解释性和计算约束……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 透过文字：使用语言模型控制视觉检索质量

文本到图像检索是视觉语言学习中的基础任务，但在真实场景中，它常常受到用户查询简短且信息不足的挑战。

#research #paper #ai #computer-vision

Newer posts

Older posts