AI — Page 19 | EUNO.NEWS

排序:

1周前 · ai · - · -

【论文】Spa3R：预测空间场建模用于3D视觉推理

虽然视觉语言模型（VLMs）在二维视觉理解方面表现出色，但它们对三维空间的理解和推理能力——空间的基石——……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] Diffusion Duality, Chapter II: $Ψ$-Samplers 与高效课程

Uniform-state discrete diffusion models 在少步生成和引导方面表现出色，因为它们具备自我纠正的能力，使其相较于 autoregressive 模型更受青睐。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Mask-HybridGNet：基于图的分割从像素级监督中获得自发的解剖对应关系

基于图的医学图像分割使用边界图来表示解剖结构，提供固定拓扑的标记点和固有的人口层面…

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] XMorph：可解释的脑肿瘤分析通过 LLM 辅助的混合深度智能

深度学习显著推动了自动化脑肿瘤诊断的发展，但临床采用仍受限于可解释性和计算约束……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 透过文字：使用语言模型控制视觉检索质量

文本到图像检索是视觉语言学习中的基础任务，但在真实场景中，它常常受到用户查询简短且信息不足的挑战。

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] NoRD：一种数据高效的视觉-语言-动作模型，可在无需推理的情况下驾驶

视觉-语言-动作（VLA）模型正通过用统一的端到端架构取代模块化流水线，推动自动驾驶的发展。然而，当前的 VLA……

#research #paper #ai #machine-learning #computer-vision
1周前 · ai · - · -

[Paper] 时序临床数据的序列反事实推断：解决时间旅行者困境

反事实推断使临床医生能够对患者结果提出“如果…会怎样”的问题，但标准方法假设特征独立性和同步……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] PVminer：一种领域特定工具，用于检测患者生成数据中的患者声音

患者生成的文本，如安全消息、调查和访谈，包含了丰富的患者声音（PV）表达，反映了交流行为……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 不仅是多少，而是哪里：将 Epistemic Uncertainty 分解为每类贡献

在安全关键的分类中，失败的代价往往是不对称的，然而贝叶斯深度学习仅用一个标量 μ 来概括认知不确定性。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] SELAUR：自我进化 LLM 代理通过不确定性感知奖励

大型语言模型（LLMs）正日益被部署为多步骤决策代理，其中有效的奖励设计对于引导学习至关重要。Al...

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 在多GPU上使用张量并行扩展状态空间模型

选择性状态空间模型（SSMs）已迅速成为大语言模型的有力骨干，尤其适用于长上下文工作负载。然而在部署…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Prompt-Level 蒸馏：一种非参数的模型微调替代方案，用于高效推理

高级推理通常需要 Chain-of-Thought 提示，这种方法准确，但会导致不可接受的延迟以及巨大的测试时推理成本。Th...

#research #paper #ai #nlp

Newer posts

Older posts