· ai
[Paper] 通用权重子空间假设
我们展示了在不同任务上训练的深度神经网络表现出惊人相似的低维参数子空间。我们提供了首次大规模……
461 posts from this source
我们展示了在不同任务上训练的深度神经网络表现出惊人相似的低维参数子空间。我们提供了首次大规模……
最近在光照控制方面的进展将基于图像的方法扩展到视频,但仍面临光照保真度与时间一致性之间的权衡。Mo...
虽然已有方法可以将 flow matching models——一种流行且有效的 generative models——与 human preferences 对齐,但现有方法未能……
磁共振成像(MRI)的分割通过划分解剖结构,促进对人类大脑发育的分析。然而,在婴儿和...
最近的统一多模态大语言模型(MLLMs)展示了令人印象深刻的能力,结合了链式思考(CoT)推理,以增强文本到-...
从单目Mannequin‑Challenge(MC)视频合成高保真冻结的3D场景是一个独特的问题,与标准的动态场景重建不同……
奖励模型对于使视觉语言系统与人类偏好保持一致至关重要,但当前的方法存在幻觉、视觉定位薄弱等问题,……
我们介绍了 ShadowDraw,一个将普通 3D 对象转化为阴影绘画构图艺术的框架。给定一个 3D 对象,我们的系统预测场景参数……
标准扩散通过高斯噪声对数据进行破坏,其傅里叶系数具有随机幅度和随机相位。虽然在无条件或……
在大型语言模型(LLMs)中,长上下文推理已通过链式思考(CoT)推断展示了其认知能力的提升。训练...
All-in-One Image Restoration (AiOIR) 任务通常涉及多样的退化,需要稳健且多功能的策略。然而,大多数现有方法 typ...
视频生成模型正在快速发展,但在需要大量语义分支或重复高…的复杂视频输出方面仍可能面临困难。