· ai
[Paper] AlcheMinT: 细粒度时间控制用于多参考一致视频生成
近期,基于大型扩散模型的以主题为驱动的视频生成取得了重要进展,使得能够在用户提供的主题条件下进行个性化内容合成……
近期,基于大型扩散模型的以主题为驱动的视频生成取得了重要进展,使得能够在用户提供的主题条件下进行个性化内容合成……
推理超越语言;现实世界需要对空间、时间、affordances,以及远超文字所能表达的诸多方面进行推理。现有的 multimo...
先前将相机控制注入扩散模型的方法主要聚焦于 4D 一致性任务的特定子集:新视角合成、文本到视频…
尽管归一化层长期被视为深度学习架构中不可或缺的组成部分,最近引入的 Dynamic Tanh (DyT) 已经……
我们在部分可观测马尔可夫决策过程(POMDP)中的决策代理与单输入过程函数之间建立了精确的对应关系,...
为神经网络构建对抗性攻击似乎是其在各种服务中部署的关键挑战。为了估计对抗…
我们提出了 Any4D,一种可扩展的多视角 Transformer,用于度量尺度的密集前馈 4D 重建。Any4D 直接生成每像素的运动和几何……
在受限的管状环境中进行自主无人机导航仍然是一个重大挑战,因为管道的约束几何形状以及墙壁的接近……
许多最先进的 LLM 被训练成在给出答案之前先思考。推理可以大幅提升语言模型的能力和安全性,但它也会……
我们开发了一个用于从噪声量子实验中学习的框架,重点关注容错设备通过噪声耦合访问未表征系统……
Temporal-difference (TD) 方法通过从自身的未来价值预测进行 bootstrapping,高效地学习 state 和 action values,但这种 self‑bootstrappi…
社交存在是共同观看内容时享受的核心,但现代媒体消费正日益趋向于孤立。我们调查是否多代理…