[Paper] 价值梯度引导用于流匹配对齐
虽然已有方法可以将 flow matching models——一种流行且有效的 generative models——与 human preferences 对齐,但现有方法未能……
虽然已有方法可以将 flow matching models——一种流行且有效的 generative models——与 human preferences 对齐,但现有方法未能……
磁共振成像(MRI)的分割通过划分解剖结构,促进对人类大脑发育的分析。然而,在婴儿和...
最近的统一多模态大语言模型(MLLMs)展示了令人印象深刻的能力,结合了链式思考(CoT)推理,以增强文本到-...
从单目Mannequin‑Challenge(MC)视频合成高保真冻结的3D场景是一个独特的问题,与标准的动态场景重建不同……
奖励模型对于使视觉语言系统与人类偏好保持一致至关重要,但当前的方法存在幻觉、视觉定位薄弱等问题,……
我们介绍了 ShadowDraw,一个将普通 3D 对象转化为阴影绘画构图艺术的框架。给定一个 3D 对象,我们的系统预测场景参数……
标准扩散通过高斯噪声对数据进行破坏,其傅里叶系数具有随机幅度和随机相位。虽然在无条件或……
在大型语言模型(LLMs)中,长上下文推理已通过链式思考(CoT)推断展示了其认知能力的提升。训练...
All-in-One Image Restoration (AiOIR) 任务通常涉及多样的退化,需要稳健且多功能的策略。然而,大多数现有方法 typ...
视频生成模型正在快速发展,但在需要大量语义分支或重复高…的复杂视频输出方面仍可能面临困难。
最近关于结构化文本翻译的研究仍局限于句子层面,因为它们难以有效处理复杂的文档级 XML 或 HTML …
近年来,针对 AI 生成图像(AIGI)的图像质量评估(IQA)发展迅速;然而,现有方法主要针对肖像和 ar...
尽管扩散模型如今在生成建模中占据核心位置,入门教材通常假设欧几里得数据,并且很少阐明它们的…
现实世界的物理过程并不会产生任意的变异性:它们的信号集中在紧凑且低变异性的 functional space 子集上。这个……
大语言模型(LLM)推理需要巨大的计算和能源,使得特定领域的任务成本高昂且不可持续。随着基础模型的规模不断扩大……
随着医疗保健日益转向 AI,以实现可扩展且可信赖的临床决策支持,确保模型推理的可靠性仍然是一个关键挑战。
Kubernetes 是一种帮助快速部署软件的工具。不幸的是,配置 Kubernetes 容易出错。配置缺陷并不少见。
量子近似优化算法(QAOA)是解决近端量子处理器上组合优化问题的领先方法。如何……
现代大型语言模型通过长链式思考实现了令人印象深刻的推理能力,但它们在推理期间会产生巨大的计算成本。
Spiking neural networks 提供事件驱动计算、稀疏激活和硬件效率,但训练往往收敛缓慢且缺乏稳定性。We ...
本扩展摘要介绍了自解释对比证据重新排序(Self-Explaining Contrastive Evidence Re-Ranking,简称 CER),这是一种通过事实证据重新构建检索的新方法,by f...
在表达式搜索空间中的神经架构搜索(NAS)是一个计算上非常困难的问题,但它也具有自动发现完整……的潜力。
大型语言模型(LLMs)从被动响应者向自主代理的演进,需要在学习范式上进行根本性转变——从静态……
太赫兹(THz)通信与联邦学习(FL)的融合有望实现超高速分布式学习,但现实宽带的影响……