[Paper] 随机微分方程的完整分解
我们展示,任何具有指定时间依赖边缘分布的 stochastic differential equation 都可以分解为三个组成部分:一个唯一的 s...
我们展示,任何具有指定时间依赖边缘分布的 stochastic differential equation 都可以分解为三个组成部分:一个唯一的 s...
我们提出 RefVFX,一个新的框架,以前馈方式将复杂的 temporal effects 从 reference video 转移到 target video 或 image 上。虽然 e...
虽然 Transformer 架构在许多领域占据主导地位,但其二次方的 self-attention 复杂度阻碍了其在大规模应用中的使用。Linear attention …
学习如何高效学习是生物体面临的根本挑战,也是人工体日益关注的问题。为了有效学习,代理必须……
基于 deep reinforcement learning 的后训练算法可以在特定目标上突破机器人模型的极限,例如可推广性、精度、……
在人类对话中,双方对话者(interlocutors)都积极参与维持相互理解。当听者(addressees)对说话者(speakers)的意思不确定时,例如……
大型视觉语言模型(LVLMs)已经展示了卓越的能力,但它们在理解和推理多张图像方面的熟练程度仍然……
在敏感领域中对大型语言模型(LLMs)的使用日益增加,导致人们对其置信分数与公平性和偏见之间的对应关系产生了越来越大的兴趣……
遥感变化检测根本上依赖于对双时相特征的有效融合和判别。主流范式通常采用…
大型语言模型(LLMs)正日益被用作学习的对话伙伴,然而支持用户学习和参与的互动动态……
欧洲航天局(ESA),受其在计划中的月球任务以及 Argonaut lander 的雄心驱动,对可靠的 crater detection 有着深厚的兴趣。
大型语言模型(LLMs)越来越多地被评估其执行多跳推理的能力,即将多个信息片段组合成……
系统日志对于监控和诊断现代计算基础设施至关重要,但它们的规模和复杂性需要可靠且高效的自动化……
随着大型语言模型(LLMs),如 ChatGPT、Copilot、Claude 和 Gemini,逐渐融入软件开发工作流,开发者越来越…
LLM agents 在庞大且动态的 tool libraries 上运行,依赖有效的检索,然而标准的 single-shot dense retrievers 在处理复杂请求时表现乏力……
虽然Chain-of-Thought(CoT)提示提升了LLM的推理能力,但在一致性、准确性和自我纠正方面仍然存在挑战,尤其是针对复杂或伦理…
虽然 Vision-Language Models(VLMs)显著推动了 Computer-Using Agents(CUAs)的发展,但当前框架在长时程工作流的鲁棒性方面仍然存在困难……
我们介绍 DT-ICU,这是一种用于重症监护中连续风险估计的多模态 digital twin 框架。DT-ICU 集成了可变长度的临床时间序列……
最近的工作如 REPA 已经表明,使用外部语义特征(例如 DINO)来引导 diffusion models 可以显著加速其训练。
大型语言模型(LLMs)能够产生出令人惊讶的相当复杂的自身不确定性估计。然而,仍然不清楚这种表达的程度……
理解叙事需要识别哪些事件对故事进展最为突出。我们提出了一种对比学习框架用于建模……
大型视觉语言模型(LVLMs)在视频推理中面临根本性的两难困境:它们被冗长推理的高昂计算成本所束缚……
Kolmogorov-Arnold Networks (KANs) 已显示出在高效逼近复杂非线性函数方面的强大潜力。然而,原始的 KAN 公式 r...
使用判别观测量对事件进行分类是许多高能物理分析的核心。然而,bin 边界通常是手工选择的。一个简单的、流行的……