[Paper] 协方差感知 Simplex 投影用于基数约束的投资组合优化
针对基数约束的投资组合优化的元启发式算法需要修复算子将不可行的候选解映射到可行区域。Stan...
针对基数约束的投资组合优化的元启发式算法需要修复算子将不可行的候选解映射到可行区域。Stan...
跨模态的深度表征本质上是交织在一起的。在本文中,我们系统地分析了各种语义和……的光谱特性。
生成逼真的 human-human 交互是一项具有挑战性的任务,它不仅需要高质量的单体身体和手部动作,还需要连贯的……
自动化临床风险评分的计算提供了显著的机会,以减少医生的行政负担并提升患者护理。当前…
我们引入 Perception Encoder Audiovisual(PE-AV),一种用于音频和视频理解的新型编码器家族,采用缩放对比学习进行训练。构建于...
最近,Chain-of-Thought(CoT)的引入在很大程度上提升了统一模型的生成能力。然而,观察到当前的...
我们构建了首个系统来解决从单目 RGB 视频中重建场景内对象操作的问题。由于该问题本质上是病态的……
虽然多模态大语言模型(MLLMs)已经在语义任务上取得了令人印象深刻的表现,但它们的空间智能——对稳健和...
训练能够胜任任务的大型语言模型(LLM)代理受到真实世界交互数据高成本和静态特性的严重瓶颈。我们针对这一问题……
生成长距离、几何一致性的视频面临一个根本性的困境:虽然一致性要求在像素空间严格遵守3D geometry,……
背景:高分辨率 MRI 对诊断至关重要,但长时间的采集限制了临床使用。超分辨率(SR)可以在扫描后提升分辨率……
我们利用多模态大型语言模型(LLMs),从 9,562 张档案图像扫描中构建了一个包含 306,070 项德国专利(1875‑1918)的数据集,使用我们的 LLM‑b…
现有的强化学习(RL)方法将大型语言模型(LLMs)视为单一统一的策略,忽视了它们的内部机制。了解…
糖尿病视网膜病变(DR)是全球可预防失明的主要原因之一,需要准确的自动化诊断系统。虽然通用领域的视觉‑la…
设计高效、有效且一致的 metric clustering algorithms 是一个受到日益关注的重大挑战。传统方法关注……
Aspect-Category Sentiment Analysis (ACSA) 提供细粒度洞察,通过识别评论中的具体主题及其相关情感。While supervi...
我们引入了一种新颖的 deep learning 算法,用于计算可微凸函数的 convex conjugates,这是一种在 convex analysis 中的基本操作,...
编程对现代科学研究至关重要,但大多数科学家报告称,他们在工作所需的软件开发方面的培训不足。Generati...
数值模拟时变偏微分方程(PDE)是科学和工程应用的核心,但高保真求解器……
我们展示了关于 diacritic restoration 的实验,这是一种对自然语言处理 (NLP) 任务至关重要的 text normalization 形式。我们的研究聚焦于两个 ex...
摘要评估涉及评估生成的摘要在多大程度上反映了源文本的关键思想和意义,这需要对……有深入的理解。
本文介绍了 MauBERT,这是一种 HuBERT 的多语言扩展,利用 articulatory features 实现稳健的跨语言语音表征学习……
虽然Multimodal Large Language Models在许多visual和textual reasoning tasks上已经达到了类人水平的表现,但它们在细粒度spatial…
RAPID-LLM 是一个统一的性能建模框架,用于在 GPU 集群上进行大语言模型(LLM)的训练和推理。它结合了基于 DeepFlow 的前端……