[Paper] Open-Vocabulary 3D 指令歧义检测
在安全关键领域,语言歧义可能导致严重后果;在外科手术环境中,像“Pass me the vial”这样的模糊指令可能导致灾难性后果。
在安全关键领域,语言歧义可能导致严重后果;在外科手术环境中,像“Pass me the vial”这样的模糊指令可能导致灾难性后果。
将网络表示为图,并使用良性连接训练链接预测模型,是一种有效的基于异常的入侵检测方法。Exis...
在真实环境中部署的 Deepfake 检测系统面临能够制造不可察觉扰动的对手,这些扰动会削弱模型的性能……
Internet of Things (IoT) 设备的快速部署导致了大规模传感器网络,这些网络实时监测环境和城市现象。Com...
Deformable multi-contrast image registration 是一项具有挑战性但至关重要的任务,因为不同成像对比之间存在复杂的非线性强度关系……
随着新兴应用对更高吞吐量和更低延迟的需求,运营商正日益在 x‑haul 传输中部署毫米波 (mmWave) 链路……
我们提出 DeePM(Deep Portfolio Manager),一种结构化的 deep‑learning 宏观投资组合管理器,端到端训练以最大化稳健的 risk‑adjusted utility。De...
近期视频生成的进展主要由 diffusion 和 flow-matching 模型主导,这些模型能够产生高质量的结果,但在计算上仍然…
我们提出一个框架,通过将瞬时批评转换为可检索的指南,并使用基于文件的方式,来摊销推理时的成本。
受约束的组合多臂赌博机模型已被广泛用于解决无线网络及相关领域的问题,包括…
Federated Domain Generalization(FDG)旨在跨分布式客户端协同训练一个能够在未见领域上良好泛化的global model。然而...
主动学习(Active learning,AL)在材料科学中发挥关键作用,使得诸如构建机器学习原子间势能等应用成为可能……
领域通用的 retinal vessel segmentation 对自动化 ophthalmic diagnosis 至关重要,但却面临由非…引起的 domain shift 的显著挑战。
幻觉,即生成与视觉输入不一致的响应,仍然是大规模视觉语言模型(LVLMs)的关键限制,尤其在…
背景:胰腺癌是最具侵袭性的癌症之一,生存率低。内镜超声(EUS)是关键的诊断手段,但其...
自主机器学习代理已经彻底改变了科学发现,但它们仍受限于生成-执行-反馈范式。先前的…
当前对超高分辨率图像进行分割的方法要么采用滑动窗口,从而丢失全局上下文,要么进行下采样,导致细节丢失。我们 ...
Functional near-infrared spectroscopy (fNIRS) 和 diffuse optical tomography (DOT) 正在快速发展,朝着可穿戴、多模态、数据驱动、AI 支持的方向前进……
2025年12月4日,Anthropic发布了Anthropic Interviewer,这是一款用于大规模进行定性访谈的AI工具,并附带了一个包含1,250次访谈的公开数据集。
我们发布 Pantagruel 模型,这是一系列用于法语文本和语音的自监督编码器模型。我们不再预测针对特定模态的目标,例如……
随着机器学习模型日益嵌入社会基础设施,对其偏差进行审计变得越来越重要。然而,在现实世界中……
随着大型语言模型(LLMs)在真实世界环境中日益部署,仅仅正确性已不足以满足需求。可靠的部署需要保持 tr...
大型语言模型(LLM)路由旨在利用不同 LLM 在多样任务中的专门优势。然而,现有方法通常侧重于…
偏好调优通过对显式偏好信号进行优化,使预训练语言模型与人类对质量、帮助性或安全性的判断保持一致,而不是……