[Paper] 学习与命名具有卓越生存特征的子群
在许多应用中,识别生存时间比总体更长或更短的子群体非常重要。例如,在医学领域,……
4654 posts from this source
在许多应用中,识别生存时间比总体更长或更短的子群体非常重要。例如,在医学领域,……
近年来,出现了一种标准的计算病理工作流程,将 whole slide images 裁剪成 tiles,这些 tiles 使用一个 foun...
Checkpointing 对于在训练大型语言模型(LLMs)时实现容错至关重要。然而,现有方法无论其 I/O 策略如何,周期性……
大多数当代神经学习系统依赖于基于 epoch 的优化和对历史数据的重复访问,隐含地假设计算是可逆的。我...
人类反馈强化学习(RLHF)在使大型语言模型(LLMs)符合人类偏好方面发挥了重要作用。虽然RLHF与实验…
大型语言模型(LLMs)正日益被用于“专业化”职场沟通,但往往以牺牲语言身份为代价。我们引入“Cultu…”。
对象幻觉是大型视觉语言模型(LVLMs)的一个关键问题,模型的输出可能包含输入图像中不存在的对象。一个自然…
医学视觉语言预训练越来越依赖医学报告作为大规模监督信号;然而,原始报告往往表现出显著的 st...
最近在 Multimodal Large Language Models 方面的进展大幅提升了视觉理解和推理能力,然而它们的 quadratic attention 和 offline training …
Deep neural networks (DNNs) 对于在边缘或移动设备上执行高级任务至关重要,但它们的部署常常受到严重资源限制的阻碍。
我们研究在均值偏移污染存在的情况下的均值估计基本任务。在 mean-shift contamination 模型中,对手被允许替换…
Instruction-following benchmarks 仍然主要以 English‑centric 为主,导致对数以亿计的 Indic language speakers 存在关键的 evaluation gap。
Small language models(SLMs)在成本、延迟和适应性方面具有显著优势,但在长时程软件任务上仍落后于更大的模型。
理解学习到的分布的几何结构对于改进和解释扩散模型至关重要,然而系统性的工具用于探索它们的…
现代计算系统中硬件加速器的日益增长的复杂性和多样性,需要灵活、低开销的程序分析工具。我们提出了 PA...
本文使用 agile 词汇解释 Visual Milestone Planning (VMP) 方法,以促进 agile 从业者将其作为 … 的 front end。
随着 HPC 存储栈的复杂性快速增长,领域科学家在有效利用 HPC 存储系统以实现 t... 方面面临日益增长的挑战。
在多中心医疗环境中,复杂的医疗预约调度优化仍然是一个重要的运营挑战,其中临床…
差分隐私联邦学习面临一个根本性的张力:保护客户端数据的隐私机制同时会产生可量化的…
大型语言模型(LLMs)正日益被用于自动代码重构任务。虽然这些模型能够快速进行代码重构,但其质量可能表现出……
利用深度学习来解决车辆路径问题的神经路由求解器(NRSs)已展示出在实际应用中的显著潜力。通过 …
原型设计在机器学习(ML)解决方案的开发中发挥关键作用,然而现有工具往往在有效协作方面提供的支持有限……
Lamport 在 1978 年的论文中引入了 happens-before 关系和逻辑时钟,使分布式系统摆脱了对同步物理时钟的依赖。Thi...
编排从全局视角描述分布式协议,使得能够通过构造正确性合成局部行为。我们开发了一种基于策略参数的…
Test-time training (TTT) 与 KV 绑定作为序列建模层通常被解释为一种在线元学习形式,它记忆键值映射……
视觉强化学习在机器人领域很有吸引力,但成本高——off-policy 方法样本效率高,却速度慢;on-policy 方法并行化效果好,但...
我们研究在任何模态下用于后期交互的高效多向量检索。后期交互已成为信息检索中的主导范式……
Embodied LLMs 为机器人赋予高级任务推理能力,但它们无法反思出错的原因或原因,从而使部署变成一系列独立的……
高效处理 Transformer 模型中的长序列通常需要通过上下文并行将计算拆分到多个加速器上。The domin...
冷冻电子断层成像(cryo-ET)能够实现对生物结构的高分辨率三维重建,包括膜和膜蛋白……
尽管在 terminal capabilities 方面,大型语言模型最近取得了快速进展,但支撑 state-of-the-art terminal agents 的 training data strategies 仍然……
我们研究最近由~cite{CKKMS24} 引入的 smoothed agnostic learning 的复杂性,其中学习者与目标中的最佳 classifier 竞争……
Pass@k 是一种广泛使用的可验证大语言模型任务的性能指标,包括数学推理、代码生成和简答推理等。
最近的扩散方法由于其强大的视觉生成能力,在从单张图像生成视频方面取得了显著进展。然而,c...
虽然视觉语言模型(VLMs)在二维视觉理解方面表现出色,但它们对三维空间的理解和推理能力——空间的基石——……
Uniform-state discrete diffusion models 在少步生成和引导方面表现出色,因为它们具备自我纠正的能力,使其相较于 autoregressive 模型更受青睐。
基于图的医学图像分割使用边界图来表示解剖结构,提供固定拓扑的标记点和固有的人口层面…
深度学习显著推动了自动化脑肿瘤诊断的发展,但临床采用仍受限于可解释性和计算约束……
文本到图像检索是视觉语言学习中的基础任务,但在真实场景中,它常常受到用户查询简短且信息不足的挑战。
层次化、多分辨率体积映射方法被广泛用于表示大规模和复杂的环境,因为它们能够高效捕获它们的 o...
视觉-语言-动作(VLA)模型正通过用统一的端到端架构取代模块化流水线,推动自动驾驶的发展。然而,当前的 VLA……
反事实推断使临床医生能够对患者结果提出“如果…会怎样”的问题,但标准方法假设特征独立性和同步……
患者生成的文本,如安全消息、调查和访谈,包含了丰富的患者声音(PV)表达,反映了交流行为……
在安全关键的分类中,失败的代价往往是不对称的,然而贝叶斯深度学习仅用一个标量 μ 来概括认知不确定性。
大型语言模型(LLMs)正日益被部署为多步骤决策代理,其中有效的奖励设计对于引导学习至关重要。Al...
选择性状态空间模型(SSMs)已迅速成为大语言模型的有力骨干,尤其适用于长上下文工作负载。然而在部署…
随着 LLM 部署在更多硬件上扩展,系统中单点故障的概率显著增加,云运营商必须考虑稳健的c...
高级推理通常需要 Chain-of-Thought 提示,这种方法准确,但会导致不可接受的延迟以及巨大的测试时推理成本。Th...