[Paper] Nemotron-Cascade:规模化级联强化学习用于通用推理模型
构建通用推理模型与强化学习(RL)相结合,需要应对大量跨领域的异质性,包括推理过程中的巨大差异……
构建通用推理模型与强化学习(RL)相结合,需要应对大量跨领域的异质性,包括推理过程中的巨大差异……
近期在组织病理学中的深度学习框架,特别是与病理基础模型(PFMs)相结合的多实例学习(MIL),已经显示出……
精心设计的提示可以提升大型语言模型的性能;自动提示优化技术旨在在不需要…
Square Kilometre Array (SKA) 项目将运营世界上最大的连续科学数据系统之一,在严格的 p… 条件下维持 petascale 成像。
自回归模型(ARMs)受到慢速顺序推理的限制。虽然掩码扩散模型(MDMs)提供了一种并行的替代方案,但它们受到 crit… 的困扰。
在本文中,我们提出了一种用于去中心化学习的差分隐私随机梯度推送(Differentially Private Stochastic Gradient Push)结合压缩通信(Compressed communication)的算法,称为 DP‑CSGP。
去噪语言模型(DLMs)已被提出作为传统语言模型(LMs)在自动语音识别(ASR)中的一种强大替代方案,动机……
大型混合专家(Mixture-of-Experts,MoE)模型推理因资源需求高和工作负载动态而具有挑战性。现有方案通常部署整个模型……
大多数软件工程(SE)研究假设进展依赖于大规模数据集和 CPU 密集型优化器。然而,这一假设是否经过严格检验……
该研究展示了在 automated codebase migration 领域的研究成果和实验验证,重点在于解决…方面的挑战。
越来越多种类的 AI 加速器正被考虑用于大规模训练。然而,在早期 AI 加速器上实现大规模训练面临……
全球气候正经历快速且前所未有的变暖趋势。ICT部门是全球温室气体排放的显著贡献者,其……