[Paper] RAPID-LLM:针对分布式 LLM 训练与推理的基础设施的弹性感知性能分析
RAPID-LLM 是一个统一的性能建模框架,用于在 GPU 集群上进行大语言模型(LLM)的训练和推理。它结合了基于 DeepFlow 的前端……
RAPID-LLM 是一个统一的性能建模框架,用于在 GPU 集群上进行大语言模型(LLM)的训练和推理。它结合了基于 DeepFlow 的前端……
近期在自监督 Joint-Embedding Predictive Architectures(JEPAs)方面的突破表明,正则化欧几里得表示以趋向 iso...
最近,一波具备思考能力的 Large Language Models 出现了,它们在各种推理基准上展示了卓越的能力。...
姿态控制对于许多卫星任务至关重要。然而,Classical controllers 的设计耗时且对模型不确定性敏感,...
我们审视人类与 LLM 交互所带来的 epistemological 威胁。我们发展集体 epistemology,作为一种在个体之间分布的 epistemic warrant 理论……
人工智能已成为全球技术竞争的关键领域,也是欧洲追求技术主权的核心关注点。这……
带有可验证奖励的群体相对强化学习(RLVR)经常浪费它已经拥有的最有信息量的数据——即失败。当所有 rollouts 都是 w...
在本文中,我们在序数回归设置中引入了方向性反馈,其中学习者会收到关于预测标签是否在……的反馈。
我们推出了 Algerian Dialect,一个大规模情感标注数据集,包含 45,000 条用阿尔及利亚阿拉伯方言撰写的 YouTube 评论。我们收集的评论……
大气湍流在包括光学成像、遥感和自由空间光学等广泛应用中构成了根本性的限制。
大型语言模型(LLMs)和多模态LLMs正在改变事件抽取(EE):提示和生成往往能够在零样本情况下产生结构化输出……
预测在连续溶剂组成范围内的反应结果仍然是有机合成和工艺化学中的一项关键挑战。传统的 m...