提升训练有效吞吐:持续检查点如何在 Orbax 和 MaxText 中优化可靠性
Orbax 和 MaxText 新引入的 continuous checkpointing 功能旨在优化模型训练期间可靠性与性能之间的平衡……
Orbax 和 MaxText 新引入的 continuous checkpointing 功能旨在优化模型训练期间可靠性与性能之间的平衡……
这篇博客文章介绍了一种工作流,通过将 LlamaParse 与 Gemini 3.1 模型相结合,从复杂的非结构化文档中提取高质量数据。它…
2026年3月25日 大型语言模型(LLMs)拥有固定的知识,它们在特定时间点进行训练。软件工程实践节奏快且变化迅速……
分析具有可稳定受控不变集(CISs)的非线性系统,需要准确估计它们的稳定域(DOS)以及…
1-bit Bonsai 8B !https://cdn.prod.website-files.com/697a3312d33c2cc715ec3899/69c94de785b70322d35e5374_chevron.svg 首个商业可行的 1 位模型
Long-context decoding 在 LLM 中是 IO‑bound:每个 token 会重新读取不断增长的 KV cache。之前的加速通过 compression 来削减字节,但这会降低 fidelity,o...
癫痫发作是一种神经系统疾病,其特征是大脑中异常且过度的电活动,导致复发性的发作事件。E...
使用视频生成模型对场景进行建模近年来已引起日益增长的研究兴趣。然而,大多数现有方法依赖于透视视频……
视频扩散模型展现出诸如解迷宫和拼图等新兴推理能力,但人们对它们在生成过程中的推理方式知之甚少……
自动并行化仍然是软件工程中的一个挑战性问题,尤其是在识别可以安全执行循环的代码区域时……
AI辅助编码已迅速重塑软件实践和研究工作流,但当今的模型仍然难以为复杂的三维地质力学代码生成正确的结果。
本研究探讨了在成本感知的大语言模型(LLM)路由中使用 NeuralUCB。现有的路由方法大致可分为监督…
对多头自注意力(MHA)中 self-attention 机制内存占用的降低的追求催生了一系列丰富的方法,例如,gro...
人类说话者常常通过整体放慢语速来帮助那些在语言理解上有挑战的听众,例如听力受限或非母语的成年人。
当前的自主 AI 代理主要由大型语言模型(Large Language Models,LLMs)驱动,处于认知轻盈状态:它们在没有…
Verifiable claim detection 询问一个主张是否表达了一个事实陈述,原则上可以依据外部证据进行评估。作为一种早期过滤……
本文提出了一种新的混合框架,将强化学习(RL)和大型语言模型(LLMs)相结合,以提升机器人操作任务。B...
我们提出了一种简单的检测机制,用于Aaronson(2022)提出的Gumbel水印方案。新的机制已被证明在概率上接近最优……
AI 代理,主要由大型语言模型(LLMs)驱动,容易受到间接提示注入的影响,即在不可信…
生产与分布式分析(PanDA)系统,最初为 CERN 大型强子对撞机(LHC)上的 ATLAS 实验开发,已发展为 …
伪装目标检测(Camouflaged object detection,COD)旨在识别与背景高度融合的目标。近期研究表明,optical characteristics……
Mechanistic interpretability (MI) 是一种新兴的神经网络解释框架。给定任务和模型,MI 旨在发现简洁的算法式 …
Aggregate programming 是一种基于场的协同范式,已有十多年的探索,并在包括传感器网络在内的多个领域取得了成功的应用。
类比推理是人类在问题解决和论证中实现概括的关键驱动力。然而,叙事结构之间的类比仍然具有挑战性……
Myopic Optimization with Non‑myopic Approval (MONA) 通过限制代理的规划视野,同时提供远见的 …
增强现实(AR)设备配备头戴显示器(HMD),能够在手术期间将三维术前影像数据直接叠加到患者身上。
Cross-validation (CV) 通常用于在没有独立测试数据时估计预测风险。它的有效性取决于假设有效……
AI 驱动的搜索引擎的激增已经将信息发现从传统的基于链接的检索转变为直接答案生成,并带有选择性……
多模态深度学习在癌症预后中的应用通常被认为能够受益于协同的跨模态交互,但这一假设尚未直接……
准确的空气污染预测对于环境监测和政策支持至关重要,然而数据驱动模型往往受到有限的泛化能力限制。
科学家经常想解释为什么两个组的结果不同。例如,两家医院的患者死亡率差异可能是由于……
Multimodal deep learning 通过整合 histopathology 和 genomic data 提高了脑肿瘤的预后准确性,然而 volumetric M...
理解大脑结构与功能的相互作用是解释智力的关键,但将它们联合建模具有挑战性,因为结构和功能……
Surgical video understanding 对于 computer-assisted interventions 至关重要,然而现有的 surgical foundation models 仍受限于数据规模有限,...
外科手术本质上复杂且风险高,需要广泛的专业知识和持续的专注,以便在不断变化的术中场景中顺利导航。Computer...
对有药物使用启动风险的青少年进行早期识别至关重要,但却很困难,因为大多数预测因素将连通性视为静态或交叉……
最近在推理大型语言模型(LLMs)方面的进展主要依赖于前置思考,即在给出最终答案之前进行推理。然而,这...
有效的协作需要团队通过社会共享学习调节(Socially Shared Regulation of Learning,SSRL)来管理复杂的认知和情绪状态。Physiological syn...
本文研究了多语言新闻报道中的句子级文本复用,分析了复用内容在文章中的出现位置。我们提出了一种弱监督方法……
自动化放射学报告摘要旨在将冗长的发现提炼为简洁的临床印象,但现有的多模态模型常常在...方面遇到困难。
问题是,每个流行的 AI 项目都在赋予代理更大的自主权——运行 shell 命令、浏览网页、调用 API、转移资金,甚至执行 pene...
FLEURS 提供 100 多种语言的 n-way 并行语音,但北库尔德语不在其中,这限制了对自动语音识别的基准测试和……
请提供您希望翻译的具体文字内容,我才能为您进行简体中文翻译。
元启发式算法,如粒子群优化(PSO)和进化算法(EA),在探索解空间方面表现出色,但缺乏机制来实现……
今天,我们完成了最新一轮融资,承诺资本为1220亿美元,后估值为8520亿美元。OpenAI 正在成为核心基础设施……
始终开启的 edge cameras 生成连续的视频流,其中冗余帧会通过挤占 top‑k 搜索的正确结果,降低 cross‑modal retrieval 的效果。T...
你在 system prompt 中改动了一行,导致三个 downstream 功能失效。没有测试捕捉到它,因为——说实话——你并没有测试你的 prompts。这里……
工厂模型存在设计缺陷。PwC 与所有大型咨询公司一样,连续三年向客户推销“AI 转型”作为增长故事。为了交付…