· ai · - · -
[Paper] 权重衰减提升语言模型可塑性
在大型语言模型(LLM)开发中,主流范式是先对基础模型进行预训练,然后进行进一步的训练以提升性能和模型……
在大型语言模型(LLM)开发中,主流范式是先对基础模型进行预训练,然后进行进一步的训练以提升性能和模型……
扩散语言模型通过迭代细化生成文本,这一过程通常计算效率低下,因为许多标记在达到稳定状态后……
我们研究在给定的有限线段以及具有有限正半径的圆上,对 n 台移动机器人群的 min-sum uniform coverage problem,其中……
随着大型多模态模型的快速发展,可靠的judge和critic模型已成为开放式评估和preference alignment的关键。
自动生成 agentic 工作流——可执行的 operator 图或代码,用于编排推理、验证和修复——已成为一种实用的……
误信息检测是一项关键任务,能够显著受益于外部知识的整合,就像人工事实核查一样。在本...
Flow-matching 模型在图像和视频生成方面提供了最先进的保真度,但其固有的顺序去噪过程使其速度较慢。Existin...
基于强化学习(RL)的后训练用于显式链式思考(例如 GRPO)提升了多模态大规模推理模型的推理能力。
Biometric footstep recognition,基于人们在行走时脚下独特的压力模式,是一个新兴领域,应用正日益增长……
大型语言模型(LLMs)展示了强大的通用推理和语言理解能力,但在受严格形式约束的领域中,它们的性能会下降。
我们提出了 PuriLight,一个轻量且高效的框架,用于自监督单目深度估计,以应对计算效率方面的双重挑战……
多任务策略搜索是一个具有挑战性的问题,因为策略需要在训练案例之外进行泛化。课程学习已被证明是有效的……