[Paper] 推理核心:可扩展的过程式数据生成套件,用于符号预训练和后训练
在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法,超越标准预训练语料库所能提供的范围。Y...
在可验证的符号数据上进行训练是扩展语言模型推理能力边界的有前景的方法,超越标准预训练语料库所能提供的范围。Y...
当我们能够识别与测试样本可交换的校准样本时,选择性共形预测可以产生显著更紧的不确定性集合。
Test-time reinforcement learning (TTRL) 已成为自我进化的大型推理模型 (LRMs) 的一种有前景的范式,使其能够在未标记的数据上进行在线适应。
像 Sudoku 和 ARC-AGI 这样的推理问题对神经网络仍然具有挑战性。结构化问题求解架构家族 Recurrent Reasoning …
我们提出了 Sketch2Colab,它将 storyboard 风格的 2D 草图转换为连贯、具备对象感知的 3D 多人物动作,并对 agents、关节等实现细粒度控制。
大语言模型的长上下文推理在解码阶段受到键值(KV)缓存加载的瓶颈限制,因为生成的顺序性……
Multi-attribution learning (MAL),通过学习由多个 attribution mechanisms 产生的 conversion labels 来提升模型性能,已成为……
湄公河三角洲的非物质文化遗产(ICH)图像分类因标注数据有限、视觉相似度高等因素而面临独特的挑战……
储层扩展可以在非线性混合下提升在线独立成分分析(ICA)的效果,但 top‑n 白化可能会丢弃注入的特征。我们正式…
Claude 代理技能的快速激增提出了一个核心问题:如何有效利用、管理和扩展代理技能生态系统。
基于指令的视频编辑取得了快速进展,但现有方法常常在精确的视觉控制方面遇到困难,因为自然语言本质上是……
低位注意力(如 SageAttention)已成为加速模型推理的有效方法,但其在训练中的适用性仍然较差……