[论文] 从多个思考者学习思考
我们研究从多个思考者那里获得链式思考(Chain-of-Thought, CoT)监督的学习,这些思考者都提供正确但可能系统性不同的解答,例如……
4576 posts from this source
我们研究从多个思考者那里获得链式思考(Chain-of-Thought, CoT)监督的学习,这些思考者都提供正确但可能系统性不同的解答,例如……
Specification-guided reinforcement learning (RL) 为编码复杂、时间延伸的任务提供了一种基于形式规范的原则性框架。
印尼电商平台的评论将标准词汇与俚语、地区借词、数字简写和 emoji 混合在一起,使得 lexicon-based sentiment tools 难以……
单目RGB相机安装在无人机上被广泛用于野生动物监测,但大多数分析管道仍局限于二维图像空间,l...
每个 Transformer 架构都投入巨大的容量来学习语义嵌入空间中的丰富表征——然而所作用的旋转流形……
将高效的Transformer组件与线性序列建模块相结合的混合序列模型是对纯Transformer的有前景的替代方案,但……
大型语言模型正日益用于代码生成,但其输出的正确性不仅取决于模型能力,还取决于任务的…
使用数据并行随机梯度下降训练大型神经网络时,会分配 N 个 GPU 副本来计算基本相同的更新——这种做法...
基于学习的控制技术利用过去轨迹的数据来控制具有不确定动力学的系统。然而,基于学习的控制器往往计算量大……
大型语言模型被广泛用于代码生成,但它们依赖于一个隐含的假设,即任务描述足够详细且良好……
大型语言模型(LLMs)正被越来越多地部署,但它们的输出对用户在提问时的常规、非对抗性表述变化极其敏感……
基于大语言模型(LLMs)的应用,例如多代理仿真,需要代理之间的人口多样性。我们发现了一种普遍的失败……
具备主动性的人工智能系统有望加速科学工作流程,但神经影像学面临独特挑战:异构的模态(sMRI、fM…)。
自主 AI 代理即使保持完全授权,也可能因行为漂移、对手适应以及决策模式转变而变得不安全,即使没有任何代码更改……
大型语言模型(LLMs)在通用代码生成方面表现强劲,但它们在企业领域特定语言(DSL)上的适用性仍然……
本文研究了信息来源的可信度是否会影响土耳其语的证据形态学,以及大型语言模型(LLMs)是否能够捕捉这种敏感性。我们……
针对韩国天气预报员的实用(multimodal)large language model助手的开发受到缺乏多维、exper…的阻碍。
从文本即时创建丰富的 360 度全景世界的梦想正迅速成为现实,然而在我们可靠地实现……方面仍存在关键的差距。
本地小语言模型(SLMs)承诺为移动用户提供完全离线、私密的 AI 体验(无需云端依赖,数据不离开设备)。但是否……
统一的多模态理解/生成模型通过将细粒度理解融入其Chain‑o…,展示了改进的图像编辑性能。
大型语言模型(LLMs)正日益嵌入软件工程(SE)工具中,为代码生成、自动代码审查等应用提供动力,……
大型语言模型(LLM)代理正日益作为顺序软件系统运行,但它们的可靠性通常仅通过标量基准指标来概括。Me...
云计算平台提供弹性伸缩、托管基础设施和按使用付费的定价模式,但将现有的 monolithic backends 迁移到它们仍然是一项困难的任务。
云服务提供商提供折扣的 spot 实例,以最大化剩余资源的利用率,但这些实例存在突然中断的风险。Trad...
自动代码审查(ACR)机器人在工业软件开发中被越来越多地使用,以帮助开发人员在拉取请求(PR)审查期间进行辅助。随着采用率的提升……
真实世界的 Capstone 项目(RWCPs)是软件工程教育的关键组成部分,使学生能够为外部客户开发软件,在 aut...
开源软件(OSS)开发者常常难以理解和响应用户情境,而现有工具,如 issue trackers(用于处理 bug,...)
我们提出了 Incisor,一个用于事前实例选择问题的 cloud HPC 作业提交系统:在具有挑战性但常见的环境中选择合适的硬件……
LLM-guided evolutionary search 已成为自动算法发现的有前景范式,然而大多数系统主要通过 e...
recurrent neural networks、polynomial ODEs 和 discrete polynomial maps 各自为计算带来了什么,它们缺乏什么?All three operate over the co…
新兴的 IoT 驱动的 cyber‑physical 应用需要在资源受限的 edge 设备上实现 low‑latency、energy‑efficient 和 reliable 的执行,并且这些设备具有 heterogeneous …
多代理 LLM 辅导系统通过代理专门化提升响应质量,但每个学生查询会触发多个并发的 API 调用,其延迟...
对反应堆压力容器(RPV)钢的寿命预测需要在原子尺度退化机制与服役尺度的空间和时间范围之间搭建桥梁,...
在大规模 tensor-parallel 训练中处理通信开销仍然是一个关键挑战,因为中间 t 的稠密、接近零的分布……
现代工业的 Deep Learning Recommendation Models 通常通过分析序列交互历史来提取用户偏好,随后 …
云用户旨在通过为其工作负载选择最合适的实例类型,以最小化成本并最大化性能。为了降低开支,spot instan...
大型语言模型规模的快速增长迫使必须将计算工作负载在 GPU、TPU 等加速器之间进行划分,...
我们从它们的边函数角度分析 Kolmogorov‑Arnold Networks (KANs) 的通用逼近性质。如果这些函数全部是仿射的,那么 u...
本文提出了一种新方法,以提高深度卷积神经网络的训练效率。在训练过程中,该方法评估分数以衡量……
符号回归从数据中发现数学公式。一些方法固定操作符树,分配可学习的权重,并通过梯度下降进行训练。Th...
Scaling laws 被用于规划 multi-million-dollar training runs,但拟合这些定律本身也可能花费数百万。在现代大规模工作流中,组装一个…
大型语言模型(LLMs)正日益用于从日常使用到高风险企业和政府应用的文本生成任务,包括……
随着 AI 系统从生成文本转向通过持续交互实现目标,建模环境动态的能力成为一个核心瓶颈……
经过训练的 ReLU 神经网络作为代理模型可以精确嵌入混合整数线性规划(MILP)中,从而实现对所学习模型的全局优化。
计划存在性问题询问,给定一个以模态逻辑公式形式表示的目标、一个初始认知状态(一个指向的 Kripke 模型),以及一组认知…
我们调查仅在现代形态数据上训练的神经模型是否能够恢复与历史重建一致的跨语言词汇结构。
我们提出了一种方法,通过将跨语言迁移学习与无监督聚类相结合,来发现低资源班图语言的形态特征。
Internet 照片集合呈现出极度长尾分布:少数著名地标被大量拍摄,且易于在 3D 中重建,而 …