· ai
[Paper] 主体策略优化 via 指令-策略协同进化
可验证奖励的强化学习(RLVR)提升了大型语言模型(LLMs)的推理能力,使得自主代理能够……
可验证奖励的强化学习(RLVR)提升了大型语言模型(LLMs)的推理能力,使得自主代理能够……
大型语言模型(LLMs)的崛起引发了对代理的浓厚兴趣,导致代理框架的快速增长。代理框架是软件……
近期大型语言模型(LLMs)的进展主要得益于其新兴的推理能力,尤其是通过长链式思考(CoT)……
理解大型语言模型(LLMs)的内部思考过程以及幻觉产生的原因仍然是一个关键挑战。为此,我们引入了 l...
物联网的增长使新一代应用成为可能,将计算和智能推向网络边缘。这一趋势,如何...
对 MPI 应用程序进行详细的跟踪分析对于性能工程至关重要,但不断增长的跟踪规模和复杂的通信行为常常导致 c...
本文分析了人工智能 (AI) 与混合整数线性规划 (MILP) 的结合,以在...中应对复杂的优化挑战。
自动化测试生成已成为确保软件质量的关键技术,尤其是在现代基于 API 的架构中。然而,自动生成…
处理缺乏固有时间动态的静态图像仍然是脉冲神经网络(SNN)的一项根本性挑战。在直接训练的SNN中,静态...
符号回归(SR)是一种回归方法,旨在发现描述变量之间关系的数学表达式,且它通常...
图神经网络(GNN)通过将不规则、受内存限制的图遍历与规则、计算密集的稠密矩阵运算相结合,提出了一个根本性的硬件挑战。
Digital Twins (DTs) 正在越来越多地作为复杂社会技术系统中的自主决策者使用。它们的数学上最优的决策常常会出现偏差……