[Paper] AI-NativeBench:面向 AI 原生系统的开源白盒代理式基准套件
从 Cloud-Native 到 AI-Native 架构的转变正在从根本上重塑软件工程,用概率性的微服务取代确定性微服务。
从 Cloud-Native 到 AI-Native 架构的转变正在从根本上重塑软件工程,用概率性的微服务取代确定性微服务。
在 fault-tolerant quantum computing 中,需要大量的 physical qubits 来构建单个 logical qubit,并且单个 quantum node 可能能够 t...
Zero-Knowledge(ZK)证明系统是密码学协议,能够(以压倒性概率)证明对 (X, W) 属于关系 R,且…
当需要在一组代理人之间分配资源并遵循平等主义社会福利时,目标是最大化效用最小的代理人的效用。
大规模、计算密集型的应用,如高性能计算、人工智能和大数据的广泛部署正导致……
Cluster workload allocation 通常需要复杂的配置,导致可用性差距。本文介绍了一种 semantic, intent‑driven scheduling paradigm。
LLM 推理延迟在决定用户体验和运营成本方面至关重要,直接影响在 SLO 约束下的吞吐量。即使是短暂的延迟峰值……
并行拜占庭容错(BFT)协议被视为解决许可区块链共识可扩展性问题的有前景的方案。
在本研究中,我们提出了 SafePlanner,这是一种系统化的测试框架,用于识别自动驾驶系统(ADS)中 Plan 模型的安全关键缺陷……
差分隐私联邦学习(DP-FL)在严格的隐私预算下由于为保持隐私而引入的巨大噪声,导致收敛速度缓慢。
我们提出了一种基于 Byzantine Consistent Broadcast 的现代支付系统中的事务驱动动态重配置协议,该协议能够实现高性能……
通用矩阵乘法(GEMM)是科学计算中的核心算法之一。单线程 GEMM 实现已得到良好优化,...
Split Federated Learning (SFL) 使资源受限的边缘设备与计算资源丰富的服务器之间能够进行协作训练。通信开销是一个…
隐形水印已成为验证 AI 生成图像内容的关键机制,主要平台正在大规模部署水印方案……
像 SAM2 这样的 Video object segmentation 方法通过基于 memory 的架构实现了强大的性能,但在视角大幅变化时会因可靠性…
在本研究中,我们使用真实的会议论文提交,探讨在 Elo 排名审稿系统中大型语言模型(LLM)代理审稿人的动态。Mu...
尽管视频生成模型取得了快速进展,但数据在影响运动方面的作用仍然了解不足。我们提出了 Motive(MOTIon attribution for Vi...)。
推荐系统的演进已经将偏好存储从 rating matrices 和 dense embeddings 转向了 agentic era 中的 semantic memory。然而现存…
最近大型语言模型(LLMs)在强推理能力方面的发展推动了数学、编码和科学等多个领域的研究。
大型语言模型在使用链式思考(Chain-of-Thought,CoT)时,往往能更有效地解决复杂推理任务,但代价是需要更长、低带宽的 token 序列。
在大多数人物再识别(ReID)方法中,Tracklet 质量常常被视为事后考虑,绝大多数研究仅关注架构的修改……
我们引入了软件工程 AI 生产力指数(APEX‑SWE),这是一项用于评估前沿 AI 模型是否能够执行具有经济价值的……的基准。
Mixture of Experts (MoE) 模型正成为大型语言模型 (LLMs) 的最新范式。然而,由于内存限制,MoE 模型带有 bi…
准确的个体识别对于监测稀有两栖动物至关重要,但侵入性标记往往不适用于极危物种。我们 e...