[Paper] Confucius Code Agent:工业规模的开源 AI 软件工程师
现实世界的 AI 软件工程需要能够在海量代码库上进行推理、在跨会话和长会话中保持持久记忆的编码代理,且……
3337 posts from this source
现实世界的 AI 软件工程需要能够在海量代码库上进行推理、在跨会话和长会话中保持持久记忆的编码代理,且……
基于 LLM-agent 的 binary code analysis 已经在广泛的软件安全场景中展示出显著的潜力,包括漏洞检测……
对协作机器学习和数据分析日益增长的需求,要求建立能够平衡隐私、信任的安全且去中心化的数据共享框架。
Serverless computing 已经通过提供一种高效且具成本效益的方式,使用户能够在无需…
本文件报告了在 Big Data 课程中实施的实践和方法的顺序。它详细描述了从处理开始的工作流……
现代云平台日益托管大规模深度学习(DL)工作负载,需要高吞吐量、低延迟的 GPU 调度。然而,日益增长的 h...
有效的问题解决对于维护软件质量至关重要。然而,开发人员经常遇到诸如低质量的问题报告、有限…
在优化和搜索过程中的效率仍然是一个挑战,它影响着优化算法的性能和使用。Utilisin...
现代机器智能的效率取决于在最小计算成本下实现高精度。在脉冲神经网络(SNNs)中,突触延迟是c...
表征遍及我们的日常体验,从代表声音的字母到编码数字文件的 bit strings。虽然这些表征需要外部…
World models 与模型预测控制 (MPC) 相结合,可以在大规模专家轨迹数据集上离线训练,并实现对广泛场景的泛化。
最近在基于 Gaussian Splatting 的逆渲染方面的进展将 Gaussian 基元扩展了着色参数和物理上有依据的光传输,enabli...
Video unified models 在理解和生成方面表现出强大的能力,但即使配备了 …,它们在基于推理的视觉编辑方面仍然存在困难。
Radiance field 表示最近在常用于 diffusion models 的 VAE 的 latent space 中被探索。这一方向提供了高效的…
为了实现human-robot coexistence,socially aware navigation 对移动机器人至关重要。然而,现有的研究主要关注路径效率……
在热力学平衡状态下对分子态进行可扩展采样是统计物理学长期存在的挑战。Boltzmann Generators 旨在解决这一问题。
我们提出 NordFKB,这是一套用于挪威地理空间 AI 的细粒度 benchmark dataset,来源于权威且高度精确的国家 Felles KartdataBase …
In-context learning with attention 使大型神经网络能够通过有选择地关注相关示例来进行特定上下文的预测。这里,我们 ada...
神经机器翻译(NMT)中的持续学习面临灾难性遗忘和重新训练的高计算成本这两大挑战。此……
Reinforcement learning 代理在 sparse-reward 或 safety-critical 环境中常常表现出意外行为,这导致对可靠的 debugging 和 verification 产生了强烈需求。
Moralisation 和 Triangulation 是允许在不同的概率分布因式分解为图模型的方式之间切换的变换。Mor...
视觉语言模型(VLMs)在感知和描述视觉环境方面取得了令人印象深刻的进展。然而,它们主动推理的能力……
视觉导航已成为一种实用的替代方案,取代了依赖详细映射和路径规划的传统机器人导航流水线。然而,c...
Backpressure (BP) 路由和调度是一种成熟的资源分配方法,适用于无线多跳网络,以其完全分布式操作而著称……
无人机(UAVs)与无人地面车辆(UGVs)的融合正日益成为智能自主系统发展的核心……
在复杂的文本环境中进行长期规划面临重大挑战,因为动作空间是开放式的,观察往往模糊不清,且反馈稀疏……
元数据词汇对于推进 FAIR 和 FARR 数据原则至关重要,但其开发受到有限的人力资源和不一致的 s...
最近在蛋白质语言模型(PLMs)方面的进展展示了在理解蛋白质序列方面的卓越能力。然而,差异的程度……
虽然现代语言模型及其内部工作机制极其复杂,最近的研究(Golowich, Liu & Shetty; 2025)提出了一种简单且潜在的……
我们分析了两种常用作过平滑度量的泛函之间的区别:由未归一化 graph Laplacian 诱导的 Dirichlet 能量以及 …
知识蒸馏(KD)已成为一种有前景的模型压缩技术,但面临关键限制:(1)对超参数的敏感性要求……
正确地从 PDF 中解析数学公式对于训练大型语言模型以及从学术文献构建科学知识库至关重要……
线性光谱混合模型(LMM)提供了一种简洁的形式来解耦组成材料(endmembers)及其相应的比例(abundance)...
预训练的多模态大型语言模型(MLLMs)正日益被部署在医学 AI 系统中,用于临床推理、诊断支持和报告生成……
大型语言模型(LLMs)正日益在人的交流、决策支持、内容创作和信息检索中起到中介作用。尽管表现出令人印象深刻的流畅性……
我们引入了 Conformal Bandits,这是一种将 Conformal Prediction(CP)融入 bandit 问题的全新框架,bandit 问题是序列决策的经典范式……
时间感知是 omni 大型语言模型的一项基本能力,尤其在理解长视频和回答复杂问题时。先前的做法…
在 factorized joins 上学习模型通过识别并预先计算共享因子,避免了冗余计算。先前的工作已经研究了性能……
本章探讨了大型语言模型在法律领域的应用,展示了它们在优化和增强传统法律任务方面的潜力……
本文介绍了 OnCoCo 1.0,一个用于在线咨询中细粒度消息分类的新公共数据集。它基于一个新的、综合的系统……
低功耗微控制器(MCU)硬件目前正从单核架构演进为以多核架构为主。与此同时,新的嵌入…
近期,普适计算与机器学习的融合催生了众多服务,几乎影响到经济和社会活动的所有领域。
文化是人际互动的核心组成部分,在我们感知和与他人交往的方式中发挥着至关重要的作用。关于有效性的进展……
角色扮演代理(RPAs)必须同时掌握许多相互冲突的技能——遵循多轮指令、展示领域知识以及采用……
构建 Pareto 集合对于在大型语言模型(LLMs)的能力‑效率权衡中进行导航至关重要;然而,现有的合并技术 r...
构建Pareto集合对于在大语言模型(LLMs)的能力‑效率权衡中进行导航至关重要;然而,现有的合并技术……
LLM之所以有用,是因为它们的泛化能力非常强。但好事会不会太多?我们展示了在狭窄情境中进行少量微调可以……
本文首次提出一种同时引入 lock-freedom 和 recoverability 的转换。我们的转换从 lock-based 实现开始,……