· ai
[Paper] 将上下文作为工具:长时程 SWE-Agents 的上下文管理
基于大语言模型的代理最近在需要长期交互的真实软件工程(SWE)任务中展示了强大的潜力……
基于大语言模型的代理最近在需要长期交互的真实软件工程(SWE)任务中展示了强大的潜力……
我们考虑在数据驱动的线性动力学模型中恢复线性守恒律的问题。给定一个学习得到的算子 widehat{A} 和一个满秩约束……
投影梯度下降(Projected Gradient Descent,PGD)是一种强大且广泛使用的一阶对抗攻击,但其计算成本扩展性差,因为所有训练样本 u...
能源消耗决定了部署大型语言模型的成本和环境影响。本文研究了片上 SRAM 大小和 op...
实时、流式交互式化身是数字人研究中的关键且具有挑战性的目标。虽然基于 diffusion 的人类化身生成…
自然语言处理(NLP)系统正日益被用于医疗保健、金融和政府等敏感领域,在这些领域它们处理大量…
现代学习系统的稳定性分析常常基于平滑性假设,而这些假设被 ReLU 类型的非线性所违反。在本说明中,w...
GUI 代理的开发可能会彻底改变下一代人机交互。受此愿景的激励,我们提出了 MAI-UI,一个 … 系列。
基于提示的 Video Segmentation Foundation Models(VSFMs),如 SAM2,正日益在自动驾驶和数字病理等应用中部署,……
Hit identification 是药物发现流程中一个关键且资源密集的步骤,传统上依赖于对大规模化合物的 high-throughput screening …
在持续学习(Continual Learning, CL)中,一个根本性的挑战是灾难性遗忘,即在适应新任务时会导致先前任务的性能下降。虽然……
生成式人工智能的快速发展使得能够创建高度逼真的假面部图像,对个人 ... 构成了严重威胁。