[Paper] 学习无需人工知识的可证明正确的分布式协议
可证明正确的分布式协议是现代分布式系统的关键组成部分,设计它们极具挑战性,且通常需要 d...
可证明正确的分布式协议是现代分布式系统的关键组成部分,设计它们极具挑战性,且通常需要 d...
梯度无关的黑箱优化(BBO)在工程设计中被广泛使用,并为拓扑优化(TO)提供了灵活的框架,使得 d...
网络安全运营需要能够支持多样化工作流且不泄露敏感数据的助手 LLM。现有解决方案要么依赖于专有 API……
现代的 diffusion/flow-based 模型用于图像生成通常具有两个核心特征:(i) 使用多步采样,(ii) 在 latent …
公共仓库托管着数百万个微调模型,但社区的使用仍然过度集中在少数基础检查点上……
混合Transformer架构结合了softmax注意力块和循环神经网络(RNN),已展示出理想的性能‑吞吐量权衡……
Agentic Reinforcement Learning(Agentic RL)在使智能体进行复杂推理和工具使用方面取得了显著成功。然而,大多数方法仍然…
我们推出了 UEval,这是一套用于评估统一模型的基准测试,即能够同时生成图像和文本的模型。UEval 包含 1,000 条专家策划的问题……
操纵动态对象仍然是视觉-语言-动作(Vision-Language-Action,VLA)模型的一个未解决的挑战,尽管这些模型在静态操纵方面表现出强大的泛化能力,却仍然...
神经网络已成功应用于各种资源受限的边缘设备,在这些设备中通常使用中央处理单元(CPU)而不是图形处理单元(GPU)……
大型视觉语言模型(VLMs)常常在原始图像上对经典视觉错觉给出“正确”的答案,但在错觉事实出现时仍坚持相同的回应……
自主网页代理的开发,由 Large Language Models (LLMs) 和 reinforcement learning (RL) 驱动,代表了朝向通用…的重大一步。
由于监督训练数据有限,大型语言模型(LLMs)通常在庞大的文本语料上通过自监督的“预测下一个词”目标进行预训练。
Audio-Visual Foundation Models,作为预训练模型,能够联合生成声音和视觉内容,最近展现出前所未有的建模多模态的能力……
在剪枝中,Lottery Ticket Hypothesis 假设大型网络包含稀疏子网络(即 winning tickets),这些子网络可以单独训练,以匹配 …
面向推理的 Large Language Models (LLMs) 已经通过 Chain-of-Thought (CoT) 提示取得了显著进展,但它们在根本上仍然受到限制……
矩阵函数,如 square root、inverse roots 和 orthogonalization,在用于神经网络训练的 preconditioned gradient methods 中发挥核心作用。T...
现有的智能体安全基准报告二元准确率,将早期干预与事后分析混为一谈。一个在第8步标记违规的检测器……
Full-image relighting 仍然是一个具有挑战性的问题,因为收集 large-scale structured paired data 的难度,以及保持物理…
胰腺导管腺癌(PDAC)是最致命的实体恶性肿瘤之一,常在晚期且不可手术的阶段被发现。对既往的…进行回顾性审查。
大型语言模型(LLMs)在复杂推理任务上提供最先进的性能,但其推理成本限制了大规模部署。Small Languag...
多目标优化旨在解决具有竞争目标的问题,通常只能以黑箱方式访问问题,并且测量预算有限……
前沿的大型语言模型(LLMs)在许多领域作为自主代理表现出色,但它们在隐藏工作流的复杂企业系统中仍未经过测试……
测试时缩放已被广泛采用,以增强大型语言模型(LLM)代理在软件工程(SWE)任务中的能力。然而,the sta...