[Paper] Rudder:使用 LLM 代理在分布式 GNN 训练中引导预取
大规模图神经网络(GNNs)通常通过对顶点的邻居进行固定距离的采样来进行训练。由于大规模输入图是分布式的,...
4654 posts from this source
大规模图神经网络(GNNs)通常通过对顶点的邻居进行固定距离的采样来进行训练。由于大规模输入图是分布式的,...
联邦学习(Federated Learning,FL)使一组客户端能够在不共享个人数据的情况下协同训练模型,但当客户端数据……
我们介绍了 MediX‑R1,一个面向医学多模态大语言模型(MLLMs)的开放式强化学习(RL)框架,能够实现临床基础的……
我们提出了一种可扩展的 3D reconstruction 模型,解决了离线 feed‑forward 方法的一个关键限制:它们的计算和内存需求……
大量的研究旨在控制 model disagreement —— 即两个 machine learning models 在 predictions 上的分歧程度。我们采用一种简单且标准的……
我们将 occlusion reasoning 视为 3D layout‑conditioned generation 的一个基础但被忽视的方面。它对于合成部分遮挡的……
受生物启发的事件相机因其异步和低延迟特性最近吸引了大量研究。这些特性提供了高 dy...
柏拉图表征假设认为,在不同模态上训练的神经网络会趋向于共享的世界统计模型。Rece...
最近的工作,例如 AlphaEvolve,已经表明,将 LLM 驱动的优化与进化搜索相结合,可以有效提升程序、提示和算法的性能。
在视觉语言模型(VLMs)的推理能力缺乏一直是研究讨论的前沿。我们认为这种行为源于……
标准的 mixed-precision 神经网络训练需要为每个模型参数占用大量 accelerator memory 字节。这些字节不仅反映了参数……
粗糙数据产生于学习者只能观察到样本的部分信息;即观察到包含样本的集合,而不是其精确数值。这种情况在...
Open-vocabulary segmentation (OVS) 将视觉语言模型 (VLMs) 的零样本识别能力扩展到像素级预测,使得能够对…
AI 驱动的科学研究工具正迅速融入研究工作流,但该领域缺乏对研究人员如何使用这些系统的清晰视角。
近年来,越来越多的出版物讨论了在软件工程中使用大型语言模型(LLMs)的最佳实践。然而,大多数...
大型语言模型(LLMs)的进步加速了自主金融交易系统的发展。虽然主流方法部署多...
大型语言模型(LLMs)在生物学基准测试中表现日益出色,但仍不清楚它们是否能提升新手用户——即使人类能够……
Self-reflection 使 language agents 能够迭代地优化解决方案,但往往会产生重复的输出,限制了 reasoning performance。Recent studies ...
广义快速动作价值估计(GRAVE)已被证明是蒙特卡罗树搜索(MCTS)算法家族中一种强大的变体,适用于……
Omni-modal reasoning 对于智能系统理解并从多样化数据源中进行推断是必不可少的。虽然现有的 omni-modal large language …
医学诊断需要有效地综合视觉表现和临床元数据。然而,现有方法往往将元数据视为孤立的任务……
近年来,大规模数据集阻碍了高效的模型训练,同时也包含冗余概念。Dataset distillation 旨在合成紧凑的数据集……
现实世界的表格-文本问答(QA)任务需要模型能够在长文本和源表格之间进行推理,跨越多跳并执行 co...
扩散语言模型(DLM)常被宣传能够实现并行 token 生成,但实际的快速 DLM 往往会收敛为左到右的自回归模型……
I/O 性能对数据密集型科学计算的效率至关重要;但调优大规模存储系统既复杂、成本高,而且众所周知地需要大量人力。
在解码过程中降低大型语言模型(LLMs)的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...
基于Transformer的大型语言模型展现了上下文学习能力,使其能够通过少样本提示和示例来适应下游任务。在实践中……
我们提出了 MTRAG-UN,这是一项用于探索多轮检索增强生成(multi-turn retrieval augmented generation)中的开放挑战的基准,后者是大型语言模型的热门应用。我们发布了 …
深度学习(DL)库被广泛用于关键应用,即使是细微的静默错误也可能导致严重后果。虽然现有的 DL fuzz …
大型语言模型(LLM)服务基础设施正经历向异构化和解耦的转变。现代部署越来越多地集成了多…
在诸如寿命超声心动图等安全关键领域应用基于LLM的多代理软件系统会引入无法解决的系统级风险。
本文通过利用一种基于对称性原理的新型 primitives 类别——isotropic activation functions,提出了一种用于 dynamic networks 的创新方法。该...
现代 multi-tenant、hardware-heterogeneous 计算环境对有效的 workload orchestration 构成了重大挑战。简单的启发式方法用于评估……
Hybrid work 已成为后疫情时代的现实,正在改变 Agile 团队交付价值、协作和适应的方式。本研究调查混合环境中的……
种子爆炸是模糊测试种子调度中的一个根本性问题,在这种情况下,fuzzer 维护一个庞大的 corpus,却未能挑选出有前景的种子。现有工作 f...
Vision-Language-Action (VLA) 模型是多模态机器人任务控制器,给定指令和视觉输入后,生成一系列低层控制指令。
AI 编码代理的演进已经将前沿从简单的代码片段补全转向自主的仓库级工程。然而,评估这些 …
从非结构化点云数据中对动态3D对象进行时间一致的表面重建仍然具有挑战性,尤其是对于非常长的序列。E...
Egocentric manipulation videos 在交互过程中由于严重遮挡以及物体频繁进入和离开摄像头视野而极具挑战性……
现有的 action‑conditioned video generation models(video world models)局限于单代理视角,未能捕捉多代理交互……
多语言大型语言模型(LLM)评估的可靠性目前受到翻译基准质量不一致的影响。现有的...
苏美尔文字转写是一种传统系统,用于用拉丁字母表示学者对泥板的解释。多亏了有远见的数字亚述…
生成式人工智能(GenAI)的进步促使开发出多种保护策略,以防止图像的未经授权使用。这些方法依赖于...
Sybil resistance 是去中心化共识协议的关键要求。它通过引入稀缺资源(例如计算能力、moneta……)来实现。
我们研究如何进行推理,以访问存储在语言模型参数中的世界知识。例如,回忆堪培拉是澳大利亚的首都可能有益……
开源原生 GUI 代理在长期导航任务上仍落后于闭源系统。这一差距源于两个限制:高‑q…
建模岩石‑流体相互作用需要求解一组偏微分方程(PDE),以预测流体的流动行为以及流体与岩石的反应。
在过去的二十年里,Question Answering(QA)系统的设计和实现取得了显著进展。然而,针对复杂的…