[论文] GraphCue 用于 SDN 配置代码合成
我们提出 GraphCue,一个基于拓扑的检索和 agent‑in‑the‑loop 框架,用于自动化 SDN 配置。每个案例都抽象为一个 JSON 图…
我们提出 GraphCue,一个基于拓扑的检索和 agent‑in‑the‑loop 框架,用于自动化 SDN 配置。每个案例都抽象为一个 JSON 图…
时空图神经网络(ST‑GNNs)非常适合处理来自地理分布式传感器的高频数据流,用于智能移动…
将近似最近邻搜索(ANNS)扩展到数十亿向量,需要能够在准确率、延迟和吞吐量之间取得平衡的分布式索引。然而仍然存在……
联邦学习 (Federated Learning, FL) 允许多个客户端在不共享其私有数据的情况下协同训练模型。然而,FL 易受到拜占庭攻击...
概述 OpenAI Gym 是一个用于通过试错教计算机的简单实验平台。你把任务放进去,程序尝试动作,从错误中学习,……
文章 URL: https://www.cs251.com/ 评论 URL: https://news.ycombinator.com/item?id=46319946 点数: 35 评论: 3...
扩散大语言模型(dLLMs)已成为自回归模型(ARMs)的有前景的替代方案,利用并行解码克服顺序……
现代区块链日益采用 multi-proposer (MCP) 共识,以消除单领袖瓶颈并提升 censorship resistance。然而,仅靠 MCP …
Depth-of-field 控制在摄影中至关重要,但要获得完美的焦点往往需要多次尝试或特殊设备。Single-image refocusing 仍然是……
我们提出 WorldCanvas,一个用于可提示世界事件的框架,通过结合文本、轨迹和参考图像,实现丰富的、用户导向的模拟。
受生成式预训练在自然语言领域成功的启发,我们探讨相同的原理是否能产生强大的自监督视觉学习者。Inst...
传统的多模态大语言模型(MLLM)评估方法缺乏可解释性,且往往不足以充分揭示跨…的显著能力差距。
从视觉输入感知和重建 3D 场景几何对于自动驾驶至关重要。然而,目前仍缺乏针对驾驶任务的稠密几何。
虽然 image editing 发展迅速,但 video editing 仍然较少被探索,面临 consistency、control 和 generalization 的挑战。我们研究了设计...
最近的研究表明,多模态大型语言模型(MLLMs)受益于与视觉工具交互的多模态交叉链式思考(CoT)。
Large language models (LLMs) 具备显式推理能力,在数学推理方面表现出色,但仍会出现过程错误,例如计算错误……
立体显示技术的快速增长,包括 VR 头盔和 3D 影院,导致对高质量立体视频内容的需求不断增加。然而,pr...
先前研究调查大型语言模型(LLMs)的内部工作原理时,发现了稀疏子网络,通常称为 circuits,负责执行……
在本工作中,我们提出了一种全景度量深度基础模型,能够在不同场景距离上实现泛化。我们探索了一种 data‑in‑the‑loop 范式……
本文研究了在可验证奖励(RLVR)强化学习框架中探索‑利用的权衡,这一框架用于提升推理的……
在从机器人到语言等各个领域,标准做法是首先在大规模 demonstration dataset 上对 policy 进行 pretrain,然后对该 policy 进行 finetune,……
近期在多模态模型方面的进展凸显了图像标记化在高分辨率图像生成中的关键作用。通过将图像压缩成紧凑的...
先前关于3D 手部轨迹预测的工作受到数据集的限制,这些数据集将运动与语义监督解耦,并且模型在推理方面的关联较弱。
生成时文本水印将统计信号嵌入文本,以实现对 AI 生成内容的可追溯性。我们探索 *post-hoc watermarking*,其中 LLM…