[Paper] 语义等价的代码转换如何影响代码LLMs的成员推断?
大型语言模型在代码方面的成功依赖于海量的代码数据,包括公共开源仓库,如 GitHub,以及私有的、保密的…
大型语言模型在代码方面的成功依赖于海量的代码数据,包括公共开源仓库,如 GitHub,以及私有的、保密的…
在代码审查中使用像 ChatGPT 这样的大语言模型可以带来有前景的效率提升,但也引发了对正确性和安全性的担忧。Existing e...
在制造业中,作为资产管理外壳(Asset Administration Shells,AAS)实现的数字孪生已经成为一种普遍的实践。这些数字复制品,常被用作 …
可重用的软件组件,通常以包的形式分发,是现代软件开发的核心范式。JavaScript 生态系统作为一个...
确保自动驾驶系统(ADS)的安全性和可靠性仍然是一个关键挑战,因为传统的验证方法,如大规模的……
现代数据中心拥有成千上万的服务器,使它们成为电力的主要消耗者。为了将其环境影响降至最低,关键是我们要使用……
我们提出了 LLMQ,这是一种端到端的 CUDA/C++ 实现,用于在经济实惠的通用 GPU 上进行中等规模语言模型的训练,例如 3B 到 32B 参数。
Digital twin (DT) 技术整合 heterogeneous data and models,以及 semantic technologies,以创建物理系统的多层次数字表示。
BPMN业务流程的日益广泛使用,以及其中包含的DMN表格,需要工具和方法来验证它们的正确性。然而,...
数据驱动的进化算法在通过稳健的 surrogate modeling 解决昂贵的优化问题方面展现出惊人的成果。虽然前景可期……
对高性能数据传输的追求通常侧重于原始网络带宽,且 100 Gbps 或更高的国际链路常被视为…
现代 AI 系统日益增长的计算需求暴露了数字硬件的根本限制,推动了对 alternative paradigms 的兴趣 fo...
创新农业系统正在彻底改变我们的耕作方式,使其成为我们时代最关键的创新之一!然而,它面临着重大的连接性……
我们提出了一种振荡神经形态原语,使用耦合的Wien桥振荡器网络和可调电阻耦合实现。相位关系…
流式视频生成的核心挑战是保持长上下文中的内容一致性,这对内存设计提出了很高的要求。Mo...
本论文并未提出新方法,而是为视频时间定位(VTG)建立了一个直接、渐进且必不可少的基线,……
非参数量化因其在参数上的高效性以及对大码本的可扩展性而受到广泛关注。本文中,我们提出了一种 uni...
我们介绍了 CRISP,这是一种从单目视频中恢复可模拟的人体运动和场景几何的方法。先前关于人‑场景联合重建的工作…
Universal transformers (UTs) 已被广泛用于诸如 ARC-AGI 和 Sudoku 等复杂推理任务,然而它们性能提升的具体来源仍然...
近年来,3D 生成建模的最新进展显著提升了生成的真实感,但该领域仍受到现有表示方式的限制,……
Video foundation models 生成视觉上逼真且时间上连贯的内容,但它们作为 world simulators 的可靠性取决于它们是否捕捉到 …
最近在人形机器人领域的进展已经实现了灵活的运动技能,包括后空翻、跑步和爬行。然而,对于人形机器人来说仍然具有挑战性……
最近的音频语言模型能够跟随长对话。然而,情感感知或口语对话摘要的研究受到数据缺乏的限制……
随机优化是现代机器学习的基础。最近的研究已经将随机一阶方法(SFOM)的研究从轻量级…