[Paper] 通过黑盒、面向漏洞的扫描检测代码生成 LLM 中的数据投毒
代码生成大语言模型(LLMs)正日益融入现代软件开发工作流。最近的研究表明,这些模型……
4650 posts from this source
代码生成大语言模型(LLMs)正日益融入现代软件开发工作流。最近的研究表明,这些模型……
传统的 GPU 哈希表会保留每个插入的键——这种字典假设在嵌入表常规使用时会浪费稀缺的 High Bandwidth Memory (HBM)。
本文提出了一种粒子群优化算法,利用代理模型将传统的全局最佳解替换为最小 …
针对多工况翼型形状优化,开发了主动多保真度 surrogate modeling,以降低高保真 CFD 成本,同时保持 RANS 级别的……
最近在 video diffusion transformers 方面的进展使得交互式游戏世界模型成为可能,允许用户在扩展的…
Monocular 3D scene reconstruction 最近取得了显著进展。得益于现代 neural architectures 和大规模数据,近期方法实现了……
我们介绍了 SegviGen,一个将原生 3D 生成模型重新用于 3D 部件分割的框架。现有的流水线要么将强大的 2D 先验提升到 3D……
在 simulation 中的学习为扩展 robotic manipulation 能力提供了有用的基础。然而,这一范式常常受到缺乏 data-gene…的困扰。
视频超分辨率(VSR)的目标是从低分辨率(LR)估计中恢复高质量的视频帧,但大多数现有的VSR方法表现得像黑盒……
全模态大型语言模型(OLMs)通过原生整合音频、视觉和文本,重新定义了人机交互。然而,现有的 OLM 基准测试 rem...
参数化人体模型是人体重建、动画和仿真的基础,但它们仍然相互不兼容:SMPL、SMPL-X、MHR、Anny…
可靠的 multi-horizon traffic forecasting 具有挑战性,因为 network conditions 是 stochastic,incident disruptions 是 intermittent,并且有效的 spatial ...
当前改进大型语言模型的主流范式依赖于使用人工标注或模拟环境的离线训练,忽视了丰富的经验……
大规模并行硬件(GPUs)和长序列数据使得并行算法在大规模机器学习中变得必不可少。然而,动力系统,如递…
将 transformer positional encoding 适配到 meshes 和 graph-structured data 会带来显著的计算挑战:精确的 spectral methods 需要立方时间复杂度……
“LLM-as-a-judge”范式已成为评估开放式生成的标准方法。为了解决成对比较的二次可扩展性成本……
联邦学习(Federated Learning,FL)正日益应用于医疗、金融和物联网(IoT)等领域,实现协作模型训练的同时保护用户隐私……
从未标定的单目视频进行流式重建仍然具有挑战性,因为它既需要高精度的姿态估计,又需要计算效率高的……
Large language models 正日益被部署为 autonomous agents,需要通过与环境的长期交互来计划、行动并从错误中恢复。
随机重置(Stochastic resetting),即将动力学过程间歇性地返回到固定的参考状态,已成为一种用于优化首次通过时间等指标的强大机制。
Vision transformers(ViTs)——尤其是像 DINOv2 这样的特征基础模型——学习到丰富的表征,可用于许多下游任务。然而,architectu...
自动化演示文稿生成仍然是一项具有挑战性的任务,需要连贯的内容创作、视觉设计以及面向受众的沟通。本工作……
Label noise(指错误标签)在许多真实世界的数据集中存在,已知会严重限制深度学习模型的泛化能力。
文化塑造了推理、价值观、优先级以及战略决策,但大型语言模型(LLMs)常常表现出与之不一致的文化偏见,导致……
沉浸式扩展现实(XR)应用引入了对延迟高度敏感的工作负载,这些工作负载必须在满足严格的实时响应要求的同时,运行在能源……
大型语言模型(LLMs)经常出现幻觉,限制了它们在知识密集型应用中的可靠性。检索增强生成(RAG)和 co...
CPU 与 GPU 技术的集成是现代 AI 与图形工作负载的关键推动因素,它将面向控制的处理与大规模并行计算相结合。
协同过滤(CF)推荐通过整合图神经网络(GNNs)和图对比学习(GCL)得到了显著提升。Ho...
我们研究在缺失数据方案——可实现的 ε‑contamination model——下,对 (mathbb{R}^d) 中具有单位协方差的 Gaussian 分布的均值估计。
新手程序员常常因为命名模糊、深层嵌套以及结构组织不佳而难以理解代码。虽然解释可能提供部分……
近期的代码大型语言模型在通用编程任务上取得了显著进展。然而,它们的性能在…
稳健的任务导向语音对话代理需要接触人们通过语音交互的全部多样性。构建语音用户模拟器……
梯度反演攻击表明,私有训练文本可以从共享梯度中重建,这对大型语言模型(LLMs)构成隐私风险。
多轮对话是语言模型交互的常见且关键的模式。然而,当前公开的训练和评估数据主要关注单轮……
大型语言模型(LLMs)正日益被部署在具有社会影响的应用中,引发了对其所编码的文化偏见的担忧。我们探讨……
在本报告中,我们介绍了 IQuest-Coder-V1 系列(7B/14B/40B/40B-Loop),这是一类新的代码大型语言模型(LLMs)。超越静态代码表示……
癌症通常不是由单一基因突变(即 hit)引起的,而是由在细胞内累积的多重 hit 组合导致的。然而,枚举多重…
全同态加密(FHE)使得在加密数据上进行安全计算成为可能,但其计算成本仍是实际部署的主要障碍。...
特征模型被广泛用于捕获软件系统的配置空间。虽然已经研究了自动推理用于检测有问题的特征……
虽然大型语言模型(LLMs)显著提升了代码翻译的功能正确性,但执行效率这一关键维度仍然……
脉冲神经网络(SNN)提供了一种比传统人工神经网络(ANN)更节能的替代方案,但通常仍然需要大量的……
Solana 正在智能合约开发者和用户中迅速获得关注。然而,它日益增长的采用伴随着一系列重大安全事件……
AI coding assistants 正在通过将重点从编写代码转向制定 prompts,重新塑造软件开发。在以聊天为中心的方法中,例如 vibe codi …
动态多模式资源受限项目调度问题(DMRCPSP)具有实际重要性,因为它需要在变化的条件下实时做出决策。
为 LLM 推理规模化 GPU fleet 比看起来更困难。显而易见的问题——需要多少 GPU、哪种类型、如何划分两池 fleet——没有明确的答案……
Vision-Language-Action (VLA) 模型在静态操作方面表现出色,但在具有移动目标的动态环境中表现不佳。这一性能差距主要源于 …
扩展深度是大型语言模型(LLMs)的关键驱动因素。然而,随着LLMs变得更深,它们往往会遭受信号衰减:信息特征形成……
Vision-Language-Action(VLA)模型最近作为一种有前景的机器人操作范式出现,其中可靠的动作预测关键依赖于……