Source

arXiv

4650 posts from this source

排序:

1个月前 · ai · - · -

[Paper] 通过黑盒、面向漏洞的扫描检测代码生成 LLM 中的数据投毒

代码生成大语言模型（LLMs）正日益融入现代软件开发工作流。最近的研究表明，这些模型……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] HierarchicalKV：一种具有缓存语义的 GPU 哈希表，用于连续在线嵌入存储

传统的 GPU 哈希表会保留每个插入的键——这种字典假设在嵌入表常规使用时会浪费稀缺的 High Bandwidth Memory (HBM)。

#research #paper #devops
1个月前 · ai · - · -

[Paper] 二次代理吸引子用于粒子群优化

本文提出了一种粒子群优化算法，利用代理模型将传统的全局最佳解替换为最小 …

#research #paper #ai
1个月前 · ai · - · -

[Paper] 优化嵌入式主动多保真代理学习用于多工况翼型形状优化

针对多工况翼型形状优化，开发了主动多保真度 surrogate modeling，以降低高保真 CFD 成本，同时保持 RANS 级别的……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] WorldCam：交互式自回归3D游戏世界，以相机姿态作为统一的几何表示

最近在 video diffusion transformers 方面的进展使得交互式游戏世界模型成为可能，允许用户在扩展的…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] MessyKitchens：接触丰富的对象级 3D 场景重建

Monocular 3D scene reconstruction 最近取得了显著进展。得益于现代 neural architectures 和大规模数据，近期方法实现了……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] SegviGen：重新利用3D生成模型进行部件分割

我们介绍了 SegviGen，一个将原生 3D 生成模型重新用于 3D 部件分割的框架。现有的流水线要么将强大的 2D 先验提升到 3D……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] ManiTwin：将 Data-Generation-Ready Digital Object Dataset 扩展至 100K

在 simulation 中的学习为扩展 robotic manipulation 能力提供了有用的基础。然而，这一范式常常受到缺乏 data-gene…的困扰。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SparkVSR：通过稀疏关键帧传播的交互式视频超分辨率

视频超分辨率（VSR）的目标是从低分辨率（LR）估计中恢复高质量的视频帧，但大多数现有的VSR方法表现得像黑盒……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] SocialOmni：在 Omni 模型中的音视频社交互动基准测试

全模态大型语言模型（OLMs）通过原生整合音频、视觉和文本，重新定义了人机交互。然而，现有的 OLM 基准测试 rem...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

【论文】SOMA：统一参数化人体模型

参数化人体模型是人体重建、动画和仿真的基础，但它们仍然相互不兼容：SMPL、SMPL-X、MHR、Anny…

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 长时程交通预测：基于事件感知的共形时空Transformer

可靠的 multi-horizon traffic forecasting 具有挑战性，因为 network conditions 是 stochastic，incident disruptions 是 intermittent，并且有效的 spatial ...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 面向语言模型的在线体验式学习

当前改进大型语言模型的主流范式依赖于使用人工标注或模拟环境的离线训练，忽视了丰富的经验……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 统一优化与动力学以并行化顺序计算：突破顺序瓶颈的并行 Newton 方法指南

大规模并行硬件（GPUs）和长序列数据使得并行算法在大规模机器学习中变得必不可少。然而，动力系统，如递…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] GIST：Gauge-Invariant Spectral Transformers for Scalable Graph Neural Operators

将 transformer positional encoding 适配到 meshes 和 graph-structured data 会带来显著的计算挑战：精确的 spectral methods 需要立方时间复杂度……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 平庸是 LLM 作为 Judge Anchor Selection 的关键

“LLM-as-a-judge”范式已成为评估开放式生成的标准方法。为了解决成对比较的二次可扩展性成本……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 动态元层聚合用于拜占庭鲁棒联邦学习

联邦学习（Federated Learning，FL）正日益应用于医疗、金融和物联网（IoT）等领域，实现协作模型训练的同时保护用户隐私……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] M^3：稠密匹配与多视角基础模型在单目 Gaussian Splatting SLAM 中的结合

从未标定的单目视频进行流式重建仍然具有挑战性，因为它既需要高精度的姿态估计，又需要计算效率高的……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 从反思经验中内化能动性

Large language models 正日益被部署为 autonomous agents，需要通过与环境的长期交互来计划、行动并从错误中恢复。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 随机重置加速强化学习中的策略收敛

随机重置（Stochastic resetting），即将动力学过程间歇性地返回到固定的参考状态，已成为一种用于优化首次通过时间等指标的强大机制。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] DINO 看到了什么：ALiBi 位置编码降低了 Vision Transformers 中的位置信息偏置

Vision transformers（ViTs）——尤其是像 DINOv2 这样的特征基础模型——学习到丰富的表征，可用于许多下游任务。然而，architectu...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 学习演示：逆向规范奖励用于自主幻灯片生成

自动化演示文稿生成仍然是一项具有挑战性的任务，需要连贯的内容创作、视觉设计以及面向受众的沟通。本工作……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 对遥感数据集标签噪声识别的以数据为中心方法的评估

Label noise（指错误标签）在许多真实世界的数据集中存在，已知会严重限制深度学习模型的泛化能力。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] Prompt 编程：大型语言模型的文化偏见与对齐

文化塑造了推理、价值观、优先级以及战略决策，但大型语言模型（LLMs）常常表现出与之不一致的文化偏见，导致……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 深度强化学习驱动的边缘卸载用于延迟受限的 XR 流程

沉浸式扩展现实（XR）应用引入了对延迟高度敏感的工作负载，这些工作负载必须在满足严格的实时响应要求的同时，运行在能源……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] RAG 基于 LLM 的 Conformal Factuality 是否稳健？新指标与系统性洞察

大型语言模型（LLMs）经常出现幻觉，限制了它们在知识密集型应用中的可靠性。检索增强生成（RAG）和 co...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 基于 ODIN 的 CPU‑GPU 架构，采用 Replay 驱动的仿真与模拟

CPU 与 GPU 技术的集成是现代 AI 与图形工作负载的关键推动因素，它将面向控制的处理与大规模并行计算相结合。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] RaDAR：关系感知扩散-非对称图对比学习用于推荐

协同过滤（CF）推荐通过整合图神经网络（GNNs）和图对比学习（GCL）得到了显著提升。Ho...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 高维 Gaussian 均值估计在可实现污染下

我们研究在缺失数据方案——可实现的 ε‑contamination model——下，对 (mathbb{R}^d) 中具有单位协方差的 Gaussian 分布的均值估计。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 通过 Cognitive-Load Aware Automated Refactoring 提升初学者程序员的代码理解

新手程序员常常因为命名模糊、深层嵌套以及结构组织不佳而难以理解代码。虽然解释可能提供部分……

#research #paper #software
1个月前 · ai · - · -

[Paper] InCoder-32B：面向工业场景的代码基础模型

近期的代码大型语言模型在通用编程任务上取得了显著进展。然而，它们的性能在…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SpokenUS：用于任务导向对话的语音用户模拟器

稳健的任务导向语音对话代理需要接触人们通过语音交互的全部多样性。构建语音用户模拟器……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] SOMP：可扩展梯度反演用于大语言模型的子空间引导正交匹配追踪

梯度反演攻击表明，私有训练文本可以从共享梯度中重建，这对大型语言模型（LLMs）构成隐私风险。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] TurnWise：单轮与多轮语言模型能力之间的差距

多轮对话是语言模型交互的常见且关键的模式。然而，当前公开的训练和评估数据主要关注单轮……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 通过作者画像探测大型语言模型中的文化信号

大型语言模型（LLMs）正日益被部署在具有社会影响的应用中，引发了对其所编码的文化偏见的担忧。我们探讨……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] IQuest-Coder-V1 技术报告

在本报告中，我们介绍了 IQuest-Coder-V1 系列（7B/14B/40B/40B-Loop），这是一类新的代码大型语言模型（LLMs）。超越静态代码表示……

#research #paper #ai #machine-learning #nlp
1个月前 · devops · - · -

[Paper] 在大海捞针（基因组）中寻找：稀疏驱动搜索用于识别癌症中的相关基因突变

癌症通常不是由单一基因突变（即 hit）引起的，而是由在细胞内累积的多重 hit 组合导致的。然而，枚举多重…

#research #paper #devops
1个月前 · devops · - · -

[Paper] 面向数据流的分类与 GPU 加速同态加密的性能分析

全同态加密（FHE）使得在加密数据上进行安全计算成为可能，但其计算成本仍是实际部署的主要障碍。...

#research #paper #devops
1个月前 · software · - · -

[Paper] 通过网络分析对可变性模型进行推理

特征模型被广泛用于捕获软件系统的配置空间。虽然已经研究了自动推理用于检测有问题的特征……

#research #paper #software
1个月前 · software · - · -

[Paper] TRACE：评估基于LLM的代码翻译执行效率

虽然大型语言模型（LLMs）显著提升了代码翻译的功能正确性，但执行效率这一关键维度仍然……

#research #paper #software
1个月前 · ai · - · -

[Paper] 线性化 Bregman 迭代用于稀疏脉冲神经网络

脉冲神经网络（SNN）提供了一种比传统人工神经网络（ANN）更节能的替代方案，但通常仍然需要大量的……

#research #paper #ai
1个月前 · software · - · -

[Paper] SseRex：实用的 Solana 智能合约符号执行

Solana 正在智能合约开发者和用户中迅速获得关注。然而，它日益增长的采用伴随着一系列重大安全事件……

#research #paper #software
1个月前 · software · - · -

[Paper] Prompts 融合需求与解决方案：从意图到实现

AI coding assistants 正在通过将重点从编写代码转向制定 prompts，重新塑造软件开发。在以聊天为中心的方法中，例如 vibe codi …

#research #paper #software
1个月前 · ai · - · -

[Paper] 代理辅助遗传编程与基于排序的表型特征化用于动态多模式项目调度

动态多模式资源受限项目调度问题（DMRCPSP）具有实际重要性，因为它需要在变化的条件下实时做出决策。

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] inference-fleet-sim：基于排队论的 LLM 推理舰队容量规划器

为 LLM 推理规模化 GPU fleet 比看起来更困难。显而易见的问题——需要多少 GPU、哪种类型、如何划分两池 fleet——没有明确的答案……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 面向动态环境中可推广的机器人操作

Vision-Language-Action (VLA) 模型在静态操作方面表现出色，但在具有移动目标的动态环境中表现不佳。这一性能差距主要源于 …

#research #paper #ai #computer-vision
1个月前 · ai · - · -

【论文】Mixture-of-Depths Attention

扩展深度是大型语言模型（LLMs）的关键驱动因素。然而，随着LLMs变得更深，它们往往会遭受信号衰减：信息特征形成……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 先观察后行动：提升视觉基础表征以用于视觉-语言-动作模型

Vision-Language-Action（VLA）模型最近作为一种有前景的机器人操作范式出现，其中可靠的动作预测关键依赖于……

#research #paper #ai #computer-vision

Newer posts

Older posts