Source

arXiv

4611 posts from this source

排序:

3周前 · software · - · -

[Paper] 从行业声称到实证现实：对 Pull Requests 中 Code Review Agents 的实证研究

自主编码代理正以前所未有的规模生成代码，仅 OpenAI Codex 在两个月内就创建了超过 400,000 个 pull request（PR）。随着代理……

#research #paper #software
3周前 · ai · - · -

[Paper] 可靠性门控多教师蒸馏用于低资源抽象式摘要

我们从 reliability aware perspective 研究 low resource abstractive summarization 的 multiteacher knowledge distillation。我们引入 EWAD（Entropy Weighte...）。

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 压缩差距：为何离散标记化限制Vision-Language-Action模型的规模化

通过升级视觉编码器来扩展视觉‑语言‑动作（VLA）模型，预计能够提升下游操作性能——正如它在视觉‑语言模型中所表现的那样……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 单个注意力层中的 Gradient Boosting

Transformer 注意力对值执行一次 softmax 加权平均——一种单遍估计，无法自行纠正错误。我们引入 gradient‑bo...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 反射式上下文学习：研究上下文空间的优化原语

一般具备能力的智能体必须通过经验学习，以在任务和环境之间实现泛化。学习的基本问题，包括 credi…

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 多视角视频扩散策略：一种 3D 时空感知视频动作模型

机器人操作需要理解环境的3D空间结构及其时间演化，但大多数现有策略忽视了其中之一……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] PRISM：LLM 引导的语义聚类用于高精度主题

在本文中，我们提出了 Precision-Informed Semantic Modeling（PRISM），一种结合丰富表征优势的结构化主题建模框架……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 理解 Hallucination 在 Reinforcement Post-Training 中对多模态推理模型的作用

近期强化学习（RL）在大型推理模型中的成功，激发了人们对在后训练的多模态大型语言模型中采用 RL 的日益增长的兴趣。

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[论文] SFFNet：协同特征融合网络与双域边缘增强用于无人机图像目标检测

在无人机（UAV）图像中的目标检测仍然是一项极具挑战性的任务，主要是由于背景噪声的复杂性和不平衡……

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 检测与纠正商业 LLMs 与深度研究代理中的参考幻觉

大型语言模型和深度研究代理提供引用 URL 来支持它们的主张，但这些引用的可靠性尚未系统地……

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] BibTeX 引用幻觉在科学出版代理中的评估与缓解

大型语言模型结合网络搜索正日益被用于科学出版代理，但它们仍然会生成包含普遍字段级错误的 BibTeX 条目……

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] Chart-RL：用于提升图表问答中视觉推理的策略优化强化学习，结合视觉语言模型

近期在 Vision Language Models（VLMs）方面的进展展示了朝向真正智能的进步，这需要强大的推理能力。Beyond pat...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] LLM中的 Valence-Arousal 子空间：循环情感几何与多行为控制

我们提出一种方法，在大型语言模型的表示中识别 valence‑arousal (VA) 子空间。基于 211k 情感标注文本，我们推导情感……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

【论文】InCoder-32B-Thinking：用于思考的工业代码世界模型

工业软件开发在芯片设计、GPU 优化和嵌入式系统方面缺乏专家推理痕迹，显示工程师如何推理困难……

#research #paper #ai #machine-learning #nlp
3周前 · devops · - · -

[Paper] TokenDance：通过集体 KV Cache 共享实现多代理 LLM 服务的规模化

Multi-agent LLM 应用将执行组织为同步回合，在这些回合中，central scheduler 收集所有代理的输出并重新分配组合后的 …

#research #paper #devops
3周前 · software · - · -

[Paper] PAFT：保留感知微调用于最小编辑程序修复

大型语言模型（LLMs）在自动程序修复方面效果显著，但能够通过完整测试套件的合理补丁往往会重写比必要更多的代码……

#research #paper #software
3周前 · ai · - · -

[Paper] SkillRT：编译技能以实现随处高效执行

LLM 代理越来越多地将技能作为可复用的组成单元。虽然技能在不同的代理平台之间共享，但当前系统将它们视为 ra...

#research #paper #ai #machine-learning
3周前 · devops · - · -

[Paper] HistMSO：一种用于推理一致性模型的逻辑（使用 MONA）

对 replicated data systems 的 consistency models 进行推理是一项具有挑战性的任务，需要对 consistency models 本身有深入的理解……

#research #paper #devops
3周前 · software · - · -

[Paper] 第七届真实系统形式分析模型研讨会论文集

这些论文集收录了在第七届真实系统形式分析模型研讨会（MARS 2026）上发表的论文，会议于12月……

#research #paper #software
3周前 · software · - · -

[Paper] 结合静态代码分析和大型语言模型提升算法识别的正确性和性能

背景：众所周知，开发人员在理解 source code 上花费了大量时间，能够自动识别……

#research #paper #software
3周前 · devops · - · -

[Paper] CIDER：通过悲观同步提升内存解耦键值存储

Memory-disaggregated key-value (KV) 存储由于其 I/O 冗余问题而遭受严重的性能瓶颈。大量冗余 I/O 正在…

#research #paper #devops
3周前 · ai · - · -

[Paper] FedSQ：通过固定门控实现的优化权重平均

联邦学习（Federated learning, FL）使跨组织的协作训练成为可能，而无需共享原始数据，但它受到统计异质性（非 i.i.d.）的阻碍……

#research #paper #ai #machine-learning
3周前 · devops · - · -

[Paper] MSAO：自适应模态稀疏感知卸载与边缘-云协作，实现高效多模态 LLM 推理

多模态大型语言模型（MLLMs）实现了强大的跨模态推理能力，但带来了巨大的计算和延迟负担，导致关键…

#research #paper #devops
3周前 · devops · - · -

[Paper] Digital Twin 辅助的网络内与边缘协作用于元宇宙中的联合用户关联、任务卸载和资源分配

扩展现实（XR）的进步正在推动元宇宙的发展，元宇宙需要高效的实时将2D场景转换为3D对象……

#research #paper #devops
3周前 · ai · - · -

[Paper] 可扩展的均值-方差投资组合优化：通过子空间嵌入和 GPU 友好的 Nesterov 加速投影梯度

我们开发了一种基于 sketch 的因子约简和一种 Nesterov 加速的投影梯度算法 (NPGA)，并使用 GPU 加速，实现了双重加速的 …

#research #paper #ai #machine-learning
3周前 · software · - · -

[Paper] 依赖引导的仓库级 C-to-Rust 翻译与强化对齐

自动化 C-to-Rust 迁移对于在不牺牲性能的前提下提升软件安全至关重要。传统的 rule-based 方法在处理多样化的……

#research #paper #software
3周前 · ai · - · -

[Paper] Oja's Subspace Rule的三因子学习规则的框架理论推导

我们展示了用于 PCA 的误差门控 Hebbian 规则（EGHR-PCA），这是一种在高斯输入下等价于 Oja 子空间规则的三因子学习规则，可以被系统...

#research #paper #ai
3周前 · software · - · -

[Paper] 评估使用 SLMs 与 Prompt Engineering 进行代码生成的环境影响

从云端托管的 Large Language Models（LLMs）转向本地部署的开源 Small Language Models（SLMs）使得 AI 辅助编码实现了民主化；然而……

#research #paper #software
3周前 · ai · - · -

[Paper] 无通信采样与 4D 混合并行用于可扩展的 Mini-batch GNN 训练

图神经网络（GNNs）被广泛用于在来自各种真实场景的图数据集上进行学习。对极其大型的图进行学习需要……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 波长复用的大规模并行衍射光学信息存储与图像投影

我们引入了一种 wavelength-multiplexed、massively parallel 的 diffractive information storage 平台，由结构优化的 dielectric surfaces 组成……

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 活体神经元计算：Chaos-Controlled Reservoir Computing 与 Knowledge Transplant

我们引入混沌控制的 Reservoir Computing（cc‑RC）用于活体神经培养物：这些动态丰富的基底在自适应计算方面具有独特的潜力。

#research #paper #ai
0个月前 · ai · - · -

[Paper] EventHub：用于无主动传感器的可推广事件驱动立体网络的数据工厂

我们提出 EventHub，一个用于训练深度事件立体网络的创新框架，无需来自昂贵主动传感器的真实标注，而是依赖于 s...

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 生成式世界渲染器

将 generative inverse 和 forward rendering 扩展到真实世界场景时，受限于现有 synthetic data 的逼真度和 temporal coherence 的不足，成为瓶颈。

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[论文] Modulate-and-Map：跨模态特征映射与跨视图调制用于3D异常检测

我们提出了 ModMap，这是一种原生多视角和多模态的 3D 异常检测与分割框架。不同于现有的将视角独立处理的方法……

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 可操控视觉表征

预训练的视觉Transformer（ViTs），例如 DINOv2 和 MAE，提供通用的图像特征，可用于各种下游任务，例如检索…

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[Paper] Grounded Token Initialization 用于语言模型中新词汇的生成式推荐

语言模型（LMs）正日益通过新增可学习的词汇标记来扩展，以用于领域特定任务，例如生成式推荐中的 Semantic-ID 标记……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] 大规模 Codec Avatars：大规模 Avatar 预训练的非凡有效性

高质量的3D avatar modeling 面临着 fidelity 与 generalization 之间的关键权衡。一方面，multi-view studio data 能够实现 high-fidelity …

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 没有单一最佳模型实现多样性：学习一个 Router 用于样本多样性

当面对允许大量有效答案的提示时，全面生成它们是满足广泛用户的第一步....

#research #paper #ai #nlp
0个月前 · ai · - · -

[Paper] 停止漂移：通过元认知推理实现高效 Vision-Language Navigation

无需训练的 Vision-Language Navigation (VLN) 代理由 foundation models 驱动，能够遵循指令并探索 3D 环境。然而，现有的 approa...

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 流媒体视频理解的简易基线

近期的流媒体视频理解方法日益依赖复杂的记忆机制来处理长视频流。我们用一种简单的…来挑战这一趋势。

#research #paper #ai #computer-vision
0个月前 · ai · - · -

[Paper] 神经网络场论中的拓扑效应

神经网络场论将场论表述为由网络架构和参数密度定义的场的统计集合。我们……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] go-$m$HC：通过广义正交随机矩阵对流形约束的超连接进行直接参数化

双随机矩阵使得在 residual streams 之间进行学习式混合成为可能，但对双随机矩阵集合（Birkhoff polytope）的参数化是精确的……

#research #paper #ai #machine-learning #nlp
0个月前 · ai · - · -

[Paper] VOID：视频对象与交互删除

现有的视频对象移除方法在对对象后面的内容进行inpainting以及纠正外观层面的伪影（如阴影和反射）方面表现出色。

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[论文] 驯服指数：用于整数原生边缘推理的快速 Softmax 替代方案

Softmax 在 Transformer 模型的 Multi-Head Attention（MHA）块中可能成为计算瓶颈，尤其是在小模型进行低精度推理时。

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] Omni123：通过统一文本到2D和3D生成，探索在有限3D数据下的3D原生基础模型

近期，多模态大型语言模型在统一的文本和图像理解与生成方面取得了强劲的性能，但要扩展这种原生能力……

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[Paper] 通过样本路由统一组相对与自蒸馏策略优化

强化学习与可验证奖励（RLVR）已成为后训练大型语言模型的标准范式。虽然群体相对策略优化（Group Relative Policy Optimization）……

#research #paper #ai #machine-learning
0个月前 · ai · - · -

[Paper] 新颖的记忆遗忘技术用于自主AI代理：在相关性与效率之间取得平衡

Long-horizon 对话代理需要持久记忆以实现连贯推理，然而不受控制的累积会导致时间衰减和虚假记忆的传播……

#research #paper #ai #machine-learning #computer-vision
0个月前 · ai · - · -

[Paper] Self Driving Portfolio：机构资产管理的Agentic Architecture

Agentic AI 将投资者的角色从分析执行转变为监督。我们提出了一种 agentic 战略资产配置流水线，其中约 5…

#research #paper #ai #machine-learning

Newer posts

Older posts