Source

arXiv

4663 posts from this source

排序:

2个月前 · ai · - · -

[Paper] OmniCode：评估软件工程代理的Benchmark

LLM 驱动的编码代理正在重新定义真实世界软件的开发方式。为了推动对更好编码代理的研究，我们需要具有挑战性的基准……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 在线微调预训练控制器用于自动驾驶的实时递归RL

在实际应用中部署预训练策略面临巨大的挑战，这些挑战从根本上限制了基于学习的方法的实际适用性……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 在 GROMACS 中实现 AI 深度势以进行 Ab Initio 质量的分子动力学模拟

最先进的 AI deep potentials 提供了 ab initio-quality 的结果，但其计算成本仅为 first-principles quantum mechanical calculations 的一小部分。

#deep learning potentials #GROMACS integration #DeePMD-kit #molecular dynamics #GPU acceleration
2个月前 · devops · - · -

[Paper] vLLM-Omni：完全分离式服务，支持任意到任意多模态模型

Any-to-any multimodal models 能够同时处理文本、图像、视频和音频，代表了多模态 AI 的重要进展。然而，它们复杂的架构……

#research #paper #devops
2个月前 · ai · - · -

[Paper] ECHO-2：大规模分布式 Rollout 框架用于成本高效的强化学习

强化学习（RL）是后训练大型语言模型（LLMs）的关键阶段，涉及在 rollout 生成、reward …之间的反复交互。

#reinforcement-learning #distributed-rollouts #large-language-models #cost-optimization #staleness-aware
2个月前 · devops · - · -

[Paper] TriCloudEdge：多层云连续体

TriCloudEdge 是一个可扩展的三层云连续体，集成了 far‑edge 设备、intermediate edge 节点和 central cloud 服务，并行工作……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 多视图狭窄分类：利用基于Transformer的多实例学习处理真实世界临床数据

冠状动脉狭窄是心血管疾病的主要原因之一，通过分析多视角血管造影中的冠状动脉进行诊断。虽然 nu...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] See2Refine：视觉-语言反馈提升基于LLM的eHMI动作设计师

自动驾驶车辆缺乏与其他道路使用者的自然沟通渠道，这使得外部人机界面（eHMIs）在传达意图方面变得至关重要……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 从用户重试中学习使用 Contextual Queueing Bandits 对 LLM 进行路由与调度

对大型语言模型（LLM）的爆炸性需求常常导致用户查询在服务器队列中积压，需要高效的路由（query‑LLM matching）和调度（query priority…）。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] FiLoRA：Focus-and-Ignore LoRA用于可控特征依赖

多模态基础模型整合跨模态的异构信号，但它们的预测如何依赖于特定的内部……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 超快芯片上在线学习：Kolmogorov‑Arnold 网络中的样条局部性

超快在线学习对于高频系统至关重要，例如 quantum computing 和 nuclear fusion 的控制，其中适应必须在 sub...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] FORLER：联邦离线强化学习与 Q‑Ensemble 和 Actor Rectification

在 Internet-of-Things 系统中，federated learning 通过实现 parallel policy training 而无需共享 raw data，推动了 online reinforcement learning (RL) 的发展……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] WildGraphBench：使用 Wild-Source 语料库对 GraphRAG 进行基准测试

基于图的检索增强生成（GraphRAG）将外部知识组织为层次化图结构，实现对分散知识的高效检索和聚合。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] SIDiffAgent: 自我改进的扩散代理

Text-to-image diffusion models 已经彻底改变了 generative AI，实现了高质量和 photorealistic 的图像合成。然而，它们的实际部署 …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 剖析 LLM NVFP4 预训练中的异常点动态

使用 4 位算术训练大语言模型可以提升吞吐量和内存效率。然而，FP4 的有限动态范围会增加对 … 的敏感性。

#LLM #quantization #outlier analysis #training optimization
2个月前 · ai · - · -

[Paper] 关于 Diffusion Posterior Sampling 在贝叶斯逆问题中的稳定性与鲁棒性

扩散模型最近作为贝叶斯逆问题（BIPs）的强大学习先验出现。基于扩散的求解器依赖于假设的似然函数……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 复杂网络系统的孪生：数据驱动的 mABCD 合成图生成器校准

relational data 的日益可获得性促使人们对 complex systems 的 network-based representations 越来越依赖。随着时间的推移，这些模型…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 追猎而非等待：评估大型语言模型上的深度数据研究

对具备代理性的语言模型（Agentic Large Language Models）的期望不仅仅是正确回答，还要求它们具备设定目标和决定探索内容的自主性。我们将此称为 i...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 一体多用：对齐多样的群体点击偏好在大规模广告图像生成中

广告图像生成越来越关注在线指标，如点击率（CTR），但现有方法采用“一刀切”的策略……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[论文] 尺度协变脉冲小波

我们通过尺度空间理论在 wavelet transforms 与 spiking neural networks 之间建立了理论联系。我们依赖于尺度协变的保证……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 通过光学字符识别重新思考基因组建模

近期的基因组基础模型在很大程度上采用大型语言模型架构，将DNA视为一维 token 序列。然而，穷尽的...

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[Paper] NEAT：基于神经元的提前退出用于大型推理模型

大型推理模型（LRMs）常常出现过度思考的现象，即在已经得到正确答案后仍生成冗余的推理步骤……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] ClueTracer：Question-to-Vision线索追踪用于多模态推理中的无训练幻觉抑制

大型多模态推理模型通过显式的长链推理解决具有挑战性的视觉问题：它们从图像中收集视觉线索，并将线索解码为…

#multimodal reasoning #hallucination suppression #attention tracing #research paper
2个月前 · ai · - · -

[Paper] UniDriveDreamer：单阶段多模态世界模型用于自动驾驶

World models 已经在自动驾驶的数据合成方面展示了显著的潜力。然而，现有方法主要集中在单模态……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SurfSplat：征服前馈 2D Gaussian Splatting 与表面连续性先验

从稀疏图像重建3D场景仍然是一项具有挑战性的任务，因为在没有优化的情况下难以恢复准确的几何形状和纹理。R...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] SpikingGamma：Surrogate-Gradient Free 与时间精确的在线训练平滑延迟脉冲神经网络

Neuromorphic 硬件实现的 Spiking Neural Networks (SNNs) 通过稀疏、事件驱动的计算，承诺实现能效高、低延迟的 AI。然而，...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Grappa：用于可扩展图神经网络训练的仅梯度通信

跨分区边在分布式 GNN 训练中的成本占主导：每次迭代获取远程特征和激活会使网络负荷过重，因为图 ...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] FUPareto：通过 Pareto 增强优化弥合联邦消除学习中的遗忘‑效用差距

Federated Unlearning (FU) 旨在高效地从联邦模型中移除特定客户端数据的影响，同时保持对其余客户端的效用。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通过 Vicinal Jensen Gap 最小化提升符号回归中 Evolutionary Feature Construction 的泛化能力

基于遗传编程的特征构造近年来取得了显著成功，作为一种自动化机器学习技术，用于提升学习 p...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 动态启发式神经形态求解器用于边缘用户分配问题的贝叶斯置信传播神经网络

我们提出一种神经形态求解器，用于解决 NP-hard Edge User Allocation 问题，采用具有 Winner-Takes-All (WTA) 机制的吸引子网络实现 …

#research #paper #ai
3个月前 · ai · - · -

[Paper] 通过个体层面策略多样性释放差分进化的潜力

由于差分进化（DE）对策略选择非常敏感，现有的大多数变体通过自适应机制或复杂设计来追求性能。W...

#research #paper #ai
3个月前 · ai · - · -

[Paper] VideoGPA：蒸馏几何先验以实现3D一致的视频生成

虽然最近的视频扩散模型（VDMs）产生了视觉上令人印象深刻的结果，但它们在保持3D结构一致性方面根本存在困难，往往导致……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[论文] 共享自治范式中信念与策略学习的端到端优化

共享自治系统需要原则性方法来推断用户意图并确定适当的辅助水平。这是人类...的核心挑战。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] XR 环境中 Open-Set Object Detection 的用户提示策略与提示增强方法

开放集目标检测（Open-set object detection，OSOD）在推理时定位对象的同时，识别并拒绝未知类别。虽然最近的 OSOD 模型在基准测试中表现良好……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 解耦扩散采样用于函数空间的逆问题

我们提出一种在函数空间中针对逆PDE问题的数据高效、物理感知的生成框架。现有的 plug‑and‑play diffusion posterior samplers …

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] FOCUS：DLLMs 知道如何驯服它们的计算瓶颈

Diffusion Large Language Models（DLLMs）提供了一种有吸引力的替代方案，相较于 Auto‑Regressive 模型，但它们的部署受到高解码成本的限制。在 ...

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 去噪深空：基于物理的 CCD 噪声形成用于天文成像

Astronomical imaging 在实际 observing constraints 下仍然是 noise‑limited 的，而 standard calibration pipelines 主要去除 structured artifacts 和 le...

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] IRL-DAL：通过 Energy-Guided Diffusion Models 实现安全自适应的自动驾驶轨迹规划

本文提出了一种新颖的逆强化学习框架，使用基于扩散的自适应前瞻规划器（IRL-DAL）用于自动驾驶车辆。训练……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] PaperBanana：为 AI 科学家自动化学术插图

尽管基于语言模型的自主 AI 科学家取得了快速进展，生成可用于出版的插图仍然是一个劳动密集型的瓶颈。

#research #paper #ai #nlp #computer-vision
3个月前 · ai · - · -

[Paper] 粒子引导扩散模型用于偏微分方程

我们提出了一种引导式随机采样方法，在扩散模型的采样过程中加入了基于物理的指导，来源于偏微分方程。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] TEON：张量化正交化突破层级 Muon 的大语言模型预训练

Muon优化器通过执行矩阵级别的梯度（或动量）正交化，在预训练大型语言模型方面展示了强大的实证性能。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通用语言识别与生成

最近关于 language identification 和 generation 的研究已经确定了实现这些任务的紧密统计速率。这些工作通常…

#research #paper #ai #machine-learning #nlp
3个月前 · software · - · -

[Paper] 结果条件化推理蒸馏用于解决软件问题

在大型 repositories 中进行 software issue resolution 是一个长期的决策过程：在 localization 期间做出的选择会塑造可行 edits 的空间，而失误……

#research #paper #software
3个月前 · ai · - · -

[Paper] 现在你听见我：针对大型音频语言模型的音频叙事攻击

大型音频语言模型日益直接处理原始语音输入，使其能够在语音助手、教育等领域实现更无缝的整合……

#research #paper #ai #machine-learning #nlp
3个月前 · software · - · -

[Paper] GrepRAG：对代码补全的类Grep检索的实证研究与优化

仓库级代码补全对大型语言模型（LLMs）仍然具有挑战性，因为存在跨文件依赖和有限的上下文窗口。先前的工作添加了……

#research #paper #software
3个月前 · ai · - · -

[论文] 无训练的测试时适应与 Brownian Distance Covariance 在视觉语言模型中的应用

视觉语言模型在领域迁移下性能下降，限制了其在真实世界中的适用性。现有的测试时适应方法在计算上……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 嵌套切片采样：用于 GPU 加速推断的向量化嵌套采样

Model comparison 和 calibrated uncertainty quantification 通常需要对参数进行积分，但对于复杂的、多…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 跨尺度结构化：从教育视频中学习空间推理

Vision-language models (VLM) 在标准视频理解基准上表现出色，但在简单推理任务上系统性地失败……

#research #paper #ai #computer-vision

Newer posts

Older posts