Source

arXiv

4654 posts from this source

排序:

1个月前 · devops · - · -

[Paper] inference-fleet-sim：基于排队论的 LLM 推理舰队容量规划器

为 LLM 推理规模化 GPU fleet 比看起来更困难。显而易见的问题——需要多少 GPU、哪种类型、如何划分两池 fleet——没有明确的答案……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 面向动态环境中可推广的机器人操作

Vision-Language-Action (VLA) 模型在静态操作方面表现出色，但在具有移动目标的动态环境中表现不佳。这一性能差距主要源于 …

#research #paper #ai #computer-vision
1个月前 · ai · - · -

【论文】Mixture-of-Depths Attention

扩展深度是大型语言模型（LLMs）的关键驱动因素。然而，随着LLMs变得更深，它们往往会遭受信号衰减：信息特征形成……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 先观察后行动：提升视觉基础表征以用于视觉-语言-动作模型

Vision-Language-Action（VLA）模型最近作为一种有前景的机器人操作范式出现，其中可靠的动作预测关键依赖于……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] HorizonMath：衡量 AI 在数学发现方面的进展与自动验证

AI 能在重要、未解决的数学问题上取得进展吗？Large language models 现在已经能够进行复杂的数学和科学推理，……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] GlyphPrinter：区域分组直接偏好优化实现字形精确视觉文本渲染

生成用于视觉文本渲染的准确 glyphs 是必不可少且充满挑战的。现有方法通常通过在大量数据上进行训练来提升文本渲染效果。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 语言模型中道德冷漠的机制起源

现有的大语言模型（LLMs）行为对齐技术往往忽视表面顺从与内部未对齐表示之间的差异……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] Tri-Prompting：视频扩散对场景、主体和运动的统一控制

最近的视频扩散模型在视觉质量方面取得了显著进步，但精确、细粒度的控制仍然是限制其实用性的关键瓶颈。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] HSImul3R：Physics-in-the-Loop 重建仿真就绪的人体-场景交互

我们提出 HSImul3R，一个统一的框架，用于从随意捕获（包括稀疏视角）中实现可用于仿真的 3D 重建人‑场景交互（HSI）。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] Fast SAM 3D Body: 加速 SAM 3D Body 实现实时全身人体网格恢复

SAM 3D Body（3DB）在单目 3D 人体网格恢复方面实现了最先进的精度，但其每张图像数秒的推理延迟阻碍了实时……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] SmartSearch：排名胜过结构的对话记忆检索

近期的对话记忆系统在摄取阶段大量投入基于 LLM 的结构化，以及在查询阶段的学习检索策略。我们展示了 neithe…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 鲁棒且计算高效的线性上下文赌博机在对抗性干扰和重尾噪声下

我们研究在对抗性腐败和具有有限 (1+ε) 阶矩（其中 ε∈(0,1]）的重尾噪声下的 linear contextual bandits。现有工作...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] OpenSeeker：通过完全开源训练数据实现前沿搜索代理的民主化

深度搜索能力已成为前沿大型语言模型（LLM）代理的不可或缺的能力，然而高性能搜索的开发……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 基于物理信息的神经系统用于光刻掩模的EUV电磁波衍射模拟

物理信息神经网络（PINNs）和神经算子（NOs）用于求解极紫外（EUV）电磁波衍射问题……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 将世界模拟模型扎根于真实世界的大都市

如果一个 world simulation model 能够渲染的不是想象中的环境，而是实际存在的城市会怎样？之前的 generative world models 在视觉上合成了 pla...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[论文] 无偏与有偏方差降低的前向‑反射‑后向分裂方法用于随机复合包含

本文开发了用于前向反射-后向分裂（FRBS）方法的新方差降低技术，以求解一类可能非单调的随机问题。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Mamba-3：使用状态空间原理的改进序列建模

扩展推理时计算已成为 LLM 性能的重要驱动因素，使得推理效率成为模型设计的核心关注点之一，……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Lore：将 Git Commit Messages 重新用于 AI Coding Agents 的结构化知识协议

随着 AI 编码代理成为源码的主要生产者和消费者，软件行业正面临机构知识的加速流失。Eac...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] PokeAgent 挑战：规模化的竞争性和长上下文学习

我们提出了 PokeAgent Challenge，这是一个基于 Pokemon 多智能体对战系统和广阔角色扮演的的大规模决策研究基准。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[论文] 由 Storm 完成的概率模型检查

本文教程论文提供了使用 Storm 模型检查器进行概率模型检查的实践视角。Storm 是一个已有十年历史的模型检查器，擅长……

#research #paper #software
1个月前 · ai · - · -

[Paper] SlovKE：大规模数据集与 LLM 评估用于斯洛伐克关键词提取

对于形态学丰富、资源匮乏的语言，关键词提取仍然研究不足，主要原因是缺乏合适的评估数据集。我们…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] ViX-Ray：一个用于视觉语言模型的越南胸部X光数据集

越南医学研究已成为一个日益重要的领域，尤其是随着旨在减少时间和资源的智能技术的兴起……

#research #paper #ai #nlp
1个月前 · software · - · -

[Paper] 机器人任务规范与执行的形式化方法：比较分析

机器人正日益在各个领域部署，并被设计用于多用途操作。随着机器人系统的复杂性增加并在动态环境中运行，

#research #paper #software
1个月前 · ai · - · -

[Paper] 人类‑AI 交互中的隐形失败

AI 系统在沉默中失败的情况远比可见的失败更常见。在对 WildChat 数据集中的人机交互进行的大规模定量分析中，我们发现…

#research #paper #ai #nlp
1个月前 · ai · - · -

[论文] SWE‑Skills‑Bench：代理技能真的能在真实世界的软件工程中提供帮助吗？

Agent skills（代理技能），在推理时注入的结构化过程知识包，正日益被用于增强 LLM 代理在软件工程任务中的能力。Ho...

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 异构边缘计算目标检测系统的多目标负载均衡

物联网（IoT）和智能应用的快速普及导致分布式传感设备产生的数据激增。Edge computing…

#research #paper #devops
1个月前 · software · - · -

[Paper] 在 Asmeta 中使用大型语言模型形式化和验证属性（扩展摘要）

编写时序逻辑属性对于模型驱动开发框架的用户来说通常是一项具有挑战性的任务，尤其是在将非正式需求……

#research #paper #software
1个月前 · ai · - · -

[Paper] SKILLS：结构化知识注入用于 LLM 驱动的电信运营

随着电信运营商加速采用 AI-enabled automation，一个实际问题仍未得到解决：通用的大型语言模型（general‑purpose large language model）能否……

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 是 FAIR 还是 RIGHT？以学习技术为例的面向人类技术的方法论研究诚信

研究软件工程（RSE）的质量评估在所有科学领域中都发挥着重要作用。基于经典的三大标准（可靠性、有效性、……）。

#research #paper #software
1个月前 · software · - · -

【论文】AI 辅助开发对软件安全的影响：Gemini 与开发者体验研究

熟练开发人员的持续短缺，尤其是在安全关键的软件开发领域，已导致组织越来越多地采用 AI 驱动的开发……

#research #paper #software
1个月前 · ai · - · -

[Paper] 面向共识排名聚合的基础模型

从多个输入排名中聚合共识排名是一个基础性问题，具有在推荐系统、搜索引擎、职位招聘等方面的应用。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 令牌一致性：在多代理 LLM 系统中采用 MESI 缓存协议以最小化同步开销

多代理 LLM 编排在朴素广播下会产生同步成本，其规模随代理数量、步骤数和工件大小呈 O(n × S × |D|) 关系——一个……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 看到并不等于掌握：教 LLMs 使用私有库进行代码生成

大型语言模型（LLMs）在代码生成方面展现出强大的潜力，但在面向私有库的代码生成方面仍受限，其中目标……

#research #paper #ai #machine-learning #nlp
1个月前 · devops · - · -

[Paper] 在灵活 GPU 共享中保证语义和性能确定性

GPU 共享对于最大化现代数据中心的硬件利用率至关重要。然而，现有方法呈现出明显的权衡：粗粒度的 tempo…

#research #paper #devops
1个月前 · ai · - · -

[Paper] PCodeTrans：将反编译伪代码翻译为可编译且可执行的等价代码

反编译是二进制分析的基础，然而传统工具更注重人类可读性，而非严格的可重新编译性和可验证的运行时正确性……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 实时驾驶员安全评分通过逆向碰撞概率建模

道路事故仍然是可预防死亡的主要原因。现有的预测模型主要产生 binary outcomes，这些结果提供的可操作性有限……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 使用Twin-Field Quantum Key Distribution 保护分布式区块链：抗量子方法

量子计算为传统区块链系统带来了可行的多层安全挑战。而量子安全区块链依赖于量子...

#research #paper #devops
1个月前 · ai · - · -

[Paper] SimCert：深度神经网络压缩中行为相似性的概率认证

在资源受限的嵌入式系统上部署深度神经网络（DNN）需要采用激进的模型压缩技术，如量化和剪枝。H...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Fold-CP：一种用于生物分子建模的上下文并行框架

理解细胞机器需要对大型生物分子集合进行原子尺度的重建。然而，预测这些系统的结构仍然……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 知识激活：AI 技能作为制度性知识原语用于代理式软件开发

企业软件组织积累关键的制度性知识——架构决策、部署程序、合规政策、事件响应……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] MorphSNN：用于脉冲神经网络的自适应图扩散与结构可塑性

脉冲神经网络（SNN）目前面临一个关键瓶颈：虽然单个神经元展现出动态的生物特性，但它们的宏观结构……

#research #paper #ai
1个月前 · ai · - · -

[Paper] 多保真度代理建模用于高温气体堆减压强制冷却失效

高保真计算流体动力学（CFD）模拟被广泛用于分析核反应堆瞬态，但在进行…时计算成本很高。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 使用 Conditional Flow Matching 解决物理约束的逆问题

本研究提出了一种 conditional flow matching 框架，用于求解 physics-constrained Bayesian inverse problems。在这种设置下，来自 joint distribution 的样本……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] DualSwinFusionSeg: 通过 Dual Swin Transformer 结合多尺度融合和 UNet++ 的多模态火星滑坡分割

对火星滑坡的自动分割，尤其是在诸如瓦列斯·马里内里斯等构造活跃地区，对行星地质学和危害评估非常重要。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 重构损失是罪魁祸首吗？尝试超越 JEPA

我们在一个受控的“TV-series”线性动力系统中评估 JEPA 风格的预测表示学习与基于重构的自编码器，系统具有已知…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] GELATO 数据集用于立法 NER

本文介绍了GELATO（Government, Executive, Legislative, and Treaty Ontology），这是一个来自第118届国会的美国众议院和参议院法案的数据集，已进行注释……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 实现与讨论基于Local Fourier Spectrum Analysis方法的粗糙原木端部图像的Pith Estimation

在本文中，我们分析并提出了该方法的 Python 实现——“Pith Estimation on Rough Log End images using Local Fourier Spectrum Analysis”，b...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 制度尺度定律：非单调适应度、能力‑信任分歧与生成式 AI 中的共生基因尺度

经典的 scaling laws 将 AI 性能建模为随模型规模单调提升。我们通过推导 Institutional Scaling Law 来挑战这一假设，……

#research #paper #ai #machine-learning

Newer posts

Older posts