Source

arXiv

4628 posts from this source

排序:

1个月前 · ai · - · -

[Paper] PICon：用于评估Persona Agent一致性的多轮询问框架

基于大型语言模型（LLM）的角色代理正被快速采用，作为跨多个领域的人类参与者的可扩展代理。然而，目前尚无系统…

#research #paper #ai #nlp
1个月前 · software · - · -

[Paper] 通过门优先级进行量子电路修复

修复有缺陷的量子电路具有挑战性，需要自动化的解决方案。我们提出了 QRep，这是一种自动化修复方法，能够迭代地识别和……

#research #paper #software
1个月前 · ai · - · -

[Paper] 重新审视 On-Policy Distillation：经验性失效模式与简单修复

On-policy distillation（OPD）在大语言模型（LLM）后训练中具有吸引力，因为它在学生生成的 rollouts 上评估 teacher feedback，而不是…

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 缺失感知多模态融合用于统一微服务故障管理

自动化事件管理对微服务可靠性至关重要。虽然最近的统一框架利用多模态数据进行联合优化，但它们未……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] 人类 vs 视觉语言模型：叙事连贯性的统一度量

我们通过比较人类撰写的叙事与视觉语言模型（VLMs）在 Vis… 上生成的叙事，来研究视觉基础故事中的叙事连贯性。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] NERO-Net：一种神经进化方法用于设计对抗鲁棒的CNN

Neuroevolution 自动化了神经网络设计这一复杂任务，但常常忽视了进化模型固有的对抗脆弱性，这成为了……的障碍。

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] SHADOW：无缝交接与零停机的有状态微服务工作负载编排迁移

在 Kubernetes 中迁移有状态微服务需要仔细的状态管理，因为容器重启时内存中的状态会丢失。对于 StatefulSet‑mana…

#research #paper #devops
1个月前 · software · - · -

[Paper] LACY：使用 Code Tours 模拟专家指导进行软件入职

每个软件组织都面临 onboarding 挑战：帮助新人在复杂的 codebases 中导航，弥补文档不足，并且 compreh...

#research #paper #software
1个月前 · devops · - · -

[Paper] PRISM：基于原语的动态预测用于大规模 GPU 集群工作负载

准确预测 GPU 工作负载对 AI 基础设施至关重要，能够实现高效的 scheduling、resource allocation 和 power management。现代工作负载…

#research #paper #devops
1个月前 · devops · - · -

[Paper] 分布式最小权重环近似的复杂性

我们研究在分布式计算的 mathsf{CONGEST} 模型中的最小权重环（MWC）问题。对于无向加权图，我们设计了一种随机…

#research #paper #devops
1个月前 · devops · - · -

[Paper] 分布式最小权重环近似的复杂性

我们在分布式计算的 mathsf{CONGEST} 模型中研究最小权重环（MWC）问题。对于无向加权图，我们设计了一种随机…

#research #paper #devops
1个月前 · ai · - · -

[Paper] 揭示参与者失效对跨筒仓联邦学习模型质量的影响

联邦学习（Federated Learning，FL）是一种在协作环境中训练机器学习（ML）模型的范式，同时通过将原始数据保留在本地来保护参与者的隐私。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] WebTestBench：评估计算机使用代理在端到端自动化网页测试中的表现

大型语言模型（LLMs）的出现催生了编程范式的转变，产生了“vibe coding”，用户可以构建完整的项目……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 能力阴影：AI 在安全工程中的辅助理论与界限

随着 AI 助手逐渐融入物理 AI 系统的安全工程工作流程，一个关键问题出现：AI 辅助是否能够提升安全分析……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] zk‑X509：通过零知识证明实现从传统 PKI 的隐私保护链上身份

公共区块链在监管合规性与用户隐私之间固有地存在张力。现有的链上身份解决方案需要中心化的 KYC 证明……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 影响 AI 生成代码质量的因素：实证证据的综合

背景：AI-assisted code generation tools 的快速采用，例如 large language models (LLMs)，正在改变软件开发实践。虽然…

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] DFLOP：数据驱动框架用于多模态 LLM 训练流水线优化

多模态大语言模型（MLLMs）通过在统一架构中整合文本、图像和音频理解，取得了显著进展。Ho...

#research #paper #devops
1个月前 · ai · - · -

[Paper] SEVerA：可验证的自进化代理合成

最近的进展表明，自我进化的 LLM 代理在程序修复和科学发现等任务上表现出有效性。在这种范式中，planner L...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 从逻辑垄断到社会契约：权力分立与自主代理经济体的制度基础

现有的多智能体框架允许每个智能体同时规划、执行和评估其自身的行为——我们将这种结构缺陷称为“Logic Mon…”。

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[论文] eBeeMetrics：一种基于 eBPF 的库框架，实现无反馈的 QoS 指标可观测性

许多系统管理运行时（SMR），例如资源管理和功耗管理技术，依赖于服务质量（QoS）指标，如尾部延迟……

#research #paper #devops
1个月前 · devops · - · -

[论文] Broadcast Congested Clique 中的快速生成树采样

我们提出了首个在（广播）拥塞团模型中以多对数轮次采样随机生成树的算法。对于任意常数 c > 0，o…

#research #paper #devops
1个月前 · ai · - · -

[Paper] 基于属性特定神经元组的联想记忆-2：不同 Cue Balls 的 Cue Neurons 之间的学习与顺序联想回忆

本文介绍了一种神经网络模型，该模型将多个属性学习为图像，并执行已学习记忆的关联顺序召回。简要……

#research #paper #ai
1个月前 · devops · - · -

[Paper] Rafture：纠删码 Raft 与传播后剪枝

在实际环境中，有效地分布和存储 erasure-coded 数据于分布式系统是具有挑战性的。实际部署必须应对不可预测的……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 使用单个带自突触的神经元重建脉冲神经网络

脉冲神经网络（SNNs）在类脑计算中前景广阔，但高性能模型仍然依赖于密集的多层架构以及实质性的…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 使用多层 Euler‑Maruyama 方法实现扩散模型的多项式加速

我们介绍了多层欧拉-马鲁亚马（ML-EM）方法，用于计算随机微分方程（SDE）和常微分方程（ODE）的解，使用一系列近似函数 (f^{1},dots,f^{k}) 来逼近漂移项 (f)……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] DreamerAD：通过潜在世界模型实现高效强化学习用于自动驾驶

我们介绍 DreamerAD，这是第一个潜在世界模型框架，通过压缩 diffusion sam... 实现对自动驾驶的高效强化学习。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] TAG：针对视觉-语言-动作模型中稳定面向对象推理的目标无关引导

Vision--Language--Action (VLA) 策略在将语言指令和视觉观察映射到机器人动作方面表现出强劲的进展，然而它们的可靠性……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 随机间隙：面向代理式人工智能的部署前可靠性与监督成本审计的马尔可夫框架

组织中的 Agentic artificial intelligence (AI) 是一个受可靠性和监督成本约束的序列决策问题。当确定性工作流…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] Latent-WAM：潜在世界动作建模用于端到端自动驾驶

我们介绍了 Latent‑WAM，一个高效的端到端自动驾驶框架，通过空间感知和动力学信息实现强大的轨迹规划。

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 检索改进并不保证更好的答案：RAG 在 AI 政策 QA 中的研究

检索增强生成（Retrieval‑augmented generation，RAG）系统正日益用于分析复杂的政策文件，但要实现足够的可靠性以供专家使用仍然是一个挑战……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] MARCH：多代理强化自检用于LLM幻觉

幻觉仍然是大型语言模型（LLMs）的关键瓶颈，削弱了它们在实际应用中的可靠性，尤其是在检索‑...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 视觉语言模型 vs 人类：感知图像质量评估

心理物理实验仍然是感知图像质量评估（IQA）最可靠的方法，但其成本高且可扩展性有限，促使自动…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] EndoVGGT：GNN增强深度估计用于手术3D重建

精确的可变形软组织 3D 重建对于外科机器人感知至关重要。然而，低纹理表面、镜面高光以及...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] Chameleon：用于长时程机器人操作的情景记忆

机器人操作通常需要记忆：遮挡和状态变化会导致决策时的观测在感知上出现别名，从而使动作选择变得非-Ma...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] VFIG：在 SVG 中使用视觉语言模型对复杂图形进行矢量化

可伸缩矢量图形（SVG）是技术插图和数字设计的关键格式，提供精确的分辨率独立性和灵活的语义……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 面向免训练的场景文字编辑

场景文字编辑旨在修改自然图像中的文本内容，同时保持视觉真实感和语义一致性。现有方法通常需要 t...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] POLY-SIM：多语种说话人识别与缺失模态 Grand Challenge 2026 评估计划

多模态说话人识别系统通常假设在训练和测试期间都能获得完整且同质的音视频模态……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 信赖域约束的贝叶斯优化与惩罚约束处理

在高维 black-box 环境下进行约束优化非常困难，因为评估成本高昂、缺乏梯度信息以及复杂的可行性……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 扩展 Recurrence-aware Foundation Models 用于临床记录的下一次就诊预测

虽然大规模预训练已经彻底改变了语言建模，但其在结构化电子健康记录的医疗领域的潜力仍未得到充分探索……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 自由市场算法：用于开放式复杂系统的自组织优化

我们介绍了自由市场算法（FMA），这是一种受自由市场经济启发的新型元启发式算法。不同于遗传算法、粒子群优化，...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] LensWalk：主动式视频理解——通过规划你在视频中的观看方式

视频的密集时序特性对自动分析构成了巨大的挑战。尽管使用了强大的 Vision-Language Models，现有方法仍然……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 评估油气企业文档中检索增强生成的块划分策略

检索增强生成（Retrieval-Augmented Generation，RAG）已经成为一种框架，用于解决大型语言模型（Large Language Models，LLMs）的限制。然而，它的有效性从根本上……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 稳健的多语言文本到象形图映射用于可扩展的阅读康复

阅读理解对特殊教育需求和残障（SEND）儿童来说是一个重大挑战，往往需要密集的一对一……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 表征学习用于研究教程支架中的时间动态

Adaptive scaffolding提升学习，但该领域缺乏在authentic tutoring dialogue中衡量它的可靠方法。这一空白已变得更加紧迫。

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] UI-Voyager：一种通过失败经验学习的自进化 GUI 代理

随着多模态大语言模型（MLLMs）的进步，自治移动 GUI 代理受到了越来越多的关注。然而，现有的方法……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 没有单一指标能讲完整个故事：用于不确定性归因的多维评估框架

对可解释人工智能（XAI）的研究常常侧重于解释模型的预测。近年来，已经提出了一些方法来解释预测的不确定性……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] TuneShift-KD：知识蒸馏与迁移用于微调模型

为了将领域特定或专业知识嵌入预训练的基础模型中，可以使用诸如参数高效微调（parameter efficient fine-tuning）等技术进行微调……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 用于 Exascale 计算系统的多GPU混合粒子-网格 Monte Carlo 模拟

粒子-网格（Particle-in-Cell，PIC）蒙特卡罗（Monte Carlo，MC）模拟是等离子体物理的核心，但在异构高性能计算（HPC）系统上由于过度的 d...

#research #paper #devops

Newer posts

Older posts