Source

arXiv

4602 posts from this source

排序:

1周前 · ai · - · -

[Paper] 在相关设备故障情况下的联邦学习鲁棒同步

Probabilistic Synchronous Parallel（PSP）是一种用于分布式学习系统的技术，通过抽样一部分参与者来降低同步瓶颈……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 基于原型的概念模型用于可验证的概念对齐

Concept Bottleneck Models (CBMs) 旨在通过使用人类可理解的概念来结构化预测，以提升 Deep Learning 的可解释性，但它们…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LLMSniffer：通过 GraphCodeBERT 与监督对比学习检测 LLM 生成的代码

大型语言模型 (LLMs) 在软件开发中的快速普及，使得区分 AI 生成的代码和人工编写的代码成为一项关键挑战。

#research #paper #ai #nlp
1周前 · devops · - · -

[论文] T‑RBFT：一种基于可信执行环境的可扩展且高效的拜占庭共识，适用于联盟区块链

随着区块链应用场景的不断扩展，联盟链对共识机制提出了更高的性能和安全性要求。

#research #paper #devops
1周前 · devops · - · -

【论文】评估 SYCL 作为异构系统的统一编程模型

高性能计算（HPC）应用正日益在异构环境中执行，这为编程和软件带来了新的挑战……

#research #paper #devops
1周前 · ai · - · -

[Paper] 神经符号仓库级代码定位

Code localization 是自主软件工程的基石。最近的进展在真实世界问题基准上取得了令人印象深刻的表现。...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 在循环脉冲神经网络中结合卷积与时延学习

脉冲神经网络（SNN）正迅速获得动力，作为资源受限的边缘系统中传统人工神经网络的替代方案。我...

#research #paper #ai
1周前 · software · - · -

[Paper] 支持对数据分析脚本的理解

大量研究依赖数据分析脚本来处理、清理和可视化数据。然而，最近的研究表明，这些脚本往往难以理解……

#research #paper #software
1周前 · software · - · -

[Paper] 小巧却可配置：揭示软件中的 Null Variability

许多小规模的软件系统，即具有有限 codebase 或 binary size 的系统，广泛用于日常任务中，但它们的可配置性仍然在很大程度上未被……

#research #paper #software
1周前 · devops · - · -

[Paper] 持续基准测试：跟上模型和技术不断演进的生态系统

借鉴 continuous integration 的理念，我们提出了针对 high performance applications 的 automated benchmarking pipeline 概念。Customization 和 …

#research #paper #devops
1周前 · devops · - · -

[Paper] New Kids：第二代 Serverless Platforms 的架构与性能研究

随着 serverless computing 在工业界和学术界的使用日益增长，了解驱动底层平台的机制至关重要。

#research #paper #devops
1周前 · software · - · -

[Paper] 大规模系统中的 Feature Toggle 动态：普遍性、增长、寿命和基准测试

Feature toggles 使软件系统能够逐步发布和进行实验，但它们常常超出预期的生命周期而持续存在，累积为技术债务。

#research #paper #software
1周前 · software · - · -

[Paper] QMutBench：量子电路突变体数据集

量子软件测试近年来受到关注，促使开发了各种技术来自动化量子软件的测试。Th...

#research #paper #software
1周前 · ai · - · -

[Paper] ECG-Lens：基准测试机器学习和深度学习模型在 PTB-XL 数据集上

对心电图（ECG）信号的自动分类是诊断和监测心血管疾病的有用工具。本研究比较了三种 tr...

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 打破百亿参数通用机器学习原子间势的训练瓶颈

通用机器学习原子间势 (uMLIPs)，在涵盖无机材料和有机分子的极其多样化数据集上进行预训练……

#research #paper #ai #machine-learning
1周前 · devops · - · -

[Paper] CroSatFL：面向卫星边缘计算的跨聚合节能联邦学习

低地球轨道（LEO）巨型星座将云‑边缘连续体延伸到太空，实现卫星边缘计算。然而，联邦学习（FL）在 …

#research #paper #devops
1周前 · ai · - · -

[Paper] Frenetic Cat 启发的粒子优化：一种马尔可夫状态切换混合群体优化器及其在心脏数字孪生中的应用

在评估预算紧张的情况下设计仍然有效的optimizers至关重要，尤其是在诸如cardiac digital twinning等昂贵的black-box场景中。我们提出...

#research #paper #ai
1周前 · ai · - · -

[Paper] 提升离散粒子群优化用于超图建模的影响力最大化

影响力最大化（IM）是复杂网络分析中的一个基础问题，具有广泛的现实应用。迄今为止，现有的方法……

#research #paper #ai
1周前 · ai · - · -

[Paper] 神经形态参数估计用于功率转换器健康监测的脉冲神经网络

始终在线的转换器健康监测需要 sub‑mW 边缘推理，这一范式对 GPU‑based physics‑informed neural networks 来说是不可及的。本文工作将……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] CodeMMR：桥接自然语言、代码和图像，实现统一检索

代码搜索，被视为信息检索（IR），是现代软件工程的基石，并日益为检索增强生成（RAG）提供动力，提升……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 为什么微调会导致幻觉以及如何修复

大型语言模型容易出现事实不准确的幻觉式陈述。这些错误的一个关键来源是通过 sup... 接触新的事实信息。

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 双向跨模态提示用于事件-帧非对称立体

传统的基于帧的相机能够捕获丰富的上下文信息，但在动态场景中受到时间分辨率有限和运动模糊的影响。Event camera...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] LeapAlign：通过构建两步轨迹，在任意生成步骤进行后训练 Flow Matching 模型

本文聚焦于将 flow matching models 与人类偏好对齐。一个有前景的方法是通过直接反向传播 reward gradients 来进行 fine‑tuning …

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] TokenLight：使用属性令牌的精确图像光照控制

本文提出了一种图像重新照明的方法，能够在照片中对多个光照属性进行精确且连续的控制。我们……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[论文] MM-WebAgent：一种用于网页生成的层次化多模态网页代理

人工智能生成内容（AIGC）工具的快速进展，使得可以按需为网页设计创建图像、视频和可视化内容。

#research #paper #ai #machine-learning #nlp #computer-vision
1周前 · ai · - · -

[Paper] RAD-2：在生成-判别框架中扩展强化学习

高级自动驾驶需要能够对多模态未来不确定性进行建模且在闭环交互中保持鲁棒性的运动规划器。A...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] LLM 问题求解中的泛化：最短路径案例

语言模型是否能够系统性地概括仍然是一个活跃的争论。然而，经验性能（empirical performance）受包括训练（training）在内的多重因素共同影响……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 诊断 LLM 判决可靠性：Conformal Prediction Sets 与 Transitivity Violations

LLM-as-judge 框架正日益用于自动 NLG 评估，但它们的单实例可靠性仍然了解不足。我们提出一种双管齐下的……

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

[Paper] 在潜在思维中思考：无Gloss手语翻译的新范式

许多 SLT 系统悄然假设，简短的手语片段可以直接映射到口语单词。这个假设会失效，因为手语者常常创造 mea...

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] AnimationBench：视频模型在以角色为中心的动画方面表现如何？

视频生成已经快速发展，最近的方法能够产生越来越逼真的动画效果。然而，现有的基准——主要为……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 表格深度学习中MLP优化器的基准测试

MLP 是现代深度学习（DL）架构中在表格数据监督学习中被广泛使用的主干，AdamW 是用于训练的首选优化器……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] LLMs 和 VLMs 如何在没有视觉的情况下理解视点旋转？可解释性研究

在过去的一年里，空间智能受到了越来越多的关注。许多先前的工作从视觉空间智能的角度研究它，其中……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[论文] 使用截断正交多项式核的 SVM 结构可解释性

我们研究基于截断正交多项式核构建的支持向量机（SVM）的后训练可解释性。由于相关的再现…

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] GlobalSplat：通过全局场景令牌实现高效前馈式3D高斯点绘

高效的原语空间分配是3D Gaussian Splatting的基础，因为它直接决定了表示之间的协同作用……

#research #paper #ai #computer-vision
1周前 · ai · - · -

[论文] R3D：重新审视 3D 策略学习

3D policy learning 预计能够实现更优的泛化和跨形体转移，但进展受到训练不稳定和严重过拟合的阻碍。

#research #paper #ai #computer-vision
1周前 · ai · - · -

[Paper] 为什么视觉语言模型在识别人类情感方面表现困难？

理解情感是智能系统能够与人类互动的基本能力。视觉语言模型（VLM）已经取得了巨大的 p...

#research #paper #ai #machine-learning #computer-vision
1周前 · devops · - · -

[Paper] 基于波的调度用于混合 HPC‑量子系统中的电路切割

基于电路切分的混合高性能计算（HPC）-量子工作负载将大型量子电路分解为独立的片段，但现有的...

#research #paper #devops
1周前 · ai · - · -

[Paper] 嵌入如何塑造图神经网络：经典 vs 量子导向节点表示

节点嵌入充当图神经网络的信息接口，但它们的实证影响常常在不匹配的 backbones、splits 和 … 中报告。

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] Prism：张量程序的符号超优化

本文介绍了 Prism——首个用于张量程序的符号化超优化器。其核心思想是 sGraph，一种符号化的层次化表示，能够紧凑地……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] SegWithU：不确定性作为扰动能量用于单次前向传播风险感知医学图像分割

可靠的不确定性估计对医学图像分割至关重要，因为自动轮廓会用于下游量化和临床决策支持。

#research #paper #ai #machine-learning #computer-vision
1周前 · software · - · -

[Paper] 利用 Retrieval Augmented Generation 增强大语言模型以实现软件测试与检查自动化

在本文中，我们专注于自动化软件开发生命周期（SDLC）中两项广泛使用的 Verification and Validation (V&V) 活动：Soft…

#research #paper #software
1周前 · ai · - · -

[Paper] 克隆与学习对 Stabilizer 状态同样困难

同时克隆非正交态的不可能性是量子理论的基础。即使允许近似误差，克隆……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] CoopEval：在社会困境中对合作维持机制和 LLM 代理进行基准测试

随着 LLM 代理与其他追求目标的代理之间有效且安全互动的重要性日益提升，然而，最近的研究却报告了相反的趋势：LLM …

#research #paper #ai #machine-learning #nlp
1周前 · ai · - · -

循环 Transformer 的稳定性与泛化

Looped transformers 通过在更难的问题上增加迭代次数来实现测试时计算的可扩展性，但仍不清楚哪些架构选择能够让……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 从 Tokens 到 Steps：Verification-Aware Speculative Decoding 用于高效多步推理

Speculative decoding（SD）通过让轻量级草稿模型提出输出，而让更强大的目标模型进行验证，从而加速大语言模型的推理。

#research #paper #ai #nlp
1周前 · ai · - · -

[Paper] 使用 log-barrier 的 bandit 反馈矩阵游戏的最优最后迭代收敛

我们研究在零和矩阵博弈中学习 minimax 策略的问题。Fiegel 等人（2025）最近表明，实现 last‑iterate 收敛在此……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 超越单模型优化：在持续强化学习中保持可塑性

持续强化学习必须在保持记忆与适应之间取得平衡，然而许多方法仍然依赖单模型保留，致力于一个不断演化的策略……

#research #paper #ai #machine-learning
1周前 · ai · - · -

[Paper] 上下文胜于内容：揭露自动评审中的评估造假

LLM-as-a-judge范式已经成为自动化AI评估流水线的运行核心，但它基于一个未经验证的假设：评审者评估…

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts