Source

arXiv

4663 posts from this source

排序:

2个月前 · software · - · -

[Paper] 基于统计的度量阈值设定方法用于固件项目的软件故障预测：工业经验

确保嵌入式固件的软件质量至关重要，尤其是在安全关键领域，需要遵循功能安全标准（ISO 26262）……

#research #paper #software
2个月前 · ai · - · -

[Paper] 使用 CLIP 通过双通道文本提示和图像增强进行视觉词义消歧

歧义在大型语言模型（LLMs）的自然语言理解中持续带来挑战。为了更好地了解词汇歧义如何被解决……

#research #paper #ai #nlp
2个月前 · ai · - · -

【论文】稀疏脉冲编码通道响应用于节能人体活动识别

ISAC 实现了普遍监测，但现代传感算法往往对能量受限的边缘设备来说过于复杂。这促使人们开发 le...

#research #paper #ai
2个月前 · ai · - · -

[Paper] 多目标优化中的结构偏差

结构偏差（Structural bias，SB）指的是优化算法对搜索空间中特定区域的系统性偏好，这种偏好独立于目标函数而产生。

#research #paper #ai
2个月前 · software · - · -

[Paper] 利用大型语言模型支持 CI/CD 流水线中故障管理的自动化：SAP HANA 案例研究

CI/CD 流水线故障管理在手动执行时非常耗时。自动化此过程并不容易，因为实现有效所需的信息……

#research #paper #software
2个月前 · devops · - · -

[Paper] 相同引擎，多档位：在不同粒度上并行化不动点迭代（扩展版）

不动点迭代构成了静态分析器的算法核心。对不动点引擎进行并行化可以显著缩短分析时间。之前的应用……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 基于强化学习的结构化并行 Farm Skeleton 动态管理在 Serverless 平台上

我们提出了一个用于在 serverless 平台上动态管理结构化并行处理 skeleton 的框架。我们的目标是实现类似 HPC 的性能和……

#research #paper #ai #machine-learning
2个月前 · software · - · -

[论文] 可信的 AI 软件工程师

随着 AI coding agents 的快速崛起，作为软件工程师的根本前提受到质疑。在本愿景论文中，我们重新审视……

#research #paper #software
2个月前 · software · - · -

[Paper] 规模化移动混沌测试的 AI 驱动测试执行

在大规模分布式系统中，移动应用容易受到 backend service 故障的影响，然而传统的 chaos engineering 方法无法大规模…

#research #paper #software
2个月前 · ai · - · -

[Paper] 伪可逆神经网络

Moore‑Penrose 伪逆 (PInv) 是线性系统的基本解。在本文中，我们提出了一种对 PInv 的自然推广……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 共享 LoRA 子空间用于几乎严格的持续学习

高效且持续地将 large pretrained models 适配到新任务对于 real‑world deployment 至关重要，但由于 catastrophic forgetting 等挑战仍然困难。

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 从透视描述预测相机姿态用于空间推理

多图像空间推理仍然是当前多模态大语言模型（MLLMs）的挑战。虽然单视角感知本质上是二维的，推理……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] DyTopo：通过语义匹配的多智能体推理动态拓扑路由

由提示的大型语言模型构建的多代理系统可以提升多轮推理能力，然而大多数现有的流水线依赖于固定的、跨轨迹的通信……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SwimBird: 在混合自回归 MLLMs 中引发可切换的推理模式

多模态大型语言模型（MLLMs）通过连接视觉和语言，在多模态感知和推理方面取得了显著进展。然而，大多数现有...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[论文] CommCP：通过基于LLM的通信与共形预测实现高效多智能体协同

为了完成人类以 natural language 提供的任务，机器人必须解释指令，生成并回答与 scene understanding 相关的问题，……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 用几何思考：Active Geometry Integration 用于空间推理

近期在空间推理方面的进展，使用多模态大语言模型（MLLMs）越来越多地利用来自3D编码器的几何先验。然而，大多数现存……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] DFlash：块扩散用于 Flash 投机解码

自回归大型语言模型（LLMs）表现出色，但需要本质上顺序的解码，导致推理延迟高且 GPU 利用率差……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] InterPrior：用于基于物理的人体-物体交互的可扩展生成控制

人类很少在显式的全身动作层面上规划与物体的全身交互。高级意图，例如 affordance，定义了目标……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] V-Retrver: 基于证据驱动的主体推理用于通用多模态检索

多模态大语言模型（MLLMs）最近被用于通用多模态检索，其中链式思考（CoT）推理能够提升候选项的质量。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 视觉语言模型能从交互中学习直观物理吗？

预训练的视觉语言模型对物理世界没有良好的直觉。最近的研究表明，监督微调可以提升模型的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] Splat and Distill：通过前馈 3D 重建增强教师，实现 3D 感知蒸馏

Vision Foundation Models (VFMs) 在应用于各种下游 2D 任务时取得了显著成功。尽管它们效果显著，但它们常常表现出……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[论文] AP-OOD：Attention Pooling 用于分布外检测

Out-of-distribution（OOD）检测，将高维数据映射为标量 OOD 分数，对于机器学习模型的可靠部署至关重要……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] PhysicsAgentABM：物理引导的生成式基于代理的建模

基于大型语言模型（LLM）的多代理系统能够实现富表达的代理推理，但其扩展成本高，并且在时间步对齐的场景下校准性较差。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 好奇心即知识：自洽学习与主动推断下的无后悔优化

主动推断（AIF）通过最小化期望自由能（EFE）统一了探索与利用，平衡认知价值（信息增益）和实际价值（...）。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 上下文强制：具有长上下文的一致自回归视频生成

近期针对实时长视频生成的研究通常采用 streaming tuning 策略，尝试使用 short‑cont（短上下文）来训练 long‑context student。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 学习查询感知 Budget-Tier 路由用于 Runtime Agent Memory

记忆在超出单个上下文窗口运行的大型语言模型（LLM）代理中变得日益核心，然而大多数现有系统仍依赖离线的、查询式的…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 学习基于事件的射击模型来自虚拟现实实验

虚拟现实（VR）已成为评估学校安全措施的强大工具，尤其在学校枪击等高风险情境中，提供实验……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 正确性优化的残差激活透镜 (CORAL)：可转移且校准感知的推理时引导

大型语言模型（LLMs）表现出持续的误校准，尤其是在指令微调和偏好对齐之后。修改后的训练目标可以 i...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 扩散模型的泛化可以通过对数据依赖的 Ridge 流形的归纳偏置来刻画

当 diffusion model 并未记忆 training data set 时，它到底是如何实现 generalize 的？对它生成的 distribution 进行 quantitative understanding …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 通过自蒸馏的多标记预测

现有的加速语言模型推理的技术，例如 speculative decoding，需要训练辅助的 speculator 模型并构建和部署…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 大语言模型在 PTSD 严重程度估计中的系统评估：上下文知识与建模策略的作用

大型语言模型（LLMs）正日益以零样本方式用于评估心理健康状况，但我们对哪些因素了解有限，...

#research #paper #ai #nlp
2个月前 · ai · - · -

乐观性使 Thompson Sampling 在自适应推断中更稳健

Thompson 采样（TS）在随机多臂赌博机中被广泛使用，但其在自适应数据收集下的推断属性非常微妙。经典的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] GenArena：我们如何实现对视觉生成任务的人类对齐评估？

视觉生成模型的快速发展已经超出了传统评估方法的步伐，迫切需要采用 Vision-Language Models 作为替代……

#research #paper #ai #machine-learning #computer-vision
2个月前 · software · - · -

[Paper] 对 GitHub 安全通告审查流水线的特征分析与建模

GitHub Security Advisories (GHSA) 已成为开源漏洞披露的核心组成部分，并被开发者和安全工具广泛使用。

#research #paper #software
2个月前 · ai · - · -

[Paper] AgenticPay：用于买卖交易的多代理 LLM 谈判系统

基于大型语言模型（LLM）的代理正日益被期望能够自主进行谈判、协调和交易，然而现有的基准缺乏原则性的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 利用 OpenAI Whisper 表征和注意力池化方法的语音情感识别

语音情感识别（Speech Emotion Recognition, SER）研究由于缺乏标准且足够大的数据集而受到限制。最近的研究利用了预训练…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[论文] DSB：用于 Diffusion LLM 的动态滑动块调度

扩散大语言模型（dLLMs）已成为文本生成的有前景的替代方案，其特点是原生支持并行解码……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] SAGE：基准测试与改进深度研究智能体的检索

深度研究代理已经成为处理复杂查询的强大系统。与此同时，基于LLM的检索器在fol方面展示了强大的能力。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 将人类在概念生成中的语义导航表征为Embedding Space中的轨迹

语义表征可以被构建为一种结构化、动态的知识空间，人类在其中导航以检索和操作意义。为了研究……

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] 匿名图上的位置感知分散

广为研究的 DISPERSION 问题是分布式机器人学中的一个基本协作问题，其中一组移动机器人必须重新定位，使得每个占...

#research #paper #devops
2个月前 · ai · - · -

[Paper] 自我改进的多语言长推理通过翻译-推理集成训练

长推理模型在多语言环境中常常遇到困难：它们倾向于对非英语问题使用英语进行推理；当被限制在...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 多语者还是众多？多语言LLM 对价值取向的多项选择题的回答

多项选择题（MCQs）常用于评估大型语言模型（LLMs）中编码的知识、推理能力，甚至价值观。虽然...

#research #paper #ai #nlp
2个月前 · software · - · -

[Paper] 当 Elo 失真：基于 Codeforces 的大语言模型评估中的隐藏偏差

随着大语言模型（LLMs）在复杂推理方面取得突破，基于 Codeforces 的 Elo 评级已成为评估竞争力的突出指标……

#research #paper #software
2个月前 · ai · - · -

[Paper] DARWIN：动态代理式重写自我改进网络

DARWIN 是一种进化型 GPT 模型，利用类似遗传算法的优化结构，对多个独立的 GPT 代理进行单独训练……

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] 带有建议的分布式唤醒的量子消息复杂度

我们考虑带有 advice 的分布式 wake‑up 问题，其中节点配备了关于整体网络的初始知识。在对手唤醒之后……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 使用语义范围对企业代码仓库的 LLM 自动化定制

代码补全（Code completion，CC）是开发者在与基于 LLM 的编程助手协作时常用的任务。尽管性能有所提升……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] RocqSmith：自动优化能打造更好的证明代理吗？

本工作研究了自动 AI 代理优化方法在形式验证环境中对真实世界代理的适用性，重点关注自动定理证明……

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 面向量子安全的软件工程：后量子密码学迁移的愿景

量子威胁对网络安全的冲击加速了后量子密码学（Post-Quantum Cryptography，PQC）的标准化。将遗留软件迁移到这些量子安全的algo……

#research #paper #software

Newer posts

Older posts