Source

arXiv

4650 posts from this source

排序:

1个月前 · software · - · -

[Paper] 在软件工程中使用 Lean Research Inception 教授实用相关的研究问题制定

[背景] 精心制定的软件工程（SE）研究问题对于弥合产业与学术之间的差距至关重要。Lean Research Inception（……）

#research #paper #software
1个月前 · ai · - · -

[Paper] 揭示配置调优的领域空间模式：领域知识与适应度景观

配置调优对于提升性能在质量保证中至关重要。然而，由于黑箱性质，调优器的有效性长期以来一直是个谜。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] GazePrinter：可视化专家视线以指导新手在新代码库中

程序理解是软件工程中的一项基本活动。它不仅经常给专业人士带来挑战，还可能阻碍新手的进步。

#research #paper #software
1个月前 · devops · - · -

[Paper] Kumo：面向安全的无服务器云模拟器

Serverless computing 抽象了基础设施管理，但也掩盖了可能导致安全风险的系统级行为。先前的工作已经表明，s...

#research #paper #devops
1个月前 · ai · - · -

[Paper] 熟练的 AI 代理用于嵌入式和物联网系统开发

大型语言模型（LLMs）和代理系统在自动化软件开发方面展现出前景，但将它们应用于硬件在环（HIL）嵌入式……

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] 协调利益相关者在考虑性能指标及相应接口需求方面的工作——针对自动驾驶汽车

本文提出了一种流程，用于协调利益相关者在考虑 performance indicators 与相应 interface requirements 以实现 automated 时的工作。

#research #paper #software
1个月前 · devops · - · -

[Paper] 非平凡的自动机网络确实存在，它们使用局部多数规则来解决全局多数问题

全局多数问题，常被称为密度分类任务，是在探究计算能力背景下的经典基准。

#research #paper #devops
1个月前 · devops · - · -

[Paper] SWARM+: 可扩展且鲁棒的多代理共识用于完全去中心化的数据感知工作负载管理

分布式科学工作流越来越多地跨越 heterogeneous compute clusters、edge resources 和 geo-distributed data repositories。在这些环境中，...

#research #paper #devops
1个月前 · devops · - · -

[Paper] 投机策略编排：面向云机器人操作的延迟弹性框架

云机器人使机器人能够将高维运动规划和推理卸载到远程服务器上。然而，对于需要连续操作的任务……

#research #paper #devops
1个月前 · devops · - · -

[Paper] 以太网的双边效率：在五十年后重新校准Metcalfe和Boggs

1976年7月，Metcalfe 和 Boggs 在《Communications of the ACM》上发表了他们关于 Ethernet 的奠基性论文。他们的效率模型——E = (P/C)/(P/C + W*T)——...

#research #paper #devops
1个月前 · software · - · -

[Paper] DePro：理解 LLM 在调试竞赛编程代码中的作用

调试在软件开发生命周期中占据了相当大的比重，然而大型语言模型（LLMs）在这项任务中的有效性尚未得到充分了解。

#research #paper #software
1个月前 · ai · - · -

[Paper] 用于高效视频 VLMs 的统一时空令牌评分

Token pruning 对提升视觉语言模型（VLMs）的计算效率至关重要，尤其是在时间冗余显著的基于视频的任务中。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 通用骨架理解通过可微渲染和MLLMs

多模态大语言模型（MLLMs）展现出强大的视觉-语言推理能力，但仍局限于其原生模态，无法直接处理 st...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] Loc3R-VLM：基于语言的定位与3D推理的视觉语言模型

多模态大语言模型（MLLMs）在连接视觉和语言方面取得了令人印象深刻的进展，但它们仍然在空间理解方面存在困难……

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] EchoGen：循环一致学习用于统一布局-图像生成与理解

在本工作中，我们提出了 EchoGen，一个用于 layout-to-image generation 和 image grounding 的统一框架，能够生成具有精确布局的图像和……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 文本嵌入插值在连续图像引导中的出乎意料的有效性

我们提出了一种 training-free 框架，用于在 test time 对 text‑conditioned generative models 进行连续且可控的图像编辑。与之前的...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] LoST：语义层级标记化用于3D形状

Tokenization 是在各种模态的生成建模中的基础技术。尤其是，它在自回归（AR）模型中发挥关键作用，……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] GMT：目标条件多模态Transformer用于3D场景中的6-DOF对象轨迹合成

在3D环境中合成可控的6-DOF对象操作轨迹对于使机器人能够与复杂场景交互至关重要，但仍然……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 多功能编辑视频内容、动作和动态，无需训练

Controlled video generation 在近几年取得了显著的进步。然而，编辑操作和动态事件，或插入应产生影响的内容……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 感受空间：自运动感知视频表示用于高效且精准的3D场景理解

近期的多模态大型语言模型（MLLMs）在三维场景中的空间推理方面表现出很高的潜力。然而，它们通常依赖于计算上……

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 面向可扩展的自动化仓库级数据集用于软件漏洞检测

软件漏洞的数量持续增长，且在实际中仍然难以检测。尽管基于学习的漏洞检测已有进展，……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 规范感知分布塑形用于机器人基础模型

机器人基础模型已经展示了在各种任务和环境中执行自然语言指令的强大能力。然而，它们……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 机器翻译中的性别消歧：Decoder-Only 架构的诊断评估

虽然 Large Language Models 在广泛的 NLP 任务中取得了 state-of-the-art 的成果，但它们仍然容易受到系统性偏见的影响。其中，性别偏见 …

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] VideoAtlas：在对数计算中导航长篇视频

将语言模型扩展到视频会带来两个挑战：表示方面，现有方法依赖于有损近似；以及长上下文方面，其中 capti...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 统一的策略价值分解用于快速适应

在复杂控制系统中的快速适应仍然是强化学习的核心挑战。我们提出了一个框架，其中策略和价值函数 …

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[论文] ShapleyLaw：一种基于博弈论的多语言 Scaling Laws 方法

在多语言预训练中，预训练模型的测试损失受到预训练数据中每种语言比例的强烈影响，即语言的…

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 高效免训练多标记预测 via Embedding-Space Probing

大型语言模型（LLMs）尽管仅在下一个标记生成任务上进行训练，却展现出潜在的多标记预测（MTP）能力。我们提出一个简…

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] 多臂顺序假设检验 via Betting

我们考虑一种基于投注的顺序检验的变体，其中在每个时间步，统计学家会被呈现多个数据源（arms），并获取数据……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 只有相对排名在权重聚类的大语言模型中重要

大型语言模型（LLMs）包含数十亿参数，但许多精确数值并非关键。我们展示，最关键的是权重的相对排名……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] IndicSafe：评估南亚多语言 LLM 安全性的基准

随着大语言模型（LLMs）在多语言环境中的部署，它们在文化多样的低资源语言中的安全行为仍然缺乏了解。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 预训练多语言Transformer揭示人类语言之间的量化距离

理解人类语言之间的距离是语言学、人类学以及追溯人类进化史的核心。然而，尽管语言学已经…

#research #paper #ai #nlp
1个月前 · software · - · -

[Paper] 完美和谐：在 Actor-Based 系统中编排因果关系

Runtime verification 已获得广泛关注，作为一种轻量级方法，用于提升受审系统的可靠性。执行 runtime checks 能够动态…

#research #paper #software
1个月前 · ai · - · -

[Paper] 生成式 AI 代理中的差分隐私：分析与最优权衡

大型语言模型（LLMs）和 AI 代理正日益被集成到企业系统中，以访问内部数据库并生成上下文感知的响应……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] scicode-lint：检测科学 Python 代码中的方法论错误，使用 LLM 生成的模式

科学 Python 代码中的方法论错误会产生看似合理但实际上错误的结果，而传统的 linters 和 static analysis tools 无法检测到。Several res...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] RAMP：强化自适应混合精度量化用于高效设备端 LLM 推理

Post training quantization 对于在资源受限的硬件上部署 large language models (LLMs) 至关重要，然而最先进的方法强制统一…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通过领域驱动的分层检索缓解 LLM 幻觉

大型语言模型（LLMs）已经实现了前所未有的流畅度，但仍然容易出现“幻觉”——即生成事实不正确或缺乏依据的内容……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] CodeScout：强化学习代码搜索代理的有效配方

对编码代理在大型代码库上执行任务的前提条件是代码定位——识别相关的文件、类和函数以 w...

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] FailureMem：面向故障感知的多模态框架用于自主软件修复

多模态自动程序修复（MAPR）通过要求模型对源代码、文本问题描述等进行联合推理，扩展了传统的程序修复。

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] CodeT5-RNN：强化 Contextual Embeddings 以提升代码理解

Contextual embeddings 由 LLMs 生成，表现出强烈的 positional inductive biases，这可能限制它们充分捕获 long‑range、order‑sensitive 的信息。

#research #paper #software
1个月前 · software · - · -

[Paper] 从符号到意义：本体论与哲学反思——Large Language Models 在信息系统工程中的

大型语言模型（LLMs）的出现标志着信息系统工程理论基础的转折点。超越其技术……

#research #paper #software
1个月前 · devops · - · -

[Paper] 多阶段流调度用于 LLM 服务

满足严格的 Time-To-First-Token (TTFT) 要求对 LLM 应用至关重要。为了提升效率，现代 LLM 服务系统采用了 disaggregated……

#research #paper #devops
1个月前 · ai · - · -

[论文] 大型语言模型作为神经‑数字生态系统中的语义接口和伦理调解者：概念基础与监管必要性

本文介绍并论证了神经语言整合（Neuro-Linguistic Integration，NLI）的概念，这是一种用于人机交互的新范式，其中 Large Langu...

#research #paper #ai
1个月前 · ai · - · -

[论文] ZipServ：快速且内存高效的 LLM 推理，具备硬件感知的无损压缩

Lossless model compression 在缓解位精确 Large Language Model (LLM) 服务中的内存和带宽瓶颈方面具有巨大的潜力。然而……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 自举编码代理：规范即程序

一个编码代理可以自举自身。它从一份926字的规范和由现有代理（Claude Code）产生的首次实现开始，一个新生成的……

#research #paper #ai #machine-learning
1个月前 · software · - · -

[Paper] MLmisFinder：机器学习服务误用的规范与检测方法

机器学习（Machine Learning，ML）云服务，由亚马逊、谷歌和微软等领先提供商提供，使得将 ML 组件集成到软件中成为可能……

#research #paper #software
1个月前 · devops · - · -

[Paper] 1/W 法则：关于 Context-Length 路由拓扑与 GPU 代际提升对 LLM 推理能效的分析研究

GPU 推理集群每瓦特能交付多少 token？在相同硬件的不同部署中，这个答案相差 40 倍——并不是因为软件效率…

#research #paper #devops
1个月前 · software · - · -

[Paper] 重新审视野外数据中的漏洞补丁识别

攻击可以利用未公开的零日或一天漏洞。为了检测这些漏洞，安全研究人员监控开发...

#research #paper #software
1个月前 · software · - · -

[Paper] 说得容易，逻辑很难：基准测试 LLMs 在后置条件形式化上的表现

形式规范，例如 pre- and post-conditions，为进行彻底的程序验证提供了坚实的基础。然而，开发者很少提供 s...

#research #paper #software

Newer posts

Older posts