Source

arXiv

4737 posts from this source

排序:

3个月前 · ai · - · -

[Paper] READY：奖励发现用于元黑箱优化

Meta-Black-Box Optimization（MetaBBO）是优化社区中新兴的研究方向，在该方向中，算法设计策略可以通过强化学习进行元学习……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 架起预测准确性与库存KPIs之间的桥梁：基于仿真的软件框架

在汽车后市场中，高效的备件库存管理至关重要，因为需求高度间歇且不确定性导致巨大的成本……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] DASH：确定性注意力调度用于高吞吐可复现的 LLM 训练

确定性对于大语言模型（LLM）训练中的可重复性是必不可少的，但它往往会带来巨大的性能代价。在广泛使用的注意力 …

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通用自预测增强用于脉冲神经元

脉冲神经网络（SNNs）由于事件驱动的稀疏计算而具有极高的能效，但其训练受到脉冲不可微分性的挑战。

#research #paper #ai
3个月前 · software · - · -

[Paper] 软件工程中的 Folklore：定义与概念基础

我们探讨 software engineering 中的 folklore 概念，借鉴 folklore studies 来定义和刻画 narratives、myths、rituals、humor，以及……

#research #paper #software
3个月前 · ai · - · -

[Paper] 评估大型语言模型的业务流程建模能力

创建业务流程模型与标记（BPMN）模型是一项复杂且耗时的任务，需要领域知识和建模熟练度……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 错误放大限制了 ANN 到 SNN 转换在连续控制中的表现

脉冲神经网络（SNNs）可以通过转换已有的、训练良好的人工神经网络（ANNs）来实现竞争性的性能，避免进一步…

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 面向软件工程同行评审的可持续未来

同行评审是软件工程社区评估科学成果质量的主要机制。然而，论文提交的快速增长……

#research #paper #software
3个月前 · ai · - · -

[Paper] EWSJF：面向混合工作负载 LLM 推理的自适应调度器与混合分区

在混合工作负载下提供大型语言模型（LLMs）服务——短小、对延迟敏感的交互查询与长时间、面向吞吐量的批处理请求并存——pos...

#research #paper #ai #machine-learning
3个月前 · devops · - · -

[Paper] bigMICE：大数据的多重插补

缺失数据是许多应用中普遍存在的问题，包括大型医学登记系统，如 Swedish Healthcare Quality Registries，可能导致……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 元上下文工程通过能动技能演化

大型语言模型的运行效率在很大程度上依赖于其 inference-time context。这使得 Context Engineering (CE) 成为一个正式的学科……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] LLaMEA‑SAGE：利用可解释AI的结构反馈指导自动算法设计

大型语言模型通过直接从自然语言提示生成优化算法，使得自动算法设计（AAD）成为可能。虽然演化……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] MAR：通过模块感知架构细化实现高效大语言模型

大型语言模型（LLMs）在各个领域表现出色，但由于 quadratic attention 和密集的 Feed-Forward Network（FFN）操作导致高能耗。

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] ScaleSim：为大规模多智能体仿真提供基于调用距离的内存管理

基于 LLM 的多代理仿真正被越来越多的应用领域采用，但由于 GPU 内存压力，仍然难以扩展。每个代理主要…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] AlignCoder：将检索与目标意图对齐以实现仓库级代码补全

由于对仓库的理解有限，现有的代码大型语言模型（code LLMs）在仓库级代码补全方面仍然是一个具有挑战性的任务。

#code completion #retrieval-augmented generation #reinforcement learning #code LLM #repository context
3个月前 · software · - · -

[Paper] 使用 LLMs 评估架构文档：来自数字市场环境的结果

Generative AI 在 software engineering 活动中扮演着日益重要的角色，使它们例如更高效或提供更好的质量。然而，它往往……

#research #paper #software
3个月前 · ai · - · -

[Paper] ProToken：Token级归因用于联邦大语言模型

Federated Learning (FL) 使得在分布式数据源上协作训练 Large Language Models (LLMs) 成为可能，同时保护隐私。然而，当 f...

#research #paper #ai #machine-learning
3个月前 · it · - · -

[论文] 使用 GPU 光线追踪和张量核心的凸包 3D 过滤

近年来，real-time simulations、autonomous systems 和 video games 等应用对 complex geometric models 的处理需求日益增长……

#GPU acceleration #convex hull #ray tracing #tensor cores #high-performance computing
3个月前 · software · - · -

[论文] 谁说了 CVE？漏洞标识符在拉取请求中被人类、机器人和代理如何提及

漏洞标识符，如 CVE、CWE 和 GHSA，是已知软件安全问题的标准化引用，但它们在实际中的使用尚未得到充分理解。

#research #paper #software
3个月前 · it · - · -

[Paper] DynQ：一种通过质量加权社区检测实现的动态拓扑无关量子虚拟机

量子云平台仍然本质上是非虚拟化的：尽管硬件快速扩展，每个用户程序仍然独占整个量子处理器，…

#quantum computing #quantum virtual machine #cloud quantum services #hardware virtualization #quality-weighted community detection
3个月前 · devops · - · -

[Paper] 边缘的模块化基础模型推理：网络感知的微服务优化

Foundation models (FMs) 解锁了前所未有的多模态和多任务智能，但它们以云为中心的部署阻碍了实时响应和……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 基于锦标赛的对抗质量多样性

Quality diversity (QD) 是进化计算的一个分支，旨在寻找高质量且行为多样的解决方案。虽然对抗性问题…

#research #paper #ai
3个月前 · ai · - · -

[Paper] 重新思考智能：类脑神经元网络

自从它们诞生以来，人工神经网络一直依赖手工设计的 architectures 和 inductive biases，以更好地适应数据和任务。随着…

#research #paper #ai
3个月前 · ai · - · -

[Paper] 后验分布辅助的进化动态优化作为复杂社会模拟的在线校准器

对复杂社会系统的模拟器进行校准的目标是识别能够使模拟器输出最佳匹配目标的最优参数。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] ROIDS：鲁棒异常感知的知情下采样

已知 Informed down-sampling (IDS) 在与各种选择策略结合时，尤其是 tournament selection，能够提升 symbolic regression 的性能。

#research #paper #ai
3个月前 · devops · - · -

去中心化非光滑非凸优化与客户端采样

本文考虑具有 Lipschitz 连续局部函数的去中心化非光滑非凸优化问题。我们提出了一种高效的随机一阶……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 重新审视 LLM 后训练中的 Parameter Server

现代数据并行（DP）训练倾向于使用集合通信而非参数服务器（PS），因为在负载均衡的情况下，它更简单且效率更高。不过…

#research #paper #ai #machine-learning
3个月前 · devops · - · -

[Paper] KUBEDIRECT：释放集群管理器的全部潜能用于无服务器计算

FaaS 平台依赖像 Kubernetes 这样的集群管理器进行资源管理。Kubernetes 因其以状态为中心的 API 而受到欢迎，这些 API 将控制平面与底层实现解耦。

#research #paper #devops
3个月前 · ai · - · -

[Paper] HEATACO：热图引导的蚁群解码用于大规模旅行商问题

Heatmap-based 非自回归求解器用于大规模 Travelling Salesman Problems，输出密集的 edge‑probability scores，但最终性能在很大程度上取决于……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 通过句子嵌入的核变点检测实现无监督文本分段

Unsupervised text segmentation 是至关重要的，因为边界标签成本高、主观性强，并且常常难以在不同领域和粒度选择之间迁移。...

#text segmentation #unsupervised learning #kernel change-point detection #sentence embeddings #nlp
3个月前 · ai · - · -

[Paper] Dep-Search：学习依赖感知的推理轨迹与持久化内存

大型语言模型（LLMs）在复杂推理任务中展现了卓越的能力，尤其是在与搜索机制（search mechanisms）相结合以实现……时。

#dependency-aware reasoning #large language models #retrieval-augmented generation #multi-hop question answering #persistent memory
3个月前 · ai · - · -

[Paper] 学习发现：一种用于Raga识别的通用框架，避免遗忘

在印度艺术音乐（IAM）中，Raga 识别仍然具有挑战性，因为存在大量很少演奏的 Raga，这些 Raga 并未在可用的…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] $α^3$-SecBench：面向基于LLM的UAV代理在6G网络上的安全、弹性与信任的大规模评估套件

自主无人机（UAV）系统正日益在安全关键的网络环境中部署，在这些环境中，它们必须在pr中可靠运行。

#LLM security #UAV autonomy #6G networks #adversarial benchmarking #AI safety
3个月前 · ai · - · -

[论文] HalluGuard：揭示大语言模型中数据驱动和推理驱动的幻觉

大型语言模型（LLMs）在医疗、法律和科学发现等高风险领域的可靠性常常受到 hallucinations 的影响……

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] 让每个 Pull Request 都有意义：对开发者和 Agentic Pull Request 的实证分析

使用 AI 代理自动生成拉取请求（PR）已变得日益普遍。虽然 AI 生成的 PR 速度快、创建简便，但它们的……

#research #paper #software
3个月前 · ai · - · -

[Paper] 务实的 VLA 基础模型

在机器人操作中展现出巨大潜力，具备能力的 Vision‑Language‑Action (VLA) 基础模型有望在各类任务间忠实地实现泛化并且……

#vision-language-action #robotics #foundation-model #computer-vision #machine-learning
3个月前 · ai · - · -

[Paper] 稳健感知测地线上的反事实解释

潜在空间优化方法用于反事实解释——将其框定为改变模型预测的最小语义扰动——继承了模糊性……

#counterfactual explanations #perceptual geodesics #computer vision #machine learning #robustness
3个月前 · ai · - · -

[Paper] Splat-Portrait：使用 Gaussian Splatting 泛化 Talking Heads

Talking Head Generation 旨在从语音和单张肖像图像合成自然逼真的说话视频。先前的 3D Talking Head Generation 方法……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

【论文】AdaReasoner：动态工具编排用于迭代视觉推理

当人类面对超出自身直接能力的问题时，他们会依赖工具，这为在多模态学习中提升视觉推理提供了一个有前景的范式。

#multimodal-llm #visual-reasoning #tool-orchestration #reinforcement-learning #research-paper
3个月前 · ai · - · -

[Paper] CONQUER：上下文感知表示与查询增强用于基于文本的人员搜索

文本检索人物搜索（TBPS）旨在使用自然语言描述从大型图库中检索行人图像。该任务对于公共安全……

#text-based person search #cross-modal retrieval #computer vision #query enhancement #optimal transport
3个月前 · ai · - · -

[Paper] 原子簇的全局优化：基于物理约束的张量列车分解

原子团簇的全局优化由于其组合空间的指数增长，构成了计算化学和材料科学中的根本挑战。

#research #paper #ai
3个月前 · software · - · -

[Paper] MLOps 框架在开源项目中的使用方式如何？实证特征描述

机器学习（ML）运维（MLOps）框架旨在帮助开发者和 AI 工程师管理其机器学习模型的生命周期。Whi...

#research #paper #software
3个月前 · software · - · -

[论文] 关于废除“ICSE Paper”并采用“Registered Proposal”和“Results Report”

为了解决该领域的“novelty‑vicious cycle”和“replicability crisis”（两者都在调查中讨论），我们提议废除“ICSE paper”，因为我们…

#research #paper #software
3个月前 · software · - · -

[Paper] 对机器学习实验的审计——软件缺陷预测

背景：Machine learning algorithms 被广泛用于预测 defect prone software components。在这篇文献中，computational experiments 是主要的……

#machine learning #software defect prediction #empirical study #reproducibility #software engineering
3个月前 · ai · - · -

[Paper] 进化算法在GPU上的扩展行为：并行性何时有回报？

进化算法（EAs）正日益在图形处理单元（GPUs）上实现，以利用并行处理能力提升效率……

#research #paper #ai
3个月前 · ai · - · -

[Paper] daVinci-Dev：Agent-native Mid-training for 软件工程

最近，大型语言模型（LLM）能力的前沿已经从单轮代码生成转向代理式软件工程——一种……

#agentic AI #mid-training #software engineering #LLM #code generation
3个月前 · devops · - · -

[Paper] 关于区块链的带宽消耗

随着区块链技术的出现，提案数量激增。这些区块链提案产生的网络流量增加了...

#research #paper #devops
3个月前 · it · - · -

[Paper] 量子网络的自适应纯化控制器：动态协议选择与多方蒸馏

高效的 entanglement distribution 是 Quantum Internet 的基石。然而，诸如 photon loss、memory coherence time 等物理链路参数……

#quantum networking #entanglement purification #adaptive protocol selection #quantum internet #dynamic resource allocation

Newer posts

Older posts