Source

arXiv

4663 posts from this source

排序:

2个月前 · software · - · -

[Paper] 规模化测试驱动代码生成：从函数到类的实证研究

测试驱动开发（TDD）已被采用，通过使用测试作为可执行规范来改进基于大语言模型（LLM）的代码生成。然而，...

#research #paper #software
2个月前 · software · - · -

[Paper] 大型工业数据库管理系统中的 Flaky 测试：针对 SAP HANA 已解决的问题报告的实证研究

Flaky tests 在对相同版本的 source code 多次执行时会产生不同的结果。因此，它们提供了关于质量的模糊信号……

#research #paper #software
2个月前 · ai · - · -

[Paper] 通过基旋转缓解异步流水线并行中的陈旧性

异步流水线并行通过消除同步执行中固有的流水线气泡，最大化硬件利用率，提供了一条通往 e...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] DALI：一种工作负载感知的卸载框架，用于在本地 PC 上实现高效 MoE 推理

Mixture of Experts (MoE) 架构显著提升了 LLM 的容量，而计算量并未相应增加，但代价是巨大的参数……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[论文] 递归节能协议

一致性是分布式计算中的基础性问题，已被广泛研究超过四十年。最近，Meir、Mirault、Peleg 和 Robins……

#research #paper #devops
2个月前 · devops · - · -

[Paper] 在区块链验证与构建中利用多核并行

区块链验证者可以通过利用 multi-core CPUs 来缩短区块处理时间，但 deterministic execution 必须在保持给定 total order 的同时，仍然遵守 …

#research #paper #devops
2个月前 · ai · - · -

[Paper] 动态拓扑优化用于去中心化学习中的非IID数据

去中心化学习（DL）使一组节点能够在没有中心协调的情况下协作训练模型，提供了隐私和可扩展性方面的优势……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 多源流量分配中的网络与服务器联合拥塞：凸形式化与基于价格的去中心化

本文研究了一个在许多网络化和分布式系统中出现的重要速率分配问题：来自多个…的稳态流量速率分配。

#research #paper #devops
2个月前 · devops · - · -

[Paper] StreamShield：面向 ByteDance 的 Apache Flink 的经生产验证的弹性解决方案

分布式流处理系统（Distributed Stream Processing Systems，DSPS）是字节跳动实时处理和分析的核心支柱，其中 Apache Flink 为其中最大规模的系统提供动力……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 对比概念树搜索用于 LLM 辅助的算法发现

大型语言模型（LLM）辅助的算法发现是一种迭代的、黑箱的程序优化过程，用于近似求解目标任务，……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 研究调度抢占对动态任务图调度的影响

动态调度任务图通常在不重新审视先前任务分配的情况下进行，主要关注最小化 makespan。我们研究受控…

#research #paper #devops
2个月前 · ai · - · -

[Paper] RPG-AE：神经符号图自编码器与稀有模式挖掘用于基于溯源的异常检测

高级持续性威胁（APTs）是复杂的、长期的网络攻击，由于其隐蔽操作且常常融入…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 在特征空间中使用相似性搜索细化异常检测的决策边界

在高度不平衡的数据集中检测稀有且多样的异常——例如网络安全中的高级持续性威胁（APTs）——仍然是一个根本性的挑战 f...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 无奖励对齐用于冲突目标

直接对齐方法正日益用于将大型语言模型（LLMs）与人类偏好对齐。然而，许多现实中的对齐问题涉及……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] MEG-XL：数据高效的 Brain-to-Text 通过长上下文预训练

临床 brain-to-text 接口旨在为无法提供大量训练录音的瘫痪患者设计。预训练提升了数据高效的生成……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] PixelGen：Pixel Diffusion 击败 Latent Diffusion，使用感知损失

Pixel diffusion 直接在像素空间中端到端生成图像，避免了在两阶段潜在空间中由 VAE 引入的伪影和瓶颈……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] RLAnything：在完全动态的 RL 系统中打造环境、策略和奖励模型

我们提出 RLAnything，一个通过闭环优化动态锻造环境、策略和奖励模型的强化学习框架，...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] RE-TRAC：递归轨迹压缩用于深度搜索代理

基于LLM的深度研究代理主要构建在ReAct框架上。这种线性设计使得重新访问早期状态、分支到替代方案变得困难，...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 通过文本反馈扩展 Reinforcement Learning 的能力

RL 在 LLM 后训练中的成功源于一种极其信息不足的来源：每次 rollout 只提供一个二进制奖励或偏好的单比特信息……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] Flow Policy Gradients for Robot Control

Likelihood-based policy gradient 方法是从奖励训练机器人控制策略的主流方法。这些方法依赖于可微分的动作……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 训练 LLMs 进行分而治之推理提升测试时可扩展性

大型语言模型（LLMs）已经通过逐步的思考链（CoT）推理展示了强大的推理能力。然而，在极限……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] AgentRx：从执行轨迹诊断 AI Agent 故障

AI agents 经常以难以定位的方式失败，因为执行具有 probabilistic、long-horizon、multi-agent 的特性，并且受 noisy tool outputs 的影响……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] MemSkill：学习与进化记忆技能以实现自我进化的智能体

大多数大型语言模型（LLM）代理记忆系统依赖于一小套静态、手工设计的操作来提取记忆。这些固定的过程硬-...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] HumanX：面向敏捷且可泛化的类人交互技能——基于人类视频

使 humanoid robots 执行灵活且自适应的交互任务长期以来一直是 robotics 的核心挑战。当前的方法受到 eith... 的瓶颈限制。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SPARKLING：在宽度渐进学习中平衡信号保留与对称性破坏

渐进学习（Progressive Learning，PL）通过逐步扩大模型规模来降低预训练的计算开销。虽然之前的工作已经广泛探讨了深度扩展……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 通过将检测头融入上下文层神经网络实现多头自动分割

基于 deep learning 的 auto segmentation 正在放射治疗中日益广泛使用，但传统模型常常产生解剖上不合理的假阳性，或 h...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 打破自回归语言模型中的逆转诅咒：通过 Identity Bridge

自回归大型语言模型（LLMs）在许多复杂任务中取得了显著成功，但它们在非常简单的逻辑推理方面仍可能失败，例如……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 信念引导的代理性与元认知监控在大型语言模型中的指示

大型语言模型（LLMs）的快速进展引发了这些模型是否具备某种形式的意识的疑问。为了解决这一挑战，...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] MentisOculi: 揭示使用心理意象进行推理的局限性

前沿模型正从仅仅摄取视觉信息的多模态大语言模型（MLLMs）转向统一多模态模型（UMMs），具备……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 从方向到区域：通过局部几何分解语言模型中的激活

Activation decomposition methods 在语言模型中与关于概念在 activation space 中如何实现的几何假设紧密耦合。Existing appr...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] Drift-Bench：通过多轮交互诊断输入故障下LLM代理的协作失效

随着 Large Language Models 转向 autonomous agents，用户输入经常违反合作假设（例如，隐式意图、缺失参数、错误……）。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] RANKVIDEO：推理重新排序用于文本到视频检索

重新排序是现代检索系统的关键组成部分，这类系统通常将高效的第一阶段检索器与更具表达能力的模型配对，以细化检索结果……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 能源高效的神经形态计算用于边缘AI：一种自适应脉冲神经网络和硬件感知优化的框架

边缘AI应用对 ultra‑low‑power、low‑latency 推理的需求日益增长。基于 event‑driven spiking neural networks (SNNs) 的 Neuromorphic computing ……

#spiking neural networks #neuromorphic computing #edge AI #energy efficiency #hardware-aware optimization
2个月前 · devops · - · -

[Paper] sVIRGO：可扩展虚拟树层次框架用于分布式系统

我们提出 sVIRGO，一种面向大规模分布式系统的可扩展虚拟树层次框架。sVIRGO 直接在 … 上构建虚拟层次树。

#research #paper #devops
2个月前 · ai · - · -

[Paper] UniReason 1.0：一个用于世界知识对齐的图像生成与编辑的统一推理框架

统一的多模态模型在需要深度推理的复杂合成任务上常常表现不佳，且通常将 text-to-image generation 和 image editing 视为……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[论文] SelvaMask：热带森林及其他地区的树木分割

热带森林拥有地球上大多数树木的生物多样性，对全球生态平衡至关重要。Canopy trees 尤其发挥了不成比例的作用……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SafeGround：了解何时通过不确定性校准信任 GUI Grounding 模型

图形用户界面（GUI）对齐旨在将自然语言指令转换为可执行的屏幕坐标，从而实现自动化的 GUI 交互....

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Catalyst：通过弹性缩放进行分布外检测

Out-of-distribution（OOD）检测对于深度神经网络的安全部署至关重要。最先进的后置（post-hoc）方法通常会推导 OOD 分数 f...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] ReasonEdit：使用人类推理编辑视觉语言模型

Model editing 旨在纠正大型、预训练模型中的错误，而不改变无关的行为。虽然一些近期工作已经编辑了 vision-language model……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] SoMA：Real-to-Sim 神经模拟器用于机器人软体操作

在丰富交互下模拟可变形对象仍然是 real-to-sim 机器人操作的根本挑战，其动力学由环境等因素共同驱动。

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[论文] Superman：统一 Skeleton 与 Vision 用于 Human Motion 感知与生成

人类动作分析任务，如 temporal 3D pose estimation、motion prediction 和 motion in‑betweening，在计算机视觉中发挥着关键作用。然而...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SWE-Universe: 将真实可验证环境规模扩展至数百万

我们提出了 SWE-Universe，一个可扩展且高效的框架，用于自动构建来自 Gi… 的真实世界软件工程（SWE）可验证环境。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 层次联邦学习与 SignSGD：一种高通信效率的方法

Hierarchical federated learning（HFL）已成为大规模无线和物联网系统的关键架构，设备在其中与 …

#research #paper #ai #machine-learning
2个月前 · devops · - · -

【论文】LCLs 超越有界度数

对局部可检查标记（Locally Checkable Labelings，LCLs）的研究已经导致对有界‑…上可能出现的分布式时间复杂度进行了极其精确的刻画。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 内含子和模板很重要：重新思考 GP-GOMEA 中的 Linkage

GP-GOMEA 是符号回归领域的最先进技术之一，尤其在寻找小规模且可能可解释的解方面表现突出。关键机制……

#research #paper #ai
2个月前 · software · - · -

[Paper] 理解与检测 GitHub Actions 中的不稳定构建

持续集成（CI）被广泛用于对代码更改提供快速反馈；然而，CI 构建结果并不总是可靠的。构建可能会间歇性地失败。

#research #paper #software
2个月前 · ai · - · -

[Paper] Spark: 模块化脉冲神经网络

如今，neural networks 已经成为 artificial intelligence 的代名词。当前的 neural network 模型虽然非常强大，但在 ... 方面效率低下。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] RACA：表示感知的覆盖准则用于大语言模型安全测试

近期在 LLMs 方面的进展已在各种 AI 应用中取得了重大突破。然而，它们的复杂能力也带来了严重的 sa...

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts