Source

arXiv

4611 posts from this source

排序:

3周前 · devops · - · -

[Paper] 调度不可调度的：在规模上驯服黑盒 LLM 推理

当在提交时能够预测输出 token 数量（Gan et al., 2026），针对黑盒 LLM API 的客户端调度就变得半先知：de...

#research #paper #devops
3周前 · ai · - · -

[论文] NestPipe：在 1,500+ 加速器上通过嵌套流水线进行大规模推荐训练

现代 recommendation models 的参数已增长至数万亿。随着 cluster 规模扩展到约 O(1k)，distributed training 的瓶颈从计算…

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 通过自适应 IND-CPA 测试使用深度学习评估 PQC KEMs、Combiners 和 Cascade Encryption

确保密文不可区分性是密码学安全的基础，但在实际实现和混合系统中经验性地验证这一属性……

#research #paper #ai #machine-learning
3周前 · devops · - · -

[Paper] 关于在异步环境和任意数量崩溃情况下具有输出集合的分布式任务的可判定性

在本文中，我们定义了一类新的分布式任务，称为 SOS 任务（Set of Output Sets 任务），其由集合 O 表示不同的输出集合的值。

#research #paper #devops
3周前 · ai · - · -

[Paper] VertAX：一种可微分顶点模型用于学习上皮组织力学

上皮组织通过细胞之间的局部机械相互作用动态重塑，这一过程被 vertex models 很好地捕捉。然而，它们拥有众多可调参数……

#research #paper #ai #machine-learning
3周前 · devops · - · -

[Paper] 在多机器人服务原型中利用聚合编程

多机器人系统在医疗保健、探索和救援任务等多种应用领域变得日益重要。然而，构建…

#research #paper #devops
3周前 · software · - · -

[Paper] REAgent：需求驱动的 LLM 代理用于软件问题解决

问题解决旨在根据给定的 issue descriptions 自动生成 patches，随着 large language models 的快速发展，这一领域已受到显著关注。

#research #paper #software
3周前 · ai · - · -

带时间窗的旅行窃贼问题：基准与启发式

虽然传统的优化问题常常是孤立研究的，但如今许多现实世界的问题需要多个优化组件之间的相互依赖……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] Paper Circle：开源多代理研究发现与分析框架

科学文献的快速增长使研究人员越来越难以高效地发现、评估和综合相关工作。Re...

#research #paper #ai #nlp
3周前 · ai · - · -

[论文] 原位测试时训练

静态的“train then deploy”范式从根本上限制了大型语言模型（LLMs）在面对持续的…

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 小直径垂直管道中 Churn Flow 的拓扑特征化及对 Wu Flow-Regime Map 的无监督校正

Churn flow——垂直两相流中的混沌、振荡状态——在过去40多年里缺乏定量的数学定义。我们首次…

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] HaloProbe：贝叶斯检测与缓解视觉语言模型中的对象幻觉

大型视觉语言模型可能在图像描述中产生对象幻觉，这凸显了有效检测和缓解策略的需求。P...

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] Character Error Vector：可分解错误用于页面级 OCR 评估

字符错误率（CER）是评估光学字符识别（OCR）质量的关键指标。然而，该指标假设文本已经…

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[论文] 目标策略优化

在强化学习（RL）中，给定一个提示（prompt），我们从模型中采样一组补全（completions）并对它们进行评分。随后会出现两个问题：哪些补全应该获得概率质量（probability mass），以及……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] MMEmb‑R1: 推理增强的多模态嵌入与配对感知选择及自适应控制

MLLMs 已成功应用于多模态嵌入任务，但它们的生成推理能力仍未得到充分利用。直接将 cha...

#research #paper #ai #machine-learning #nlp #computer-vision
3周前 · ai · - · -

[Paper] 面向一致的世界模型的多标记预测与潜在语义增强

是否大型语言模型（LLMs）能够形成连贯的内部世界模型仍是核心争论。传统的下一标记预测（Next-Token Prediction，NTP）侧重于单个……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 谁在治理机器？跨企业和地缘政治边界的 AI 系统机器身份治理分类法 (MIGT)

人工智能治理存在盲点：AI 系统用于行动的机器身份。AI agents、service accounts、API tokens，以及 auto...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 基于Shot的量子编码：量子神经网络的数据加载范式

高效的数据加载仍然是近期量子机器学习的瓶颈。现有方案（angle、amplitude 和 basis 编码）要么未充分利用 …

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] PoM：一种线性时间的 Attention 替代方案，使用 Polynomial Mixer

本文介绍了多项式混合器（Polynomial Mixer，PoM），这是一种具有线性复杂度的新型 token mixing 机制，可直接替代 self-attention....

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[论文] Gym-Anything：将任何软件转化为 Agent 环境

计算机使用代理有望在广泛的数字经济活动中提供帮助。然而，当前的研究主要集中在短期视角……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] 轻量化多模态适配视觉语言模型用于无人机热成像中的物种识别与栖息地上下文解释

本研究提出了一种轻量级多模态适配框架，以弥合 RGB 预训练 VLMs 与热红外影像之间的表征差距，并……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] SEM-ROVER：用于大规模驾驶场景生成的语义体素引导扩散

可扩展的户外驾驶场景生成需要在多个视角下保持一致并能够扩展到大范围的 3D 表示。现有的 s...

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 社会动态作为削弱 LLM 集体客观决策的关键漏洞

大型语言模型（LLM）代理正日益在多代理环境中充当人类代表，在这种环境中，代表代理整合多样的同行…

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] LAG‑XAI：一种受 Lie 启发的仿射几何框架，用于 Transformer 潜在空间中的可解释改写

现代基于Transformer的语言模型在自然语言处理任务中表现出色，但它们的潜在语义空间仍然在很大程度上未被……

#research #paper #ai #machine-learning #nlp
3周前 · ai · - · -

[Paper] 基于双自一致强化学习的科学图形程序合成

Graphics Program Synthesis 对于解释和编辑视觉数据至关重要，有效促进了将静态视觉内容逆向工程为可编辑的形式……

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 他人视角的你的生活故事：基于丰富心理测量画像的 LLM 生成生活故事的往返评估

人格特质在自然语言中被丰富地编码，而在人工文本上训练的大型语言模型（LLMs）在以提示为条件时可以模拟人格。

#research #paper #ai #machine-learning #nlp
3周前 · devops · - · -

[论文] 基于 AMD GPU/APU 的 Exascale 节点细粒度功率与能量归因

现代的 exascale GPU 和 APU 系统提供了多个功率和能量传感器，但在范围、更新速率、时序和滤波方面的差异使得……

#research #paper #devops
3周前 · devops · - · -

[论文] GTaP：GPU 常驻的 Fork-Join 任务并行运行时，具备基于 Pragma 的接口

图形处理单元（GPUs）在常规的数据并行工作负载中表现出色，因为可以轻松利用大规模硬件并行性。相比之下，许多重要的…

#research #paper #devops
3周前 · ai · - · -

[Paper] QiMeng-PRepair：通过编辑感知奖励优化实现精确代码修复

Large Language Models (LLMs) 在程序修复方面表现出色，但常常出现过度编辑的问题，即过多的修改会覆盖正确的代码……

#research #paper #ai #machine-learning
3周前 · software · - · -

[Paper] 进化优化 AI 崩溃的软件开发栈：劳动临界点与劳动力重新布局

本文提出了一个用于优化软件开发中人类与AI劳动力分配的量化框架，可迁移到其他劳动类别。I for...

#research #paper #software
3周前 · devops · - · -

[Paper] JZ-Tree：GPU 友好邻居搜索与 Friends-of-Friends 的双树遍历（基于 JAX 与 CUDA）

基于 spatial tree traversal 的算法被广泛认为是 CPU-based high-performance 环境中许多问题最有效且最灵活的方法之一。

#research #paper #devops
3周前 · ai · - · -

[Paper] 神经网络剪枝通过 QUBO 优化

Neural network pruning 可以被表述为一个 combinatorial optimization 问题，但大多数现有方法依赖于忽视复杂 int... 的 greedy heuristics。

#research #paper #ai #machine-learning #computer-vision
3周前 · software · - · -

[Paper] Proof of Concept 作为首要的架构决策工具

概念验证（PoCs）在软件工程中被广泛采用。尽管其重要性，概念验证仍在概念上缺乏明确定义，方法论也不够完善……

#research #paper #software
3周前 · software · - · -

[Paper] 负测试作为完整性信号的强化学习用于形式规范合成

规范合成任务旨在自动为现有程序生成规范，并附带任何必要的辅助验证注释。

#research #paper #software
3周前 · ai · - · -

[Paper] 约束驱动 Warm-Freeze 用于光伏系统的高效迁移学习

检测光伏（PV）监测和 MPPT 控制信号中的网络攻击，需要模型对 bias、drift 和 transient spikes 具有鲁棒性，同时又要轻量化……

#research #paper #ai
3周前 · software · - · -

[Paper] 对 Hugging Face 上通用 LLMs 与多模态 LLMs 感知的实证研究

大型语言模型（LLMs）已快速从通用系统演变为能够处理文本、图像和音频的多模态模型。随着两者...

#research #paper #software
3周前 · ai · - · -

[Paper] CAKE：大语言模型的云架构知识评估

在当今的 software architecture 中，large language models (LLMs) 充当 software architecture co-pilots。然而，目前没有 benchmark 来评估 large...

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] SemLink：一种语义感知的自动化测试Oracle，用于使用Siamese Sentence-BERT的超链接验证

Web 应用程序在很大程度上依赖超链接来连接不同的信息资源。然而，网络的动态特性导致链接腐烂（link rot），即目标…

#research #paper #ai #machine-learning #nlp
3周前 · devops · - · -

[Paper] 优化 OpenFaaS 在 Kubernetes 上的部署：语言运行时与集群分布的比较分析

Serverless computing，特别是 Function-as-a-Service (FaaS)，通过抽象基础设施管理并实现动态…

#research #paper #devops
3周前 · ai · - · -

[Paper] MegaTrain：在单个 GPU 上对 1000 亿以上参数的大语言模型进行全精度训练

我们提出 MegaTrain，这是一种以 memory-centric 为核心的系统，能够在单个 GPU 上以 full precision 高效训练 100B+ 参数的大型语言模型。不同于传统的……

#research #paper #ai #nlp
3周前 · ai · - · -

[Paper] Vanast: 虚拟试衣与人体图像动画通过合成三元组监督

我们提出了 Vanast，一个统一的框架，能够直接从单张人物图像、服装图像和 pose 生成 garment‑transferred 人体动画视频。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] PointTPA：动态网络参数适配用于3D场景理解

场景级点云理解仍然具有挑战性，因为几何形状多样，类别分布不平衡，空间布局高度多变。Exist...

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] LoMa：局部特征匹配再探讨

局部特征匹配长期以来一直是 3D 视觉系统（如 Structure-from-Motion (SfM)）的基础组成部分，然而其进展相较于快速 …

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 重新思考模型效率：大模型下的多智能体推理

大多数视觉语言模型（VLM）使用大型语言模型（LLM）作为解码器，其中响应标记通过自回归（autoregressive）方式顺序生成。

#research #paper #ai #computer-vision
3周前 · ai · - · -

[Paper] 你的预训练扩散模型暗中了解修复

预训练的扩散模型推动了全能修复（All-in-One Restoration，AiOR）的显著进展，提供了更好的感知质量和泛化能力。Ho...

#research #paper #ai #machine-learning #computer-vision
3周前 · ai · - · -

[Paper] 使用Signal Temporal Logic对强化学习进行分层

在本文中，我们开发了一种基于分层的 Signal Temporal Logic (STL) 语义，其中每个原子谓词被解释为 membership test in……

#research #paper #ai #machine-learning
3周前 · ai · - · -

[Paper] TriAttention：高效长推理与三角 KV 压缩

在大型语言模型（LLMs）中进行扩展推理会导致严重的 KV 缓存内存瓶颈。领先的 KV 缓存压缩方法使用…来估计 KV 重要性。

#research #paper #ai #nlp #computer-vision
3周前 · ai · - · -

[Paper] PINNs 在 PDE 受约束的最优控制问题中的直接方法与间接方法

我们研究 physics-informed neural networks (PINNs) 作为求解半线性偏微分方程最优控制的数值工具。我们首先回顾 c...

#research #paper #ai #machine-learning

Newer posts

Older posts