Source

arXiv

4797 posts from this source

排序:

5个月前 · devops · - · -

[Paper] 分布式量子计算与 Fan‑Out 操作及 Qudit：分布式全局门的案例（初步研究）

近年来，关于分布式量子计算的大量研究主要集中在纠缠对和分布式双量子比特门的使用上。但也有关于 ef… 的研究。

#research #paper #devops
5个月前 · devops · - · -

[Paper] FFTrainer：大语言模型训练中的快速故障切换与几乎免费状态管理

近期在大型语言模型（LLMs）方面的发展提出了对高效且稳健训练的新需求。随着LLM集群规模的扩大，节点故障、...

#research #paper #devops
5个月前 · software · - · -

[Paper] Sigmoid函数的形式分析与通用逼近定理的形式化证明

本文提出了对 sigmoid 函数的形式化分析，并在 Isabelle/HOL 中给出了 Universal Approximation Theorem (UAT) 的完整机械化证明，...

#research #paper #software
5个月前 · devops · - · -

[Paper] AutoPas 中分子动力学模拟的向量化参数调优

Molecular Dynamics simulations 可以帮助科学家在原子尺度上获取对物理过程的宝贵洞察。本工作探讨了各种技术……

#research #paper #devops
5个月前 · devops · - · -

[Paper] 双边缘辅助计算卸载与资源分配用于空间-空中-海洋集成网络

在本文中，我们提出了一种双边缘辅助的计算卸载与资源分配方案，专为空间‑空中‑海洋集成网络（SAMINs）量身定制。

#research #paper #devops
5个月前 · software · - · -

[Paper] 探索大型语言模型在新手程序错误定位中的潜力与局限

新手程序员常常在错误定位方面面临挑战，因为他们的经验有限且对编程语法和逻辑的理解不足。传统的 me...

#research #paper #software
5个月前 · software · - · -

[Paper] HarnessAgent：规模化自动模糊测试 Harness 构建的工具增强 LLM 流水线

基于大型语言模型（LLM）的技术在生成程序模糊测试的 harnesses 方面取得了显著进展。然而，将它们应用于任意函数……

#research #paper #software
5个月前 · devops · - · -

[Paper] TokenScale：及时且精准的自动扩缩容，适用于分离式 LLM 服务的 Token Velocity

在 LLM 服务中，架构向 prefill/decode (PD) 解耦的转变提升了资源利用率，但在应对现代工作负载的突发性方面存在困难。

#research #paper #devops
5个月前 · ai · - · -

[Paper] VS-Graph：可扩展且高效的图分类使用超维计算

图分类是一个基础任务，涉及从分子属性预测到材料设计等多个领域。虽然图神经网络（GNN）取得了……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] Vibe Coding 安全吗？在真实世界任务中对代理生成代码的漏洞进行基准评估

Vibe 编码是一种新的编程范式，人类工程师指示大型语言模型（LLM）代理完成复杂的编码任务，几乎不需要监督……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] MagicQuillV2：精确且交互式的图像编辑与分层视觉提示

我们提出 MagicQuill V2，这是一种新颖的系统，引入了分层组合范式用于生成式图像编辑，弥合了语义……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] CAMEO：多视角扩散模型的对应注意力对齐

多视角扩散模型最近作为一种强大的新视角合成范式出现，然而支撑其视图一致性的底层机制仍未被完全阐明……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] OneThinker：全能图像和视频推理模型

强化学习（RL）最近在多模态大型语言模型（MLLMs）中引发视觉推理方面取得了显著成功。然而，现有的...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] PPTArena：用于代理式 PowerPoint 编辑的基准

我们推出 PPTArena，这是一项用于 PowerPoint 编辑的基准，衡量在自然语言指令下对真实幻灯片进行可靠修改的能力。相比之下…

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] MultiShotMaster：可控的多镜头视频生成框架

当前的视频生成技术在单镜头剪辑（single-shot clips）方面表现出色，但在生成需要灵活镜头安排、连贯性的叙事多镜头视频（multi-shot videos）方面仍然困难，……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] Video4Spatial：迈向具备上下文引导的视频生成的视觉空间智能

我们调查视频生成模型是否能够展现视觉空间智能，这是一种对人类认知至关重要的能力，仅使用视觉数据。为此……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] ViSAudio：端到端视频驱动的双耳空间音频生成

尽管视频到音频生成取得了进展，该领域主要关注单声道输出，缺乏空间沉浸感。现有的binaural方法仍然……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 学习无需加速度测量的物理一致拉格朗日控制模型

本文研究了涉及非保守力的拉格朗日系统的建模与控制，采用一种不需要加速度的混合方法...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] MAViD：用于音频-视觉对话理解与生成的多模态框架

我们提出 MAViD，一个用于 Audio-Visual Dialogue 理解和生成的全新 Multimodal 框架。现有方法主要关注非交互式的……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] SMP：可复用的 Score-Matching Motion Priors 用于基于物理的角色控制

Data-driven motion priors 能够引导 agents 产生自然行为，在创建逼真的虚拟角色方面发挥关键作用。Adversaria...

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 道德一致性流水线：大型语言模型的持续伦理评估

Large Language Models (LLMs) 的快速发展和适应性凸显了道德一致性的需求，即保持伦理连贯性的能力……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] LORE：用于搜索相关性的大型生成模型

成就。我们推出 LORE，一个基于大型生成模型的电商搜索相关性系统框架。已部署并迭代三年，...

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] TokenPowerBench：基准测试 LLM 推理的功耗

大型语言模型（LLM）服务现在每天回答数十亿次查询，行业报告显示，推理（inference）而非训练（training）占比超过90%。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Unrolled Networks 是 MRI 重建中的条件概率流

磁共振成像（MRI）提供了出色的软组织对比度且无需电离辐射，但其长时间的采集限制了临床实用性。最近……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 分布校准的推理时间计算用于思考 LLM-as-a-Judge

考虑到用作成对偏好评判的 Large Language Models (LLMs) 在单样本层面仍然噪声较大，且常见的聚合规则（多数投...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] 用于肖像视频编辑的 In-Context Sync-LoRA

编辑肖像视频是一项具有挑战性的任务，需要在广泛的修改范围内实现灵活且精确的控制，例如外观变化、表情……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 从审查到调解：LLMs 能否在在线火焰战中充当调解者？

大型语言模型（LLMs）的快速发展为 AI for good 应用打开了新的可能性。随着 LLMs 越来越多地调解在线交流……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 微调的大型语言模型用于逻辑翻译：使用 Lang2Logic 减少幻觉

近年来自然语言处理（NLP），尤其是大语言模型（LLMs）的进展，促使了自然语言 ... 的自动翻译。

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] ProteinPNet：用于空间蛋白质组学中概念学习的原型部件网络

理解肿瘤微环境 (TME) 的空间结构对于推动精准肿瘤学至关重要。我们提出了 ProteinPNet，一个新颖的框架……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] U4D：不确定性感知的4D世界建模基于LiDAR序列

从 LiDAR 序列建模动态 3D 环境是构建可靠的 4D 世界以用于 autonomous driving 和 embodied AI 的核心。现有的生成框架……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] InEx：通过自省和跨模态多代理协作进行幻觉缓解

幻觉仍然是大型语言模型（LLMs）的关键挑战，阻碍了可靠的多模态LLM（MLLM）发展。现有的解决方案……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 重新思考通用BCI：对 340,000+ 独特算法配置进行 EEG 精神指令解码的基准测试

对使用脑电图（EEG）测量的脑模式进行稳健的解码和分类仍然是现实世界（即科学之外）的一大挑战……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 上下文图像攻击：视觉上下文如何暴露多模态安全漏洞

虽然 Multimodal Large Language Models (MLLMs) 展现出卓越的能力，但它们的安全对齐容易受到 jailbreak 攻击。现有的攻击方法...

#research #paper #ai #nlp #computer-vision
5个月前 · ai · - · -

[Paper] BEVDilation：LiDAR中心的多模态融合用于3D目标检测

在鸟瞰视图（BEV）表示中融合 LiDAR 和 camera 信息已证明其在 3D object detection 中的有效性。然而，因为...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 灵活的引力波参数估计与 Transformers

引力波数据分析依赖于准确且高效的方法，从噪声探测器信号中提取物理信息，然而不断增长的速率……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 剪枝 AMR：通过权重矩阵分析实现隐式神经表示的高效可视化

隐式神经表示（INR）是一种近似时空函数的神经网络。许多内存密集型的可视化任务，包括…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Lumos：让语言模型系统认证成为可能

我们推出了首个原则化框架 Lumos，用于指定和正式认证语言模型系统（LMS）的行为。Lumos 是一种命令式概率……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 轻量级实时低光增强网络用于嵌入式汽车视觉系统

在低光环境下，如夜间驾驶，图像退化严重挑战 in-vehicle camera 的安全性。由于现有的 enhancement algorithms 通常……

#research #paper #ai #computer-vision
5个月前 · software · - · -

[Paper] 软件的进化生态学：约束、创新与 AI 颠覆

本章探讨软件的进化生态学，重点关注软件与创新之间的共生关系。一个 … 之间的相互作用。

#research #paper #software
5个月前 · ai · - · -

[Paper] Layout Anything：一种用于通用房间布局估计的 Transformer

我们提出 Layout Anything，一个基于 transformer 的室内布局估计框架，它将 OneFormer 的通用分割架构适配到几何…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 无机合成反应的表示与预测：图形框架与数据集

虽然机器学习已经实现了对具有新颖属性的无机材料的快速预测，但如何合成这些材料的挑战仍然存在。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 使用 VideoScience-Bench 对视频生成的科学理解与推理进行基准测试

视频生成的下一个前沿是开发能够进行 zero-shot 推理的模型，其中对 real-world scientific laws 的理解至关重要，以实现……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[论文] EGGS：可交换的 2D/3D Gaussian Splatting 用于几何‑外观平衡的新视角合成

新视角合成（NVS）在计算机视觉和图形学中至关重要，广泛应用于增强现实（AR）、虚拟现实（VR）和自动驾驶。虽然3D Gaussian Splatting（3D...）

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[论文] 针对自相关数据的快速高斯过程近似

本文关注的是如何加速在自相关数据上训练的 Gaussian process 模型的计算问题。Gaussian process 模型 i...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] AutoNeural：协同设计视觉语言模型用于 NPU 推理

虽然神经处理单元（NPUs）为边缘AI提供了高理论效率，但针对GPU定制的最先进视觉语言模型（VLMs）常常出现不足……

#research #paper #ai #nlp
5个月前 · software · - · -

[Paper] Belobog：Move 语言模糊测试框架用于真实世界的智能合约

Move 是一种面向研究的编程语言设计，旨在实现安全且可验证的智能合约开发，并已广泛用于管理数十亿美元的…

#research #paper #software
5个月前 · ai · - · -

[Paper] Martingale Score：一种用于大语言模型推理中贝叶斯理性的无监督度量

最近在推理技术方面的进展显著提升了大型语言模型（LLMs）的性能，提升了人们对它们在…的能力的期望。

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 基于模型的诊断与多重观测：面向 C 软件和布尔电路的统一方法

调试是软件开发和电路设计中最耗时、最昂贵的任务之一。几种基于公式的故障定位（FBFL）方法……

#research #paper #ai #machine-learning

Newer posts

Older posts