Source

arXiv

4654 posts from this source

排序:

2个月前 · ai · - · -

[Paper] 递归思考-回答过程

Think-Answer 推理器（如 DeepSeek‑R1）通过利用可解释的内部推理取得了显著进展。然而，尽管经常出现……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] OmniRet：高效且高保真全模态检索

多模态检索是将跨异构模态的查询信息聚合，以检索所需目标的任务。最先进的多模态……

#research #paper #ai #nlp #computer-vision
2个月前 · devops · - · -

[Paper] Trident：用于异构多模态数据流水线的自适应调度

大语言模型和多模态基础模型的快速采用使得多模态数据准备管道成为关键的 AI 基础设施。这些 pi...

#research #paper #devops
2个月前 · devops · - · -

[Paper] Subcubic 异步硬币投掷（无设置）

我们考虑一个由 n 个参与方组成的异步网络，这些参与方通过安全信道相互连接，其中至多 t 个是拜占庭的。我们研究 common coin tossing，一种…

#research #paper #devops
2个月前 · software · - · -

[Paper] MetaRCA：一种面向云原生系统的可通用根因分析框架，基于元因果知识

云原生系统的动态性和复杂性为根本原因分析（Root Cause Analysis，RCA）带来了重大挑战。虽然基于因果关系的RCA方法已经显示出……

#research #paper #software
2个月前 · ai · - · -

[Paper] 真实金钱，虚假模型：Shadow APIs 中的欺骗性模型声明

访问前沿的大型语言模型（LLMs），例如 GPT-5 和 Gemini-2.5，通常受到高昂的价格、支付壁垒和地区限制的阻碍。T...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 通过传输不等式实现两层神经网络的时间均匀浓度

我们在整个时间范围内统一地、以高概率量化两层神经网络在随机梯度训练下的预测之间的差异。

#research #paper #ai
2个月前 · ai · - · -

[Paper] TopoCurate：建模交互拓扑用于工具使用代理训练

训练工具使用代理通常依赖于基于结果的过滤：对成功轨迹进行监督微调（Supervised Fine-Tuning，SFT）和对…进行强化学习（Reinforcement Learning，RL）。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] Legal RAG Bench：面向法律 RAG 的端到端基准

我们推出了 Legal RAG Bench，这是一套用于评估法律 RAG 系统端到端性能的基准和评估方法论。作为基准，Legal RAG Bench…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 为低资源语言构建强大的 Instruction Language Model

大型语言模型（LLMs）已成为自然语言处理和整体人工智能的关键工具。目前的开源模型……

#language models #multilingual NLP #instruction tuning #open-source AI #low-resource languages
2个月前 · ai · - · -

[Paper] QIME：通过本体驱动的问题构建可解释的医学文本嵌入

虽然密集的生物医学嵌入实现了强大的性能，但其黑箱特性限制了其在临床决策中的实用性。最近基于问题的 int...

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] TeraPool：一种物理设计感知的、1024 RISC‑V 核共享 L1 内存的可扩展集群设计，具备高带宽主存链接

共享的 L1 内存集群，由简化指令处理器（处理单元 - PEs）组成，通常用作现代大规模并行计算的构建块。

#research #paper #devops
2个月前 · software · - · -

[Paper] MigMate：用于基于LLM的Python项目库迁移的VS Code扩展

现代软件在很大程度上依赖 third-party software libraries 来简化开发过程。将一个库替换为类似的对应库的行为……

#research #paper #software
2个月前 · software · - · -

[Paper] ICSE 2022 可持续性报告

学术会议的 carbon footprint 正在成为日益受到争论的话题。重要的是要考虑参加会议所获得的收益是否值得……

#research #paper #software
2个月前 · devops · - · -

[Paper] 时间的语义之箭，第I部分：从Eddington到Ethernet

这是《The Semantic Arrow of Time》五篇论文中的第一篇。论证以一个主张开始：computing's arrow of time 是语义性的，而非热力学的……

#research #paper #devops
2个月前 · devops · - · -

[Paper] 无时间方向的消息传递：约束语义与FITO类别错误

Message passing 被广泛认为是分布式系统的基本原语。本文认为传统的消息系统嵌入了一个类别误…

#research #paper #devops
2个月前 · ai · - · -

[Paper] Quasar：量化自投机加速通过内存高效验证实现快速推理

Speculative Decoding (SD) 已成为加速大型语言模型（LLM）推理的首选技术，通过将 token 生成解耦为快速 dra...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] PARWiS：在紧张预算下使用主动成对比较进行胜者判定

在受限预算下，通过主动成对比较在一组项目中确定胜者是偏好学习中的一个具有挑战性的问题。The go...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 奖励调制的局部学习在脉冲编码器中的应用：使用STDP和混合速率读出的受控基准

本文呈现了一项受生物学启发的局部学习在手写数字识别中的受控实证研究。我们评估了一种受STDP启发的竞争性……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] UFO-4D：无姿态前馈式四维重建（基于两张图像）

从未标定的图像进行密集的4D重建仍然是一个关键挑战，现有方法依赖于缓慢的test-time优化或碎片化的、task-specific……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Mode Seeking 与 Mean Seeking 相结合，实现快速长视频生成

将 video generation 从秒级扩展到分钟级面临一个关键瓶颈：虽然 short‑video 数据丰富且 high‑fidelity，但 coherent long‑form 数据却是……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] LLM 能从自己的话语中受益吗？

多轮交互与大型语言模型通常会在对话历史中保留助手自身的过去回复。在本工作中，我们重新审视……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 驯服动量：通过低秩近似重新思考优化器状态

现代优化器如 Adam 和 Muon 在训练大语言模型中起着核心作用，但它们对一阶和二阶动量的依赖会引入显著的……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[论文] 记忆缓存：RNNs with 增长记忆

Transformer 已被确立为最近序列建模进展的事实标准骨干，主要是因为它们不断增长的记忆容量能够扩展……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 谁守护守护者？评估已学习表征可辨识性的挑战

可辨识性在表征学习中通常使用标准指标（例如 MCC、DCI、R^2）在具有已知真实因子的合成基准上进行评估。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 用于自动评估帮助读者进行新闻可信度评估的辅助RAG系统的资源

许多读者如今在评估在线新闻的可信度时感到困难，因为可靠的报道与错误信息并存。TREC 2025 DRAGUN（Detectio...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 分层动作学习用于弱监督动作分割

人类通过关键转变来感知动作，这些转变在多个抽象层次上结构化动作，而机器则依赖视觉特征，往往……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 高效发现近似因果抽象 via Neural Mechanism Sparsification

神经网络被假设实现可解释的因果机制，但验证这一点需要找到因果抽象——一种更简单的、高层次的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 联合几何与轨迹一致性学习用于一步真实世界超分辨率

基于扩散的真实世界图像超分辨率（Real-ISR）在感知质量上表现出色，但由于迭代采样导致的高计算成本而受到限制。

#research #paper #ai #computer-vision
2个月前 · devops · - · -

[Paper] nvidia-pcm：一种基于 D-Bus 的平台配置管理器，适用于 OpenBMC 环境

GPU 加速的服务器平台虽然共享大部分硬件架构，但由于细微的硬件差异——不同…

#research #paper #devops
2个月前 · ai · - · -

[Paper] SafeGen-LLM：提升机器人系统任务规划中的安全泛化

在机器人系统中，安全关键任务规划仍然具有挑战性：传统规划器在可扩展性方面表现不佳，基于强化学习（Reinforcement Learning，RL）的方法……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] MuViT：多分辨率 Vision Transformers 在显微镜中的跨尺度学习

现代显微镜常规产生千兆像素图像，包含跨多个空间尺度的结构，从细胞形态的细微特征到更广阔的组织或……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] SenCache：通过敏感度感知缓存加速扩散模型推理

Diffusion models 实现了 state-of-the-art 视频生成质量，但由于需要大量的 sequential denoising steps，inference 仍然非常昂贵……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 多模态大语言模型的不确定性量化与不一致性校正语义体积

尽管具备强大能力，Multimodal Large Language Models（MLLMs）仍可能产生看似合理却错误的输出，阻碍可靠部署。准确的……

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[Paper] MT-PingEval：评估多轮协作中的私有信息游戏

我们提出了一种可扩展的方法论，用于在多轮交互中评估语言模型，使用一套需要有效沟通的协作游戏……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 任务导向的小语言模型加速

小型语言模型（SLMs）已成为针对特定任务的高效替代方案，取代大型语言模型。然而，它们常常被用于...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] AgenticOCR：仅解析所需内容以实现高效检索增强生成

检索增强生成（RAG）向多模态领域的扩展加剧了处理复杂视觉文档的挑战，例如 fin...

#OCR #retrieval-augmented generation #multimodal AI #document understanding #efficient inference
2个月前 · software · - · -

[Paper] LeGend：用于硬件模型检查中引理生成的数据驱动框架

RTL 设计的属性检查是形式验证中的核心任务。在可用的引擎中，IC3/PDR 是一种被广泛使用的骨干，其性能至关重要。

#research #paper #software
2个月前 · software · - · -

[Paper] SAP HANA 环境中的 Flaky Tests 词汇

背景。Automated test execution 是收集软件项目质量信息的重要活动。然而，所谓的 flaky tests …

#research #paper #software
2个月前 · ai · - · -

[Paper] 绿色还是快速？学习在 Serverless Computing 中平衡 Cold Starts 与 Idle Carbon

Serverless computing 简化了云部署，但在管理服务延迟和碳排放方面带来了新的挑战。降低 cold-start latency 需要……

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 异步多方会话类型中的混合选择

我们提出了一个具有异步混合选择（MC）的多方会话类型（MST）框架。我们为 MC 提出了一个核心构造，允许瞬时不一致……

#research #paper #devops
2个月前 · software · - · -

[论文] 不变式驱动的自动化测试

Microservice architectures 是一种新兴技术，它将业务逻辑构建为一套小型服务。每个 microservice 在其自己的进程中运行，并且 c...

#research #paper #software
2个月前 · software · - · -

[Paper] 初级开发者在 Vibe Coding 时为项目维护者带来更大的审查开销

AI 编码代理让软件开发人员能够快速生成代码，这引发了项目经理和开源维护者的一个实际问题：能否 vib...

#research #paper #software
2个月前 · ai · - · -

[Paper] SWE-rebench V2：大规模语言无关 SWE 任务集合

软件工程代理（SWE）正在快速提升，近期的进展主要得益于强化学习（RL）。然而，RL 训练受到……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] MPU：面向安全且隐私保护的大型语言模型的知识遗忘

对于大型语言模型的机器忘记（Machine unlearning）常常面临隐私困境，即严格的约束禁止共享服务器的参数或客户端的…

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] Hestia：面向云微服务的超线程级调度与干扰感知注意力

现代云服务器经常将多个对延迟敏感的微服务实例共同放置，以提高资源利用率。然而，微服务的多样性…

#research #paper #devops
2个月前 · software · - · -

[Paper] 剥开茧：揭示用于变异式灰盒模糊测试的被抑制黄金种子

PoCo 是一种技术，旨在通过逐步移除障碍条件状态来增强现代基于覆盖的种子选择（CSS）技术（如 afl‑cmin）。

#research #paper #software
2个月前 · devops · - · -

[Paper] QoSFlow：确保分布式工作流的服务质量，使用可解释的敏感性模型

随着分布式科学工作流的重要性日益提升，确保 Quality of Service (QoS) 约束（例如最小化……）的需求变得至关重要。

#research #paper #devops

Newer posts

Older posts