【论文】在 Top-n Whitening 下的在线 ICA 的 Reservoir Subspace Injection
储层扩展可以在非线性混合下提升在线独立成分分析(ICA)的效果,但 top‑n 白化可能会丢弃注入的特征。我们正式…
3122 posts from this source
储层扩展可以在非线性混合下提升在线独立成分分析(ICA)的效果,但 top‑n 白化可能会丢弃注入的特征。我们正式…
Claude 代理技能的快速激增提出了一个核心问题:如何有效利用、管理和扩展代理技能生态系统。
基于指令的视频编辑取得了快速进展,但现有方法常常在精确的视觉控制方面遇到困难,因为自然语言本质上是……
低位注意力(如 SageAttention)已成为加速模型推理的有效方法,但其在训练中的适用性仍然较差……
检索增强生成(Retrieval‑Augmented Generation,RAG)系统通常采用检索融合技术,例如多查询检索和倒数排名融合(reciprocal rank fusion,RRF)来增加……
从与犯罪相关的文档中提取关键信息是执法机构的一项关键任务。命名实体识别 (NER) 可以执行……
强化学习与可验证奖励(RLVR)通过对大型语言模型(LLMs)进行优化,显著提升了它们的推理能力……
Scaling laws 假设在更多数据上训练的更大模型始终优于较小的模型——这一假设驱动了计算机视觉中的模型选择,但……
大型语言模型(LLMs)正日益被提出作为战略决策环境中的代理,但它们在结构化的地缘政治模拟中的行为仍然……
现代语言模型在有界上下文中进行推理,这一固有约束对长期推理构成了根本障碍。我们识别 recursion a...
Think-Answer 推理器(如 DeepSeek‑R1)通过利用可解释的内部推理取得了显著进展。然而,尽管经常出现……
多模态检索是将跨异构模态的查询信息聚合,以检索所需目标的任务。最先进的多模态……
大语言模型和多模态基础模型的快速采用使得多模态数据准备管道成为关键的 AI 基础设施。这些 pi...
我们考虑一个由 n 个参与方组成的异步网络,这些参与方通过安全信道相互连接,其中至多 t 个是拜占庭的。我们研究 common coin tossing,一种…
云原生系统的动态性和复杂性为根本原因分析(Root Cause Analysis,RCA)带来了重大挑战。虽然基于因果关系的RCA方法已经显示出……
访问前沿的大型语言模型(LLMs),例如 GPT-5 和 Gemini-2.5,通常受到高昂的价格、支付壁垒和地区限制的阻碍。T...
我们在整个时间范围内统一地、以高概率量化两层神经网络在随机梯度训练下的预测之间的差异。
训练工具使用代理通常依赖于基于结果的过滤:对成功轨迹进行监督微调(Supervised Fine-Tuning,SFT)和对…进行强化学习(Reinforcement Learning,RL)。
我们推出了 Legal RAG Bench,这是一套用于评估法律 RAG 系统端到端性能的基准和评估方法论。作为基准,Legal RAG Bench…
虽然密集的生物医学嵌入实现了强大的性能,但其黑箱特性限制了其在临床决策中的实用性。最近基于问题的 int...
共享的 L1 内存集群,由简化指令处理器(处理单元 - PEs)组成,通常用作现代大规模并行计算的构建块。
现代软件在很大程度上依赖 third-party software libraries 来简化开发过程。将一个库替换为类似的对应库的行为……
学术会议的 carbon footprint 正在成为日益受到争论的话题。重要的是要考虑参加会议所获得的收益是否值得……
这是《The Semantic Arrow of Time》五篇论文中的第一篇。论证以一个主张开始:computing's arrow of time 是语义性的,而非热力学的……