[Paper] PIM-SHERPA:通过解决 PIM 内存属性和布局不一致性实现设备端 LLM 推理的软件方法
在移动和边缘平台上,大语言模型(LLMs)的本地部署正迅速普及。LLM 推理是一个计算密集型的过程……
3122 posts from this source
在移动和边缘平台上,大语言模型(LLMs)的本地部署正迅速普及。LLM 推理是一个计算密集型的过程……
Diffusion models 通过噪声降解图像,逆转该过程揭示了跨时间步的信息层次结构。Scale-space theory 展示了类似……
最近在时间序列预测方面的进展日益依赖于预训练的 foundation‑style 模型。虽然这些模型常常声称具有广泛的泛化能力,但存在…
大型语言模型正日益用于金融分析和投资研究,但对其金融推理能力的系统性评估……
自回归(AR)扩散提供了一种有前景的框架,用于生成理论上无限长度的视频。然而,一个主要挑战是保持…
我们能否为 ML 模型训练找到一种网络架构,以优化 Split Federated Learning(SFL)中的训练损失(从而提升准确率)?以及这是否能够…
我们引入结构因果瓶颈模型(SCBMs),这是一类新颖的结构因果模型。SCBMs 的核心假设是因果效应……
最大边际似然估计(MMLE)可以表述为自由能泛函的优化。从这个视角来看,期望最大化(EM)……
我们解决了一个具有挑战性的任务:从混合音频流中为两个交互的、同处的参与者生成完整的3D面部动画。虽然现有的……
最近在3D Gaussian Splatting(3DGS)方面的进展已经将重点转向在重建保真度与计算效率之间取得平衡。在本工作中,...
无监督强化学习(Unsupervised reinforcement learning)与可验证奖励(verifiable rewards)相结合的 URLVR 为通过推导奖励来突破监督瓶颈、扩展大语言模型(LLM)训练提供了一条路径。
我们推出 OfficeQA Pro,这是一项用于评估 AI 代理在大型且异构的文档语料库上进行基于事实的多文档推理的基准。该语料库...
近期在统一多模态模型(UMMs)方面的进展显著推动了文本到图像(T2I)生成,尤其是通过整合 Chai……
无模板的可动画头部化身可以通过直接从被摄对象的捕获中学习表情依赖的面部变形,实现高视觉保真度,av...
AI agents 在过去一年里在 software engineering 方面变得出乎意料地熟练,主要归功于 reasoning capabilities 的提升。这引发了一个 d...
确保开放世界视觉识别的可信度需要模型具备可解释性、公平性,并且对分布转移具有鲁棒性。然而,现代视觉系统...
流媒体视频理解通常涉及时间敏感的场景,模型需要精确回答支持的视觉证据出现的时间:回答…
large language models 在 code generation 中的应用已经从 one-shot generation 演变为 iterative refinement,然而安全性的演变仍然……
大型语言模型(LLMs)能够流利地回答宗教知识查询,但它们经常出现 hallucinate 并 misattribute sources,这尤其导致……
选择优化算法需要在不同问题实例上比较候选者,但部署时的计算预算往往在基准测试时未知。
本报告记录了我们小组(名为 SymBa)在哥本哈根举行的 ALICE 2026 研讨会上的工作。受 Nils Aall Barricelli 在 s… 的开创性工作启发。
注意力机制的二次复杂度以及 Key-Value (KV) 缓存的大量内存占用导致了严重的计算和内存挑战。
理解结构化序列信息如何在神经系统中被表示和概括,是建模从声学输入到……的转变的关键。
在重症监护病房(ICUs)中,实现准确且可解释的死亡风险预测仍然是一个关键挑战,因为电子健康记录的时间结构不规则。